ChatWhole Learn

← Back to Data Science

All Topics

Advertisement

Learn/Data Science/Machine Learning

Exploration Strategies in RL

Topic: Exploration

Advertisement

Methods for Exploration

Balance exploration/exploitation.

Epsilon-Greedy

Random action with epsilon.

UCB

Upper confidence bound. Optimism in face of uncertainty.

Boltzmann

Softmax over Q-values.

Key Takeaways

Epsilon-greedy baseline
UCB for balanced exploration
Boltzmann exploration

Advertisement

← Curiosity Driven Exploration Entropy Methods Rl →

Advertisement

Need More Practice?

Get personalized data science help from ChatWhole's AI-powered platform.

Get Expert Help →