Srgreen
/

ppo-LunarLander-v2-complete

Reinforcement Learning

deep-reinforcement-learning

custom-implementation

Eval Results (legacy)

Model card Files Files and versions

PPO Agent — LunarLander-v3

trained by zero with PPO in CleanRL. No optmized parameters

Resultado

medium reward (10 ep): 195.99 +/- 72.84

Downloads last month: -; Downloads are not tracked for this model. How to track

Video Preview

Reinforcement Learning

loading

Evaluation results

mean_reward on LunarLander-v3
self-reported

195.99 +/- 72.84