Stanford-CS-234-RL-2022

Solutions to the Stanford CS:234 Reinforcement Learning 2022 course assignments.

Course website: https://web.stanford.edu/class/cs234/

Assignment 1

Frozen Lake Markov Decision Process using Value Iteration and Policy Iterasion

Policy Iteration	Value Iteration

Assignment 2

Tabular Q Learning and Deep Q Learning

Learning Curve on the test environment:

Assignment 3

Policy Gradient Methods and REINFORCE

Learning Curve of the REINFORCE algorithm on CartPole-v0:

Assignment 4

Aplication of Bandit Algorithms in the medical setting

Comparison of different Bandit Algorithms:

Assignment 5

Aplication of Upper Confidence Bandit in personalized Recomendation Systems

Comparison of different arm update strategies:

Name	Name	Last commit message	Last commit date
Latest commit History 19 Commits
Assignment 1	Assignment 1
Assignment 2	Assignment 2
Assignment 3	Assignment 3
Assignment 4	Assignment 4
Assignment 5	Assignment 5
.gitignore	.gitignore
LICENSE	LICENSE
README.md	README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Stanford-CS-234-RL-2022

Assignment 1

Assignment 2

Assignment 3

Assignment 4

Assignment 5

About

Uh oh!

Releases

Packages

Languages

Search code, repositories, users, issues, pull requests...

License

NickKaparinos/Stanford-CS-234-RL-2022

Folders and files

Latest commit

History

Repository files navigation

Stanford-CS-234-RL-2022

Assignment 1

Assignment 2

Assignment 3

Assignment 4

Assignment 5

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages