gitextract_onbbhi0g/ ├── LICENSE ├── README.md ├── assignment1/ │ ├── Makefile │ ├── collect_submission.sh │ ├── lake_envs.py │ ├── log │ ├── model_based_learning.py │ ├── model_free_learning.py │ ├── requirements.txt │ └── vi_and_pi.py ├── assignment2/ │ ├── .gitignore │ ├── Makefile │ ├── README.md │ ├── collect_submission.sh │ ├── configs/ │ │ ├── __init__.py │ │ ├── frozen_lake.py │ │ ├── q2_linear.py │ │ ├── q3_nature.py │ │ ├── q4_train_atari_linear.py │ │ ├── q5_train_atari_nature.py │ │ ├── q6_bonus_question.py │ │ └── test.py │ ├── core/ │ │ ├── __init__.py │ │ ├── deep_q_learning.py │ │ └── q_learning.py │ ├── q1_schedule.py │ ├── q2_linear.py │ ├── q3_nature.py │ ├── q4_train_atari_linear.py │ ├── q5_train_atari_nature.py │ ├── q6_double_q_learning.py │ ├── q6_dueling.py │ ├── requirements.txt │ ├── results/ │ │ ├── q2_linear/ │ │ │ ├── events.out.tfevents.1511874609.zengliang-PU551LD │ │ │ ├── log.txt │ │ │ └── model.weights/ │ │ │ ├── .data-00000-of-00001 │ │ │ ├── .index │ │ │ ├── .meta │ │ │ └── checkpoint │ │ ├── q3_nature/ │ │ │ ├── events.out.tfevents.1511876195.zengliang-PU551LD │ │ │ ├── log.txt │ │ │ └── model.weights/ │ │ │ ├── .index │ │ │ ├── .meta │ │ │ └── checkpoint │ │ └── q4_train_atari_linear/ │ │ ├── log.txt │ │ ├── model.weights/ │ │ │ ├── .data-00000-of-00001 │ │ │ ├── .index │ │ │ ├── .meta │ │ │ └── checkpoint │ │ └── monitor/ │ │ ├── openaigym.episode_batch.0.2799.stats.json │ │ ├── openaigym.episode_batch.0.3758.stats.json │ │ ├── openaigym.episode_batch.0.5469.stats.json │ │ ├── openaigym.manifest.0.2799.manifest.json │ │ ├── openaigym.manifest.0.3758.manifest.json │ │ ├── openaigym.manifest.0.5469.manifest.json │ │ ├── openaigym.video.0.2799.video000000.meta.json │ │ ├── openaigym.video.0.3758.video000000.meta.json │ │ └── openaigym.video.0.5469.video000000.meta.json │ └── utils/ │ ├── __init__.py │ ├── general.py │ ├── preprocess.py │ ├── replay_buffer.py │ ├── test_env.py │ ├── viewer.py │ └── wrappers.py └── assignment3/ ├── discrete_env.py ├── frozen_lake.py ├── q1.py ├── q2.py ├── q3.py ├── requirements.txt └── utils.py