External Memory

プログラミング周辺知識の備忘録メイン

強化学習

deep Q-Networks(2)

前回のdeep Q-learningの続き Deep Q-Networks (DQN) - External Memorydeep Q-Networks(DQN)によりenvironmentに依存せず、最適Q値を近似することが可能である。DQNは状態(今回は画像)を入力すると、actionごとのQ値を出力する。 environmentとして、かな…

Deep Q-Networks (DQN)

強化学習は普通の深層学習より学習が能動的という意味でAlっぽいので面白そうではある。以下の有名そうな論文を読んで勉強のためのとっかかりとした。Playing Atari with Deep Reinforcement Learning https://arxiv.org/pdf/1312.5602.pdf強化学習の全体像…