強化学習若手の会は、「若手研究者や技術者が強化学習に対する理解を互いに深め合い、助け合うこと」を暫定的な目的として設立された会です。 今後の活躍にご期待ください。
Sutton氏らが書いた『Reinforcement Leraning: An Intoroduction』(以下、Sutton本)は昔から強化学習の教科書的存在として、強化学習の初歩を学ぶために使われてきました。 最近、深層強化学習の流れをうけ、改定されました。改定された版は無料でこちらにて公開されています。
強化学習若手の会ではSutton本輪読会を開催しています。 Sutton本はいまだに日本語訳がなく、強化学習若手の会では、初学者のために要約した内容をSutton氏本人の了解のもと発表や公開しています。 興味のある方はぜひ発表したり参加したりしてください。
章 | 発表者(敬称略) | 概要 | 資料 |
---|---|---|---|
第1章 | 尾崎安範 | イントロダクション | こちら |
第2章 | 五木田和也 | マルチアームバンディット | こちら |
第3章 | kiyo | 有限マルコフ決定過程 | こちら |
第4章 | 山下修平 | 動的計画法 | こちら |
第5章 | kiyo | モンテカルロ法 | こちら |
ozaki.yasunori (at) outlook.com ( (at) を@に置き換えてください)