強化学習若手の会は、「若手研究者や技術者が強化学習に対する理解を互いに深め合い、助け合うこと」を暫定的な目的として設立された会です。 今後の活躍にご期待ください。
発表者(敬称略) | 概要 | 資料 |
---|---|---|
清原明加 | オフライン強化学習 | こちら |
品川政太朗 | 言語生成の強化学習 | こちら |
尾崎安範 | POMDPの基礎と応用 | こちら |
回 | 発表者(敬称略) | 概要 | 資料 |
---|---|---|---|
第一回 | 金川裕司 | 模倣学習と逆強化学習 | こちら |
第二回 | 北村俊徳 | f-divergence最小化で学ぶGAIL | こちら |
発表者(敬称略) | タイトル | 資料 |
---|---|---|
尾崎安範 | Decision Transformer | こちら |
章 | 発表者(敬称略) | 概要 | 資料 |
---|---|---|---|
第1章 | 尾崎安範 | イントロダクション | こちら |
第2章 | 五木田和也 | マルチアームバンディット | こちら |
第3章 | kiyo | 有限マルコフ決定過程 | こちら |
第4章 | 山下修平 | 動的計画法 | こちら |
ozaki.yasunori (at) outlook.com ( (at) を@に置き換えてください)