自分の趣味は将棋なのですが、GoogleのDeepmindが発表したAlphaZeroの棋譜を見て、自分でも試してみたいと思ったのがきっかけ。強化学習は詳しくないし、いきなりDQN(Deep Q-Network)とかよくわからないのでとりあえずQ学習やってみましょうということでやっ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。