面白いデータを探して

適当に書く。間違えていたら教えてください。

2018-12-22から1日間の記事一覧

Q学習で迷路を解く

自分の趣味は将棋なのですが、GoogleのDeepmindが発表したAlphaZeroの棋譜を見て、自分でも試してみたいと思ったのがきっかけ。強化学習は詳しくないし、いきなりDQN(Deep Q-Network)とかよくわからないのでとりあえずQ学習やってみましょうということでやっ…