论文信息 - 確率的2分木の行動選択を用いたActor-Criticアルゴリズム:多数の行動を扱う強化学習 - 字舞流文

確率的2分木の行動選択を用いたActor-Criticアルゴリズム:多数の行動を扱う強化学習

木村元 | 小林重信