Estimation of Belief in Bayesian Game by Feedback Control

人や組織の意思決定過程をモデル化するゲーム理論は,ゲー ムの均衡解析やメカニズムデザインを与える知識体系であり, ゲームの形態に応じてさまざまな概念や計算法が提供されて いる.本稿で扱うベイジアンゲームは,囚人のジレンマなど で用いられる標準型ゲームの構成要素 (プレイヤ,行動,効用 値)に加え,確率的に行動を選択する混合戦略,効用値ごとに 対応付けられるタイプ,タイプ上の確率分布である信念で記 述され,意思決定の不確かさが扱える静的なゲームである . たとえば,Table 1 に示す 2 プレイヤ 2 行動 2 タイプのベ イジアンゲームでは,各プレイヤがある行動に対して 2つの 効用値をもつため,効用値の組み合わせにより 4つの標準型 ゲームが構成される.この場合,プレイヤは,相手の信念と混 合戦略を推測し,自身の効用値の期待値 (期待効用)を最大に する意思決定を行なうことを想定している.そして,このベ イジアンゲームの均衡解析とは,ある種の均衡を求めること であり,その均衡の 1つに,ベイジアンナッシュ (Bayesian Nash, BN)均衡がある . このようなベイジアンゲームに対する均衡解析では,信念 (または,事前共通確率)が所与として議論される .一方 で,BN均衡が所与とし,それに対応する信念を推定する問題