差分

このページの2つのバージョン間の差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
r:mdptoolbox [2018/12/16 16:34]
watalu [価値反復法]
r:mdptoolbox [2018/12/16 16:34] (現在)
watalu [方策反復法]
行 87: 行 87:
  
 === 方策反復法 === === 方策反復法 ===
 +
 +マルコフ決定過程の最適方策を方策反復によって求めるには、次の一行を実行すればよい。
  
 <code> <code>