ga136(推論・知識処理・自然言語処理)まとめ (1) - らんだむな記憶の続き。
Week2
マルチエージェントシステム
- 人工知能の参考書
- Russel and P. Norvig: Artificial Intelligence: A Modern Approach (4th Edition)
- David Poole and Alan Mackworth: Artificial Intelligence: Foundations of Computational Agents, second edition
- 人工知能
- John McCarthy, 1956 年「the science and engineering of making intelligent machines」
- 知的に行動するプログラムとしての合理的エージェントの実現とその行動解析
- 知能
- 記憶, 整理, 予測, 協力による社会性
- エフェクタ/アクチュエータ ←認知・知覚— 環境
- エフェクタ/アクチュエータ —行為→ 環境
- 外界の環境に応じて自律的に合理的な行動を行う そういう実体
- 自律エージェント
- マルチエージェント
- 単独では実現が難しいサービスとか作業を行う。協調でする。あるいは共通の目標を持つようなもの
- 社会脳仮説
- 「ヒトの大脳皮質が極度に発達しているのは社会集団の中で生き抜く社会性を身につけるためである」という仮説
- テーマ: 非常に多様で相互に関連性がある
- エージェント間での基本的態度の決定
- 知的行動による相互作用の解明
- 合理性 (rationality)
- 「分かること」から予測できる最大限の成功を得ること
- 理想合理的エージェント (たぶんあり得ない)
- 可能な知覚列に対し、エージェントが持つ知識を使って最大の性能を引き出すことが可能な動作を選択するもの
- 限定合理性 (bounded rationality)
- 獲得できる情報は限界があり、処理能力も有限である。その意味では万能ではなく限界がある。
- 自律性と自律エージェント
調整とゲーム理論
- 「調整行動」に焦点をあてる
- 「相手の立場になってみる」ということ
- 同時に通れない幅の道を2人のロボットが通る場合
- ゲーム
- 利得行列 (payoff matrix)
- プレイヤの合理性
- 支配戦略 (dominant strategy)
- 支配戦略均衡
- 反復支配戦略
- 定和・零和ゲーム
- Nash均衡
- ミニマックス戦略
- 支配戦略が存在しない場合はどのような戦略があるか?ゼロサムゲームでは、最悪の状態は避けるという戦略がある。: $\max_i \min_j c_{ij}$
- 均衡点: $\max_i \min_j c_{ij} = \min_j \max_i c_{ij}$
- 一般には: $\max_i \min_j c_{ij} \leq \min_j \max_i c_{ij}$
- 混合戦略と純粋戦略
- 行為を確率的に選択する時混合戦略、どれか一つを選択し続ける戦略を純粋戦略
- 混合戦略におけるミニマックス戦略
- 混合戦略に拡大するとミニマックス戦略は常に均衡点が存在
- 微調整では均衡点 (安定点) にはたどり着けない (勾配降下法だけでは局所最適に容易に陥る)
- パレート最適性
- プレイヤ間で通信などにより協力して相互の利益を上げることができるとき、協力ゲームと呼ぶ。
- 状態 $x$ と $x^\prime$ について、全プレイヤが状態 $x^\prime$ より $x$ が同程度以上望ましいと考え、少なくとも一人は真に望ましいとしたときに、 $x$ は $x^\prime$ をパレート支配 (Pareto dominant) するという。さらに $x$ をパレート支配する状態がないとき、状態 $x$ をパレート最適 (Pareto optimum) という。
- 囚人のジレンマ
- Snowdrift ゲーム
- 相互作用の分類
- 協調的状況 (cooperative situation)
- 妥協的状況 (cimpromise situation)
- 競合的状況 (conflict situation)