AI新生／stuart russell

問題提起：目的関数を与え，それを最大・最小化する知能研究の標準モデルでは「私たちが欲しいものではない」
提案：人間の目的を最大化する機械こそ有益．三つの原則を提案
1. 機械の唯一の目的は，人間の選好の実現を最大化すること
  - 目的は設計者によって与えられるものではない．設計者は，「最大化すること」を保証すべし
2. 初期状態の機械は，人間の選好について不確実
  - 謙虚さを与える．
3. 人間の選好に関する究極の情報源は，人間の振舞い
  - 真の選好を知ることはできないが，人間の選択と選好に関連はあるはず
感想
- まんまCIRL．しかし，それにとどまらず，機械学習の前提をひっくり返すべきだ，と主張
  - 「知能を再現する」学術的立場というより，工学的に有益なものを作る立場
  - その立場から，「人間の選好」と「選好についての不確実性」を扱うべきだという主張（目的関数自体が不確実）
- 公平性などの，功利主義へも言及．
  - 複数にした場合，人ごとの選好比較，その重みづけが問題だし，分かったところで，どう扱うのが妥当か？
  - 技術的問題というより，社会・文化的問題ではある
- MAIRLの重要性
  - 利他主義なのか？利己主義なのか？
  - 他人からの影響，他人への影響，を有用な形で扱えるか？
- 技術的課題：何となく分かっていたことに具体的言及と，その説得がまとまってる．凄い
  - 不確実性：選好自体，問題が難しいすぎることによる打ち切り，環境
  - 選択＝選好とは限らない
  - 時間によって更新（不確実性が減って選好が変わる），変更（何らかの作用で突然変わる）
  - 相互に作用するため，Robbyの動作がHの選好に影響．では，どう影響を与えるのが正しいか？
- 技術的課題
  - ダブルミーニングであることを認識すること
  - ダブルの不確実性を減らすための行動を生成できること
  - 「使用者」へ権限を「渡す」には何を提示して，選択させればよいのか？

moNo’s note

最近読んだ本，観た映画など，気ままにメモします．

AI新生／stuart russell