次世代のAIアルゴリズム「世界モデル」とは何か？

評論

2023.11.01

今年2月時点のモリカトロンAIラボの記事で、テック系フリーライターの吉本幸記（X）が、「世界モデル」について伝えている（モリカトロンAIラボ）。この記事は、Minecraftをプレイさせダイヤモンド（ゲーム内の素材）を採掘させることに成功したAI：DreamerV3について伝えるものだ。さて、学習データなしという新式のAIが、なぜにそういったことを可能にしたのだろうか？キーとなる言葉が前述した「世界モデル」アーキテクトだ。

そもそも、この吉本の記事は2023年1月10日にリリースされたDeepMind（Google管理会社の子会社）の論文を底本にしている。論文はarxivにて発表されたもの（arxiv）。当該論文は学習データに依らず、学習環境にも左右されないAI：DreamerV3に関するもので、「世界モデル」という新しい枠組み・アーキテクトについて論じたものだ。吉本によると、論文は「世界モデル」+「強化学習」について述べているものらしいが、この中でも注目すべきなのが前者「世界モデル」である、と同氏は伝えている。

この「世界モデル」とは、従来、AI成立のため前提として必須だった学習データそのものを、環境観測から得てしまう新式のAIの基盤となる技術のことを総称して言う…と松尾研は伝えている（松尾研）。前述の記者吉本の同記事でもこれと同じことが述べられている。従来のAIは環境が変れば、その環境変化に適用できないレベルにあった。だが、AIが自ら既存のデータから観測を行い、その観測データをもとに自身を運用できれば、話は変わってくる…これが昨今AI界隈を揺るがす新しいアーキテクトである「世界モデル」の本質である。これを吉本は「環境予測」という言葉を使って記事内で伝えている。

開発されたAI：DreamerV3などの「世界モデル」型AIは、膨大なデータを前提としなくても成立し、その代わりに”推論”によって行動する世界の把握が大局的に行えるため、従来からのAIとは違う新しいAIのためのブレイクスルーになるポテンシャルがある、という。そのため、世界中のAI研究界隈から注目されている形のAIだ、という。つまり、人間にとっては「常識」とされる世界の把握・観察に値する点をAI自身に担わせようとする技術が、まさに「世界モデル」に該当するわけだ。

手前味噌で恐縮だが、ゲヲログも従来から大量の学習データを必要としなくても、各個個別の特徴ある少量のデータ（SD）を基盤として、株価予測ができないか？と研究を計画している（ゲヲログ2.0）。昨今注目を浴びている「世界モデル」…とまではいかなくとも、目指すところは実は同じである。人間とAIがある程度協調し、またそうした協調がなくとも、まるであたかも人間のように振舞えるAI開発を目的としている点では、目指す成果は同じなのだ。今後も、未来の推論型AI実現のためのキーファクターとなりえる「世界モデル」から目が離せない。

※本記事は研究目的に使うため、コピーレフト方針の除外対象になります。