今年2月時点のモリカトロンAIラボの記事で、テック系フリーライターの吉本幸記(X)が、「世界モデル」について伝えている(モリカトロンAIラボ)。この記事は、Minecraftをプレイさせダイヤモンド(ゲーム内の素材)を採掘させることに成功したAI:DreamerV3について伝えるものだ。さて、学習データなしという新式のAIが、なぜにそういったことを可能にしたのだろうか?キーとなる言葉が前述した「世界モデル」アーキテクトだ。
そもそも、この吉本の記事は2023年1月10日にリリースされたDeepMind(Google管理会社の子会社)の論文を底本にしている。論文はarxivにて発表されたもの(arxiv)。当該論文は学習データに依らず、学習環境にも左右されないAI:DreamerV3に関するもので、「世界モデル」という新しい枠組み・アーキテクトについて論じたものだ。吉本によると、論文は「世界モデル」+「強化学習」について述べているものらしいが、この中でも注目すべきなのが前者「世界モデル」である、と同氏は伝えている。
この「世界モデル」とは、従来、AI成立のため前提として必須だった学習データそのものを、環境観測から得てしまう新式のAIの基盤となる技術のことを総称して言う…と松尾研は伝えている(松尾研)。前述の記者吉本の同記事でもこれと同じことが述べられている。従来のAIは環境が変れば、その環境変化に適用できないレベルにあった。だが、AIが自ら既存のデータから観測を行い、その観測データをもとに自身を運用できれば、話は変わってくる…これが昨今AI界隈を揺るがす新しいアーキテクトである「世界モデル」の本質である。これを吉本は「環境予測」という言葉を使って記事内で伝えている。
開発されたAI:DreamerV3などの「世界モデル」型AIは、膨大なデータを前提としなくても成立し、その代わりに”推論”によって行動する世界の把握が大局的に行えるため、従来からのAIとは違う新しいAIのためのブレイクスルーになるポテンシャルがある、という。そのため、世界中のAI研究界隈から注目されている形のAIだ、という。つまり、人間にとっては「常識」とされる世界の把握・観察に値する点をAI自身に担わせようとする技術が、まさに「世界モデル」に該当するわけだ。
手前味噌で恐縮だが、ゲヲログも従来から大量の学習データを必要としなくても、各個個別の特徴ある少量のデータ(SD)を基盤として、株価予測ができないか?と研究を計画している(ゲヲログ2.0)。昨今注目を浴びている「世界モデル」…とまではいかなくとも、目指すところは実は同じである。人間とAIがある程度協調し、またそうした協調がなくとも、まるであたかも人間のように振舞えるAI開発を目的としている点では、目指す成果は同じなのだ。今後も、未来の推論型AI実現のためのキーファクターとなりえる「世界モデル」から目が離せない。
※本記事は研究目的に使うため、コピーレフト方針の除外対象になります。