AIモデル：素晴らしい能力だが、ビデオゲーム業界では不十分

AIツールが進化し続けるにつれ、複雑なタスクをAIに委任することが常に推奨されるようになっています。大規模な言語モデルはLLM) メールの作成、プレゼンテーションの作成、アプリケーションの設計、ビデオの作成、インターネットの検索と調査結果の要約など。しかし、私にとっていまだに本当に苦労していることの一つは、ビデオゲームです。

今年これまでに、AI 業界の最大手企業 2 社 (Microsoft と Anthropic) が、モデルを使ってゲームを作成したりプレイしたりしようと試みてきましたが、その結果はおそらく多くの人が予想するよりもはるかに限定的なものにとどまっています。これは、特に長期的な戦略的計画と複雑な意思決定を必要とするタスクにおける、生成 AI の現在の課題を浮き彫りにしています。

これにより、生成 AI が現在実際に何をしているかを完璧に実証できます。つまり、以前よりもはるかに多くのことができるようになりましたが、すべてを実行できるわけではありません。これは、生成 AI がまだ開発段階にあり、機能が向上しているにもかかわらず、一部の領域ではまだ限界に直面していることを反映しています。

マイクロソフトが人工知能を搭載したQuake IIを制作

ビデオゲームの制作は、ビデオ制作で見られるのと同様の課題に直面しており、動きが奇妙で歪んでいたり、一定期間が経過すると AI が「現実」とのつながりを失い始めたりする問題が発生します。マイクロソフトの最新の試みは、誰でも試すことができます。これはAIが生成したバージョンです Quake II.

私はこのゲームを何度かプレイしましたが、方向感覚を失わせるような敵がどこからともなく現れたり、プレイヤーが動くと周囲の環境が変化したりするなど、本当に奇妙な体験でした。新しい部屋に入ると、振り返ると出入り口が消えてしまい、再び前を見ると壁が動いていることがよくありました。

この体験は数分間しか続かず、その後停止して新しいゲームを開始するように促されますが、運が悪ければそれ以前に入力に適切に反応しなくなる可能性があります。

しかし、これは素晴らしい経験であり、もっと多くの人に見てもらえると有益だと思います。生成 AI の優れた点や、現在の限界を実際に体験することができます。インタラクティブなビデオゲーム体験を作り上げることができたこと自体が素晴らしいことですが、この技術デモをプレイして、次のアサシンクリードが AI によって制作されると信じる人がいるとは想像しがたいです。

しかし、このような考えや仮定が存在するのは、主に、人々が現在 AI について聞かずにはいられないからです。たとえ AI をまったく気にしていなかったとしても、どこに行っても AI が押し付けられることになります。問題は、一般の人が得る情報が、大手テクノロジー企業のマーケティングコメントやニュース出版物が取り上げた経営幹部のコメントだけでほぼ構成されていることです。

つまり、次のような誇張された矛盾した主張を聞くことになります。

それは、気候変動、貧困、病気など、世界のいくつかの大きな問題を解決する可能性を秘めています。（ビルゲイツ)

おそらく 2025 年には、Meta をはじめとする主にこの分野に取り組んでいる企業が、社内の中堅エンジニアとして機能し、効率的にコードを記述できる AI を開発するでしょう。（マーク·ザッカーバーグ)

AI の効果的な活用は、現在 Shopify の全員にとって基本的な期待事項となっています。これは今日あらゆる職業で使われるツールであり、時間が経つにつれてさらに重要になるでしょう。率直に言って、ビジネスに AI を適用するスキルを学ぶことを避けることは不可能だと思います。（トビー・ルトケ（Shopify CEO）

私たちは現在、従来理解されてきたとおりの汎用人工知能 (AGI) を構築する方法を知っていると確信しています。 2025 年には、最初の AI エージェントが「労働力に加わり」、企業の生産方法を根本的に変える可能性があると私たちは考えています。（Sam Altman（OpenAI CEO）

人工知能は、たとえ小さくても決して軽視できない可能性を秘めており、例えば、不適切な航空機の設計、不適切な生産管理、粗雑な自動車生産などよりも、文明を破壊する危険性をはらんでいるという意味で、より危険である。（イーロン·マスク)

ちょっとやりすぎのように聞こえませんか?それは私たちを救うと同時に破壊するもの、専門家のためのツールであると同時に彼らに取って代わるツールとなるはずであり、早ければ今年中に SF レベルの AGI が実現するかもしれない。こうしたことを聞くと、人々はこれらの機器に素晴らしいものを期待し始め、オフィスワーカー全員がスタートレックの登場人物のようにコンピューターに話しかけながら日々を過ごしていると信じ始めます。

しかし、現実はそうではありません。現実はQuake IIのようで、不安定でぼやけていて、敵の形は判読できません。 ChatGPTレベルのLLMモデルは2022年にすでに画期的な進歩を遂げており、誰もが楽しく遊ぶことができましたが、大手テクノロジー企業が現在推進している用途の大部分では、AIは単純に十分な能力を備えていません。正確性は非常に低く、指示に従う能力も非常に低く、コンテキストの範囲も非常に狭く、現実世界の知識ではなくインターネット上の意味不明な言葉でのみ訓練されています。

しかし、ビデオゲームの作成は非常に複雑な目標です。結局のところ、このようなものを作成するには、人間のチーム全体が何年もかかります。代わりにビデオゲームをプレイするのはどうですか?

クロードがポケモン赤を「プレイ」

実は、この分野でも実験を行っている人がいるようです。アントロピックの最新モデルはクロード 3.7 ソネット彼は演奏する Twitchでポケモンレッドをプレイ登場してから約 10 か月が経ちましたが、ポケモンをプレイする上で大規模言語モデル (LLM) 史上最高のパフォーマンスを発揮しています。しかし、ちょっとした注意点があります。それは、彼はまだ XNUMX 歳の人間の子どもの平均レベルよりはるかに遅れているということです。

1 つの問題は速度です。クロードは、ビリジアンフォレストを横断するなどの作業に、数日かけて何千ものアクションを実行します。これは、複雑なタスクを処理する際の AI の課題を反映しています。

なぜそんなに時間がかかるのでしょうか?ポケモンバトルで戦略的に勝つ方法がわからないわけではない。むしろ、それが彼の得意とするところだ。一方、環境内を移動して木や建物を避けるのは、あまり良くありません。クロードさんはポケモンをプレイするための訓練を受けたことがなく、ピクセルアートとそれが表すものを理解するのは簡単ではありません。これらの困難は、データを処理する能力と複雑な環境と対話する能力との間のギャップを浮き彫りにします。

月山のような迷路のようなエリアを通過するのは彼にとって特に困難で、そのエリアの地図を作成し、戻らなくて済むようにするのに苦労します。ある時、彼は行き詰まりすぎて、ゲームが壊れていると判断し、ゲームをリセットするよう正式に要請した。これは、AI がその高度な機能にもかかわらず、人間が持つ直感的な理解力をまだ欠いていることを示しています。

これらの初期の試みにも面白い瞬間がなかったわけではありません。

ある時、クロードは窮地に陥り、何かがおかしいと確信し、ゲームをリセットするための正式なリクエストを書きました。 pic.twitter.com/5RIiCJdxCM— アンスロピック (@AnthropicAI) 2025 年 2 月 25 日

また、自分の目標や、すでに試したこと、訪れた場所などを思い出すのも苦手です。

これには非常に単純な理由があります。大規模言語モデル（LLM）には、メモリとして機能する「コンテキストウィンドウ」という限られた領域があるからです。LLMは保持できる情報量に限りがあり、クロードはその限界に達すると、より多くの情報を保持するために情報を圧縮します。例えば、「ヴィリジアンシティを訪れ、全ての建物に入り、全てのNPCと話した」といった情報は、「ヴィリジアンシティを訪れた」という情報に圧縮されてしまう可能性があります。そうなると、クロードは街に戻って、Plusが何かできることがないか確認することになります。

簡単に言うと、クロードは自分がどこに向かっているのか分からず、壁にぶつかり、ランダムなオブジェクトや NPC に混乱し、自分がどこにいたのか、何をしようとしていたのかを忘れ、彼が下す決断には必ず何段落にも及ぶ思考が必要になります。これは批判ではありません。これらは大規模言語モデル (LLM) の可能性を限界まで押し上げる刺激的な実験です。

しかし、AI に関する誇大宣伝が盛んな中、人々がこのようなデモを見て、AI について独自の意見を形成することが重要です。人類は知能のピークに達しようとしている、つまり数年以内に人工知能（AI）が最も賢い人間さえも凌駕するだろうという考えを売り込もうとしている人たちがいるが、彼らは正直ではないと思う。彼らは単なるセールスマンだ。まだピークには程遠く、このすべては始まったばかりです。