大規模ビジネス モデル (LAM) は、従来のモデルと比較して AI の世界に革命をもたらしています。

生成 AI を搭載したチャットボットの出現により、「大規模言語モデル」(LLM) という概念が生まれました。これは、自然言語を分析および理解し、ユーザーのクエリに基づいて意味のある応答を生成する高度な AI テクノロジーです。大規模言語モデルは、一貫性のある人間のようなコンテンツを生成できるため、AI が独自の「思考」を持っているかのような印象を与えます。

しかし、言語モデルは人工知能の発展に貢献する唯一の技術ではありません。大規模ビジネスモデル (LAM) が次のステップになるかもしれません。これらのモデルは、実用的な状況での分析および意思決定能力の強化に重点を置いており、自動化やビジネス管理などの分野を変革する可能性があります。この記事では、LLM と LAM の両方がどのように機能するか、そして AI アプリケーションの改善とその範囲の拡大におけるその影響の拡大について学習します。

大規模ビジネスモデル (LAM) は AI の世界に革命をもたらしています。

大規模アクション モデル (LAM) とは何ですか?

Large Action Model (LAM) は、人間の入力を理解して対応するアクションを実行できる人工知能モデルで、人間のような方法で世界と対話できるようにします。これは、応答の生成のみに焦点を当てた AI モデルとは少し異なるアプローチです。 「大規模ビジネスモデル」という用語は、Rabbit R1 の開発者である Rabbit Inc によって最初に導入されました。同社の Rabbit R1 発表ビデオでは、LAM は AI を言葉から行動に移行するのに役立つ新しい基礎モデルであると述べています。

大規模アクション モデル (LAM) とは何ですか?

LAM は、大規模なユーザー アクション データのセットに基づいてトレーニングされます。したがって、彼らは人間の行動を模倣したり、デモンストレーションを通じて学習します。デモを通じて、LAM モデルはさまざまな Web サイトやモバイル アプリケーションのユーザー インターフェイスを理解して操作し、指示に基づいて特定のアクションを実行できます。によると ウサギ,LAM は、インターフェースがわずかに変更された場合でも、これを実現できます。

LAM は LLM の既存の機能の拡張と考えることができます。 LLM の生成テキストまたはメディア出力は、次の単語またはトークンを予測することでユーザー入力に依存します (ユーザーが質問すると、LLM モデルがテキストまたはメディア出力を提供します)。一方、LAM は、ユーザーに代わって複雑なアクションを実行する機能を追加することで、これをさらに進化させています。

LAM は何ができるのでしょうか?

LAM は、ユーザーに代わって複雑なアクションを実行することです。ただし、注意すべき重要な点は、複雑な手順を実行できることです。これにより、LAM は高度なタスクでより便利になりますが、これは、LAM がより単純な手順を実行できないことを意味するものではありません。

理論的には、これは、たとえば、地元のカフェでコーヒーを注文したり、Uber を利用したり、ホテルの予約をしたりするなど、ユーザーに代わって何かを行うよう LAM モデルに依頼できることを意味します。したがって、Google アシスタント、Siri、または Alexa にテレビやリビングルームの照明をオンにしてもらうなどの単純なタスクを実行するのとは異なります。

Rabbit Inc. が共有したビジョンによれば、LAM モデルは内部的に、Uber などの関連 Web サイトやアプリにアクセスし、そのインターフェースを操作して、乗車をリクエストしたり、気が変わったらキャンセルしたりするなどのアクションを実行できる。

LAM は LLM よりも優れたパフォーマンスを発揮しますが、(まだ)その準備は整っていません

LAM の概念は、おそらく LLM よりも刺激的です。大規模アクション モデル (LAM) は、生成 AI の後の未来となり、私たちが日常的なタスクを相殺して、他の充実した活動に集中できるようになります。ただし、エキサイティングに聞こえるかもしれませんが、LAM はまだ準備ができていません。

LAM を活用することを約束した最初の商用製品 (Rabbit r1) は、ユーザーに代わってアクションを実行するというマーケティング上の約束を完全には果たせませんでした。このデバイスはその中核となるセールスポイントでひどく失敗しており、多くの直接のレビューではかなり役に立たないと評されていました。

さらに悪いことに、YouTuber Coffeezilla が Rabbit r1 ベースの一部にアクセスできるソフトウェア エンジニアの選ばれたグループと協力して行った調査により、Rabbit が LAM の代わりに Playwright スクリプトを使用してアクションを実行していることが判明しました。したがって、マシンは独自の AI モデルを実行するのではなく、実際には、多数の If > then ステートメントを実行しているだけでした。約束されたLAMモデルとは程遠い。

Rabbit r1 から得られるものがあるとすれば、それは、確かにビジョンはそこにある、ということです。ただし、実装前に作業を完了する必要があるため、まだ興奮する必要はありません。

コメントは締め切りました。