Gemini Live と ChatGPT の間で 5 つの音声タスクで行われたライブ チャレンジで、XNUMX 人の勝者が勝利しました。

私にとって欠かせないロボットが1台!

AI搭載のスマートアシスタントは絶えず進化を続け、より賢く、より速く、そして新しい機能を獲得しています。今では、見たり、話したり、聞いたり、さらにはジョークを言ってあなたを元気づけたりもします。

ハンズフリーのアシスタント機能を提供する私のお気に入りのチャットボットの中には、 音声と視覚によるChatGPT و Google の Gemini Live どちらもとても便利です。私は定期的に交互に使っていますが、直接比較したことはありません。そこで、どちらのアシスタントの方が人間に近いのか、考えてみることにしました。

Gemini LiveとChatGPT Voiceを搭載した携帯電話

これを達成するために、私は両方の楽器に対して、限界に挑戦するように設計された 5 つの独自のオーディオ テストを実施しました。

これらは「天気はどうですか?」といった単純な質問ではありませんでした。参加者たちは、文脈を整理し、画像を分析し、創造的に協力し、さらには登場人物のロールプレイングまでこなすという課題に挑戦しました。その中で、ある参加者が圧倒的な勝利を収めました。この記事では、その理由を説明します。

1. 文脈記憶とフォローアップ

Gemini LiveとChatGPTのスクリーンショット

請求: 「私の名前はアマンダです。家族5人でボストン旅行を計画しています。まず何をすればいいでしょうか?」 その後: 「前に私の名前は何と言ったか思い出せますか?」

ジェミニライブ 彼はすぐに追加の情報を要求し、できる限り正確な情報を提供できるようにしました。子供たちの年齢や、家族でどのようなアクティビティを好むかなどについて尋ねました。彼は、どこでも得られるようなごく一般的なアドバイスをいくつかくれましたが、それでも役立つ情報でした。チャットボットは私が名前を覚えるように頼むと、すぐに私の名前を覚えてくれました。

AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 すぐに、家族向けの一般的なおすすめをいくつか提案してくれました(Plusが私のことを尋ねた後にGeminiがしてくれたのと似ています)。そして、家族の好みについても尋ねました。そこから、定番のものから珍しいものまで、よりユニークで魅力的なアクティビティを提案してくれました。チャットボットは私の名前を覚えていてくれました。

勝者:ChatGPT ボストン出身の私でさえ思いつかなかったような革新的な提案のおかげで、ChatGPTは素晴らしいサービスとなりました。5人家族で活動的な私たちにとって、ユニークで興味深いアイデアを提供してくれたので、大変助かりました。これは、ChatGPTが期待を超え、ユニークな体験を求めるユーザーに真の付加価値を提供できることを証明しています。

2. 拡張アイデアテスト

Gemini Live と ChatGPT のスクリーンショット

請求: 「AI パートナーの普及が社会に及ぼす潜在的な影響について説明します。」

ジェミニライブ: 彼は肯定的な側面を認めたものの、あまりにも一般的な表現にとどまり、具体的な社会的影響について言及していませんでした。チャットボットは両方の側面に触れながらも詳細には触れず、返答はやや空虚でまとまりがありませんでした。彼の回答は表面的で、潜在的な影響についての深い分析が欠けていました。

チャットGPT: 曖昧なデータにとどまらず、プラスの影響とマイナスの影響の両方について具体的な例を示しました。チャットボットの結論は、バランスの重要性を強調していました。ChatGPTは明確かつ包括的な回答を提供しましたが、非常に繊細な側面があります。会話中、私が電話を置いた際に、ボットは言葉に詰まって「他に何かお手伝いできることはありますか?」と尋ねました。ボットに続けるように指示したところ、ボットは混乱していたため、質問を繰り返さなければならず、効率が悪いと感じました。しかし、ChatGPTはトピックのさまざまな側面を考慮し、より詳細で深い分析を提供しました。

勝者:ChatGPT より包括的でバランスの取れた回答で勝利を収めました。技術的な詳細に多少の難しさはありましたが、質問への回答は優れていました。Geminiは「考える価値がある」という言葉で会話を締めくくりましたが、これは洞察力に欠けるように感じられました。全体として、ChatGPTは文脈を理解する能力に優れており、AIコンパニオンが社会に及ぼす潜在的な影響について貴重な洞察を提供する能力を示しました。

チャレンジ3:個性とユーモア

ChatGPTとGemini Liveのスクリーンショット

請求: 「バリスタ風の、自然なユーモアが加わったメープルピーカンラテを買うように私を説得してください。」

ジェミニライブ Gemini Liveは、Z世代の個性を体現することに優れており、自然で自然な響きの楽しいフレーズを提供しました。ChatGPTよりも冗長さが少なく、より人間的で生き生きとした印象を与えます。これは、Gemini Liveが世代間のコミュニケーションの微妙なニュアンスを理解し、それに合わせて対応し、それぞれの世代に合わせた応答を提供できる能力を示しています。

AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 彼は長くて退屈なプレゼンテーションを行い、疎外感を抱かせました。GeminiほどZ世代の雰囲気を捉えておらず、返答も不自然で過度に形式ばった印象を受けました。これは、ChatGPTがインフォーマルで自然な言語スタイルへの適応に苦労している可能性を示唆しています。

優勝者: ジェミニライブ 彼はこのチャレンジを制覇しました。まさにGeminiが輝いた瞬間でした。彼の声の演技と個性は完璧で、役になりきって演じました。これはGemini Liveのクリエイティブで個性的なレスポンス能力の高さを物語っており、ユーモアと人間味あふれるやりとりが求められるタスクに最適な人材と言えるでしょう。

マルチメディア統合

Gemini LiveとChatGPTのスクリーンショット

請求: 「この古いバナナを見て、どうしたらいいかアイデアをください。」

ジェミニライブ 彼はバナナを見た途端、すぐにバナナブレッドを提案しました。良い選択でしたが、迷う必要はありませんでした。何か違うものを提案してほしいと頼むと、彼はスムージーを提案しました。私は他に材料があまりないことを伝えると、彼は落ち着いて「いいですよ。スムージーはどうですか?」と言いました。もう一度、他に材料がないことを告げると、彼はついにバナナアイスクリームを作ることを提案しました。

AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 彼はバナナブレッドも提案してくれましたが、他のアイデアと「セット」にして、さらにスムージーまで提案してくれました。他に材料がないと言うと、氷と水でブレンドして「爽やかなドリンク」にしたらどうかと提案してくれました。さらに、ハチミツ、シナモン、バニラといった、パントリーにある材料も提案してくれました。これらはおそらく私の手元にもあるでしょう(ジェミニが提案した様々なフルーツ、海藻、ケールとは違います)。

勝者: AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 ChatGPTは、現実世界におけるマルチモーダルコミュニケーション、創造性、そして視覚的知能において明確な優位性を持ち、このラウンドで勝利を収めました。ChatGPTはコンテキストを理解し、制約に基づいて実用的な提案を提供する能力に優れており、このシナリオにおいてより有用なツールとなっています。

瞬時の共同創造性:アイデアを素早く生み出し、実行する

Gemini LiveとChatGPTのスクリーンショット

請求: 「私の子供たちに寝る前に歌う歌を提案して、できれば歌ってください。」

直接体験してみると、 ジェミニライブ 歌詞を一行ずつ分析することで、より協力的な作業ができました。楽器、テーマ、スタイルなどについて質問してみてください。こうした情報共有は確かに素晴らしいですが、寝かしつけに子供を助けようとする親にとって、手軽な方法が必要なのです。もし別の状況でこの曲が必要になったら、こうした共同作業はありがたかったかもしれません。

はどうかと言うと AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 彼は数分で美しい子守唄を作り上げて、しかも歌まで歌ってくれました!曲は独創的でよくできていましたが、ロボットの声は少しロボットっぽかったです。そこで、違う歌詞を書いて、違うスタイルで歌ってほしいと頼んだところ、彼はすぐに作業に取り掛かり、ケンドリック・ラマー(もしラマーがロボットだったら)のようなラップまでしてくれました。

勝者:引き分けどちらのツールもキャッチーな韻と楽しいアイデアを生み出しました。ChatGPTは構成力に優れていましたが、Geminiはより柔軟性が高く、友人とのブレインストーミングのような、魅力的でありながら指示的な要素が少ないツールでした。

総合優勝者: ChatGPT

両AIアシスタントを徹底的にテストした結果、ChatGPTは現時点でより高度で包括的なエクスペリエンスを提供していることが明らかになりました。より深い推論能力と優れた記憶力、より強力な視覚分析、より迅速なクリエイティブな実行など、ChatGPTは一貫してより有用で洗練された結果を提供してきました。ChatGPTは現在、様々なタスクで優れたパフォーマンスを求めるユーザーにとって理想的な選択肢です。

しかし、Geminiは際立った瞬間もいくつかありました。特に、パーソナリティベースのプロンプトでは、より自然で楽しい印象を与えました。笑顔を誘い、気分を明るくしてくれるアシスタントを探しているなら、Geminiはその点で優れています。しかし、より高度なAI搭載コンパニオン、つまり深く考え、明晰に物事を見ることができ、さらにはあなたの指示に従って歌ったり(ラップしたり!)したりできるコンパニオンを探しているなら、ChatGPTが依然として最良の選択肢です。つまり、ChatGPTは単なる会話を超えた高度な機能を提供しており、様々なタスクでインテリジェントな支援を必要とするユーザーにとって貴重なツールとなっています。

コメントは締め切りました。