今週見逃したAI関連ニューストップ5：ChatGPTのアップデートとGoogleの最新動向

今週は、これまで注目されていなかったAI企業からいくつかの驚くべき発表がありました。 Googleのジェミニファンのお気に入りになる途中、グロク最も優れたチャットボットのリストでトップにランクイン。新しい医療AIモデルは、がんを含む1000以上の疾患の検出を医師に支援します。

一方、ChatGPTは18歳未満のユーザーに対する安全対策を導入することで、最年少ユーザーの安全性を高めるための積極的な措置を講じています。今週知っておくべきAIに関するトップニュースをご紹介します。

Gemini は 27 種類の AI モデルの中で最も人気のあるモデルです。

この種の公開調査としては最大規模となるこの調査では、米国と英国で21000人以上の参加者が27種類のAIモデルを評価した。ジェミニ 2.5 プロリストのトップにランクインしました。Prolific社のHumaineシステムを用いて実施されたこの調査では、コミュニケーションスタイル、推論能力、信頼度、全体的なユーザーエクスペリエンスなどの基準に基づいてモデルを評価しました。

Geminiは、ほとんどのサブカテゴリでChatGPTやClaudeなどの競合製品を上回り、Googleのこれまでで最も先進的な推論モデルとしての地位を確固たるものにしました。ChatGPTは総合8位にランクインしました。

ご意見をお聞かせください:

ジェミニ2.5プロが1位を獲得 アメリカとイギリスのモデル27人を対象にした世論調査。
21,352人がシェア これらの結果は、さまざまな人口統計グループから得られます。
評価基準: コミュニケーション、柔軟性、推論、信頼性、および全体的なユーザーエクスペリエンス。
ChatGPTは8位にランクイン 全体的に、クロードのリリースは11位と12位にランクされました。

ChatGPTはティーン向けの機能を開発しています

ついにOpenAIが始動 10代の若者のための新しい安全ルールアップデートには、18歳未満のユーザーを検出する年齢予測システムが含まれており、年齢が不明な場合は予防措置を適用することで注意を促す。また、性的なコンテンツや自傷行為など、デリケートなトピックに対する厳格なフィルターの導入、ブロック時間の設定やアカウントの連携といったペアレンタルコントロール機能も提供される。

こうした変化はほんの始まりに過ぎませんが、年齢の定義がどのようになるのか、間違いが信頼にどの程度影響するのか、監視されたり判断されたりすることを恐れる10代の若者が安心して心を開くことができるのかなど、難しい問題を提起しています。

知っておくべきこと

年齢検出の新しいルールOpenAIは、18歳未満であると判断したユーザーを、より厳しい安全規則を備えたChatGPTのバージョンに誘導します。
未成年者デフォルト年齢が確認できない場合は、いずれにしても軽微な制限を適用することで予防措置を講じます。
ペアレンタルコントロールツールの提供保護者は、10代の子供のアカウントに接続して、機能（メモリや履歴など）を無効化または制限したり、安全時間（ブロック時間）を設定したり、AI が苦痛の兆候を検出した場合にアラートを受け取ったりすることができます。
10代の若者向けのチャット制限露骨な性的な内容、軽薄なチャット、自傷行為に関する議論は禁止されています。差し迫った危害を伴う極端なケースでは、保護者と連絡が取れない場合は、法執行機関に連絡する場合があります。

カスタムの Gemini 作品を共有できるようになりました。

GoogleはGeminiのリーチを拡大し、ユーザーがパーソナライズされたアシスタント「Gem」を共有できるようにしました。ChatGPTに詳しい方のために説明すると、これは基本的にカスタムGPTモデルこれまではジェミニジェムこれまでは個人的な使用に限定されていましたが、Google ドキュメントと同じくらい簡単に共有できるようになり、同僚、学生、その他誰もが、ゼロから構築することなく、カスタム設計された AI と共同作業できるようになりました。

この動きは、Gemini をより柔軟でユーザーフレンドリーなプラットフォームにするという Google の取り組みを強調するものです。

知っておくべきこと:

カスタマイズ可能な宝石 これらは、プログラミング、編集、ブレインストーミングなどの特定のタスク向けに設計できる AI 搭載アシスタントです。
宝石は共有される Google ドライブで他のものを共有するのと同じように、共同作業を行うと、他のユーザーが Gem を表示したり編集したりできるようになります。
購読者限定で利用可能 Gemini Advanced、Business、Enterprise は 150 か国以上でご利用いただけます。

GrokがARC-AGIリストでトップに

イーロン・マスクとGrok 4は、AIレースをリードしているように見えます。ARC-AGIリスト（AIが解決できる問題の数とモデルの効率性を測定するベンチマーク）でトップに立ち、その実力を示しています。最近のテストでは、Grok 4はこの難しい指標においてChatGPTやGeminiなどの競合製品を凌駕し、現実世界の問題を解く優れた能力とスピードを際立たせています。

Grok のスピード、ライブ Web 検索の使用、複雑なエンジニアリングの主張に対する優れた処理能力にもかかわらず、ユーザーは Grok の正確性、コンテンツのモデレーション、偏りについて依然として懸念を抱いています。

知っておくべきこと:

ARC-AGIリストのトップGrok 4 は、競合他社よりもリソース単位あたりでより多くの標準的な AI 課題を解決できるという意味で、1 位にランクされていると主張しています。
強み: 事実上瞬時の Web 検索、複雑な幾何学的および論理的タスクの処理の改善、および以前の Grok バージョンと比較したパフォーマンスの向上。
弱点と恐怖
: コンテンツの正確性に関する問題 (一部の誤った主張)、偏りの問題、および頻繁な使用下での節度と信頼性の維持の課題。
結論これは、AI ベンチマークにおいて効率性と品質がますます評価されるようになっていることを示しています。

新しい AI モデルは、がんを含む 1000 以上の病気のリスクを予測します。

Delphi-2Mと呼ばれる新しいAIモデルは、医療AIにおける飛躍的な進歩を象徴しています。英国とデンマークの約2.3万人の匿名化された健康データに基づいて学習されたこのモデルは、1000種類以上の疾患の発症リスクと、それらの発症時期を予測することができます。

Delphi-2Mは、他のAIモデルとは異なり、病歴、ライフスタイル要因、年齢、性別を用いて1000件の症例に対するリスクスコアを提供し、数十年にわたる健康状態の推移をシミュレートします。このモデルは、どのような疾患が発生するかだけでなく、いつ発生するかを予測できます。

実験では、このシステムは英国のデータセットにおける数百の疾患において平均0.76の曲線下面積（AUC）を達成しましたが、デンマークの集団では精度が低下しました。このモデルは診断ツールではなく、人間の医師に代わるものではないことを強調しておきます。

しかし、このツールは予測ツールとして有望であり、一般的なリスク傾向の監視、予防計画、個人の健康における AI の可能性の強調に役立ちます。

ご意見をお聞かせください:

膨大なデータセット:英国バイオバンクとデンマークの登録機関から約 2.3 万人を対象にトレーニングを実施しました。
包括的かつ時間的なモデリング詳細な入力情報（年齢、性別、ライフスタイル、過去の診断）を使用して、次の病気と次の病気の両方を予測します。 ワタフ それは起こるでしょう。
診断ではなく予測:これは予防を指導するためのものであり、医師のアドバイスに代わるものではありません。

結論

わずか 1 週間で、これらのアップデートは、AI 環境が現実世界への統合と大きな進歩へと明確に移行していることを浮き彫りにしています。

AI言語モデルを活用してコードのデバッグからデータの異常検出まで、双子座グロク