Google Gemini では、音声ファイルやその他の新しいファイル形式のアップロードがサポートされるようになりました。

GoogleのGeminiアプリは、数ヶ月間、アップロードされた画像、PDF、さらには動画も処理できましたが、音声が欠けていることが顕著でした。しかし本日、それが変わります。Googleは、Geminiで最も要望の多かった機能の一つ、音声ファイルのアップロードをひっそりとリリースしました。

Google Gemini がオーディオファイルやその他の新しいファイル形式のアップロードをサポートするようになりました。追加された機能とその活用方法に関する包括的なガイド

より幅広いサポート、より多くの用途

待望の機能

Samsung Galaxy Z Flip 7のロック解除とGeminiアプリの表示

Google LabsとGeminiの副社長ジョシュ・ウッドワード氏は、 X の機能リリース「リクエスト #1」と説明されているこのアップデートは現在 Android、iOS、ウェブで利用可能で、おなじみの「ファイルのアップロード」オプションをタップするだけで MP3、WAV、その他の一般的な形式のファイルを追加できます。

ご想像のとおり、いくつかの制限があります。 無料サブスクリプションのGeminiユーザー向け 一度に最大10個のファイルをアップロードできますが、アップロードしたファイルの合計音声時間は10分を超えてはなりません。Googleの有料プラン(AI Pro経由のGemini AdvancedまたはAI Ultra)にご加入いただくと、この制限はXNUMX時間に大幅に延長されます。

無制限ではないものの、比較的寛大です。比較すると、 Geminiでのビデオダウンロード 無料ユーザーは5分、有料ユーザーは1時間までしか保存できません。Audioでは無料制限が2倍になり、有料プランでは3倍の容量が提供されます。これは、文字起こし、会議メモの分析、ポッドキャストの分析といった用途に適しています。

今年初めにファイルアップロードが導入されて以来、音声サポートの欠如は奇妙な欠落となっていました。Geminiは既にYouTube動画の要約や短いクリップの編集は可能でしたが、簡単なボイスメモを録音してAIに処理させることはこれまで不可能でした。

これにより、Geminiは、数ヶ月前から音声とテキストのアップロードをサポートしてきたOpenAIのChatGPTなどの競合サービスが提供する機能に近づきつつあります。しかし、10分という再生時間で一般ユーザーにとって十分なのかという疑問が残ります。この差は、Googleが音声処理をサブスクリプションへの新たなインセンティブにしたいと考えていることを示唆しています。いずれにせよ、ポッドキャストのクリップ、講義の一部、あるいは自分の音声メモなどをGeminiに入力できるようになるのを待ち望んでいた方は、今が試してみるチャンスです。

コメントは締め切りました。