HuggingSnap AIアプリ:スマホのカメラを通して世界を見る

ただし、Hugging Snap に私の人生全体を管理させるつもりはありません。

まとめ:

  • Hugging Face は、iPhone カメラが捉えたものを分析して説明できる iOS アプリ、HuggingSnap をリリースしました。
  • アプリはオフラインで動作し、データをクラウドに送信することはありません。
  • HuggingSnap は完璧ではありませんが、デバイス上で何ができるかを示しています。

AI 機能を強化する ChatGPT、Microsoft Copilot、Google Gemini などのツールの登場により、AI に「見る」能力を与えることがますます一般的になりつつあります。 Hugging Face は、HuggingSnap という独自の iOS アプリをリリースしました。このアプリを使うと、インターネットに接続せずに iPhone のカメラを通して世界を見て、見たものを説明できます。このアプリはオフラインでも動作するため、インターネット接続が不安定な場所でも使用できます。

沈黙を保つ方法を知っている専属のツアーガイドがいると想像してください。 HuggingSnap は、Hugging Face の内部視覚モデル smolVLM2 を使用して完全にオフラインで動作し、データをインターネットの隙間に送信することなく、瞬時の物体認識、シーンの説明、テキストの読み取り、周囲の一般的な観察を可能にします。

ハグスナップ

オフラインで作業できる機能により、HuggingSnap は接続が断続的な状況で特に役立ちます。あなたが荒野をハイキングしているとき、信頼できるインターネットのない海外旅行をしているとき、あるいは単に携帯電話のサービスが不思議に消えてしまう食料品店の通路にいるとき、携帯電話にこの機能があることは本当にありがたいことです。さらに、このアプリは超効率的であると主張しており、クラウドベースの AI モデルのようにバッテリーを消耗することはありません。

HuggingSnapは私の世界を見ています

HuggingSnapアプリを試してみることにしました。まず、ブラウザで自分の TechRadar プロフィールを開いた状態で、ノートパソコンの画面にそれを向けました。当初、アプリはテキストを文字起こしし、見たものを説明するという点でうまく機能していました。しかし、私の履歴書の見出しやその他の詳細を見たとき、彼はびっくりしました。 HuggingSnap は、見出しにある新しいコンピュータ チップへの言及が私のラップトップで何が動作しているかを示していると考え、見出しにある名前の一部が私のラップトップを使用している他の人を指していると判断したようです。

ハグスナップ

それから私は、まだ片付けていないおもちゃでいっぱいの息子の遊び場にカメラを向けました。もう一度言いますが、AI はプレイエリアとその中で行われるゲーム全般を非常にうまく説明してくれました。彼は、ぬいぐるみとブロックを識別するときに、色や質感までも正しく識別しました。しかし、彼はいくつかの詳細を間違えていました。たとえば、彼はクマを犬と表現し、スタッキングリングをボールだと思っていたようです。全体的に、HuggingSnap は友人に現場を説明するのには適していますが、警察の報告書には不十分だと私は考えています。

ハグスナップ

未来を見据えて

HuggingSnap のデバイス上でのアプローチは、iPhone の組み込み機能とは一線を画すものです。このデバイスは植物の種類を識別したり、写真からテキストをコピーしたり、壁にいるクモが移動させるべき種類かどうかを教えてくれるが、常に何らかの情報をクラウドに送信している。

ほとんどのアプリがユーザーに関するほぼすべての情報を追跡しようとする世界において、HuggingSnap はユニークです。しかし、Apple は将来の iPhone 向けにデバイス上の AI テクノロジーに多額の投資を行っています。しかし今のところ、AI による可視性を備えたプライバシーを求めるなら、HuggingSnap が最適かもしれません。

コメントは締め切りました。