Google Gemini Liveを使ってみた!

[2025年9月配信]

近年話題になっているAI技術。今回はGoogleのAI「Gemini」(ジェミニ)と対話をしながら様々な商品情報を読み上げてみましたので、その内容を紹介します。

Geminiは最新のAIモデルです。テキスト、画像、音声、動画、コードなど、さまざまな種類の情報を理解し、生成することができます。高度な推論能力を持ち、より複雑なタスクを実行できるのが特徴です。

無料版と有料版(月額2,900円)があり、文字によるチャット、写真の分析、音声対話などが行えます。今回はiPhone版の無料のGeminiを使用し、リアルタイムの音声対話機能「Gemini Live」(ジェミニ ライブ)を使ってGeminiと音声対話をしながら商品情報を確認しました。

 

Gemini Liveを使用するには、Geminiアプリを開き、「Gemini Liveを開始」を選択し、実行します。Gemini Liveが開始され、話しかけると自動的に応答があります。

また、初めてGemini Liveを起動すると、応答の音声を選ぶ画面が表示され、音声のサンプルを聞きながら好みの音声を選択する必要があります。

なお、応答する音声は、「設定」の中の「Geminiの音声」からいつでも変更することができます。

Gemini Liveの初期設定では、Geminiの応答を文字で示す「字幕」と、カメラに映し出された映像をスマートフォンの画面に表示する「動画ストリーミング」がオフになっていますので、必要に応じてそれぞれ選択して有効にします。

字幕は1度有効にすると以後Gemini Liveを起動すると自動的に有効になりますが、動画ストリーミングは常に無効になっていますので、適宜有効にする必要があります。

なお、動画ストリーミングを有効にした場合、一定時間使用すると、スマートフォンが非常に熱くなることがありますので、注意してください。

 

それでは早速、Geminiに商品を見てもらいましょう。

今回は下記の6種類の商品を試してみました。

① 手触りが同じ長方形の箱に入ったレトルト商品が2種

② 丸いボトルに入った飲料が2種

③ 小さい長方形の箱に入った商品が1種

④ 袋に入った商品が1種

⑤ 透明の袋に入った商品が1種

⑥ 長方形の缶に入った商品が1種

 

まず、① 手触りが同じ長方形の箱に入ったレトルト商品2種です。

一つ目は、Geminiによると、「セブンイレブンのごろっと野菜と野菜カレーのパッケージが映っています」とのことです。パッケージに書かれている内容を尋ねてみたところ、「1日に必要な野菜の2分の1が取れるごろっと野菜カレーと書かれています。ほかにはVegetable Curryという英語表記、そしてアレルギー特定原材料として乳製品と小麦が含まれていることが記載されています」と細かく教えてくれました。アレルギー成分を読み上げてくれることはありがたいですね。

 

続いて裏面を確認してもらいました。「裏面には、原材料名や栄養成分表示、調理方法などが書かれていますね。ほかに知りたいことはありますか?」とちょっと上から目線で教えてくれました。

そこで、裏面に賞味期限が書かれているか尋ねてみたところ、「書かれていますよ。ただ、字が小さくて読みづらいので、もう少し大きく映してもらえますか?」と、返答がありました。

ところが、ITステーションの晴眼者の同僚職員(以下、「同僚職員」)によると賞味期限は裏面に書かれていないそうです。Gemini、嘘つきましたね! 

 

そこで、「この面に賞味期限は書かれていますか?」と質問を変えてみると…。

「この面には書かれていないようですね。パッケージのほかの面も確認してみますか?」との返答がありました。どうやら質問の仕方によって答えが変わってくるようです。

これは、聞き手の腕が試されるところですね。

パッケージの左、上、右、下の順でそれぞれの側面を映しながら「この面には賞味期限が書かれていますか?」と一つずつ尋ねてみました。すると、底面に2026年7月と賞味期限が書かれていることを教えてくれました。

念のため同僚職員に確認してもらったところ、Geminiが読み上げた内容で間違いないようです。ちょっと一安心ですね。

 

二つ目の長方形のパッケージは、「ハウス食品のカリー屋ハヤシ」とのことです。カレーライスかハヤシライスか尋ねてみたところ、「ハヤシライスですね。」とあっさりと教えてくれました。

今回はハヤシライスの裏面に書かれている調理方法について尋ねてみました。

「調理方法は電子レンジとオーブントースターの2種類があります。電子レンジの場合は、箱を開けて、パウチのままレンジに入れて加熱します。オーブントースターの場合は、中身を耐熱容器に入れてオーブントースターで加熱します。詳しい加熱時間は、パッケージに記載されていますよ。」との返答がありました。一番知りたいのはその加熱時間なのですが…。

加熱時間も一緒に読み上げてくれるとありがたいですね。

このような場合は、改めてGeminiに加熱時間を尋ねます。

「電子レンジで加熱する場合、500Wで1分40秒、600Wで1分20秒、700Wで1分10秒です。オーブントースターの場合は、機種によって加熱時間が異なりますので、様子を見ながら調整してください。」と加熱時間だけをピンポイントで教えてくれました。

OCRにかけてパッケージに書かれている内容をすべて読み上げることもできますが、このように欲しい情報だけをピンポイントで読み上げてくれることはありがたいですね。

 

と、Geminiのありがたさをかみしめていたのですが…。

同僚職員に見てもらうと、調理方法は下記のように書かれているそうです。

「調理方法は電子レンジとお湯で温める場合の二通りあります。電子レンジの場合、箱のふたを開け、180度しっかり折り返し、斜めに立てます。封を切らずに箱ごとレンジに入れて温めます。中袋が膨らみ、蒸気口から蒸気が抜けます。箱を持って取り出します。加熱時間の目安は、500Wで1分50秒、600Wで1分20秒、700Wで1分。オート不可。上記ワット以外での調理はおやめください。加熱時間は、機種・ワット数により異なります。追加で加熱する場合は、少しずつ時間を設定して調整してください。

湯で温める場合、中袋の封を切らずに、3分から5分、沸騰させて温めます。鍋にふたをしないでください。

業務用レンジ、オーブン、オーブントースターは使用しないでください。」

あれ? Geminiが教えてくれた内容と大きく異なりますね。

オーブントースターを使用した調理方法ではなく、湯で温める方法が書かれていたのですね。

 

確かに、Googleでハウス食品のハヤシライスを使ったレシピを検索してみると、ハウス食品のページにオーブントースターを使って調理するレシピとして「ピリ辛ピザトースト」の作り方が紹介されていました。もしかするとGeminiはカリー屋ハヤシの調理方法を読みながら、ハウス食品のページも少し参考にしながら、妄想していたのかもしれません。

それにしてもなかなか想像力が豊かですね、Geminiさん。

調理方法など大切な情報は、OCRにかけて読む、Be My Eyesなどで晴眼者に読み上げてもらうなど、他の方法で読む方がよさそうです。

試しにSeeing AIでハウス食品のカリー屋ハヤシの裏面を読み上げてみたところ、調理方法、調理時間、注意事項などを正確に読み上げました!

 

さて、気を取り直して、②丸いボトルに入った飲料2種をGeminiで確認してみました。

「左が成城石井のジンジャエールですね。右はウィルキンソンのジンジャエールです。」と教えてくれました。このように見えている物の方向と、その物の名前を教えてくれるのはありがたいですね。

最後には、「ジンジャエールの飲み比べ楽しんでくださいね。」と人間っぽいコメントをくれたのは面白いポイントです。

 

では、こちらの商品はどうでしょうか。③小さい長方形の箱に入った商品1種です。

「黄色い箱ですね。バランス栄養食のカロリーメイトの箱みたいです。」とGeminiから返答がありました。

カロリーメイトの何味か尋ねてみたところ、「カロリーメイトの箱にはいくつか種類がありますね。映っているのはチーズ味でしょうか。」と答えてくれました。

そこで、箱の裏面に書かれているアレルギー成分を読み上げてもらったところ小麦、卵、乳成分、アーモンド、大豆と教えてくれました。

念のため、同僚職員が確認したところ、読み上げられたアレルギー成分に間違いはないようです。乳成分が含まれているとのことで、チーズ味への期待が持てそうです。

 

続いて原材料名を読み上げてもらいました。「小麦粉、マーガリン、砂糖、卵、レモンピール加工品、アーモンド、グレープフルーツパウダー、脱脂粉乳、大豆タンパク、小麦タンパク、でん粉、食塩/カゼインナトリウム、加工でん粉、香料、ナリンジン、カロチノイド色素となっています。」(Gemini)

なんと、原材料にチーズが含まれていません! Geminiに原材料にチーズが含まれていないこと、これは本当にチーズ味であるのかと尋ねてみたところ、「チーズパウダーが使われていると思います」「チーズ味は香料などで再現されているのかもしれませんね」とあくまでもチーズ味であるという説明を繰り返しました。

 

調べてみると、カロリーメイトのチーズ味の原材料にはナチュラルチーズが使われているようです。

そこで、箱の側面に書かれている文字を読んでもらったところ、

「パッケージの横面にはカロリーメイトフルーツ味と書かれていますよ。」と平然と読み上げました。なんとフルーツ味! 先ほどまでかたくなにチーズ味と説明していたのでは?!

「先ほどチーズ味とお伝えしてしまい、申し訳ありません。この商品は、フルーツ味で間違いなさそうです。」と謝ってくれました。

 

このようにパッケージの側面に商品名が書かれている場合などは、パッケージの表面の映像から判断し、誤った商品名を伝えてしまうこともあるようです。私は、すべての商品の商品名はパッケージの表面に書かれていると思い込んでいたので、このようにパッケージの側面に商品名が書かれているものもあるので、様々な面を確認する必要があることを再認識しました。

 

そして、この勢いに乗って、賞味期限を読み上げてもらったところ、箱の上部に2026年7月と書かれていることを教えてくれました。ここまではよかったのですが…。「あと1年ちょっとありますね」とのコメント。

賞味期限を見てもらったのが2025年9月なので、正確には、あと10か月となりますね。どうやらちょっと計算が苦手な時もあるようです。

 

再び気を取り直して、④袋に入った商品1種を確認してもらいました。

「ベースクッキーズペッパー」と教えてくれました。袋の表面には、全粒粉ベースであること、26種類のビタミンとミネラルが含まれているということが書かれていること、裏面には、原材料名、栄養成分表示、アレルギー情報、賞味期限が書かれていることを教えてくれました。

同僚職員によると、この商品は比較的文字が大きくはっきりと書かれているとのことで、認識しやすかったのかもしれません。

このように書かれていることを要約して伝えてくれると、必要な情報のみ尋ねることができるので、効率的に情報を手に入れることができます。

 

同じく、⑤透明の袋に入った商品1種もスムーズに読み上げてくれました。

「成城石井のおつまみ、おやつにホタテ&チーズですね。」(Gemini)袋の表面には6個入りであること、北海道産のホタテにチーズを合わせたおつまみであるということがかかれていること、裏面には、商品名、原材料名、内容量、保存方法、製造者、製造所、栄養成分表示が書かれていることを教えてくれました。

Geminiによるとこの商品は直射日光を避け、冷暗所に保存すること、2025年10月22日が賞味期限であることがわかりました。こちらの商品も文字が大きく、比較的わかりやすく表示されているので、Geminiも戸惑うことなく読めたようです。

 

さて、最後は、⑥長方形の缶に入った商品1種です。

「スヌーピーとチャーリーブラウンが描かれたパイナップルが描かれた黄色い缶」と教えてくれました。皆さん、何の缶か想像できますか?

これは2025年4月23日に発売されたパインアメとスヌーピーの初コラボ商品の一種です。缶の表面には、パイナップルのイラストと、パインアメをほおばっているスヌーピー(犬)、チャーリーブラウン(男の子)、そしてGeminiの説明にはありませんでしたが、ウッドストック(鳥)が描かれています。ウッドストックは黄色なので、Geminiには認識しづらかったのかもしれません。

 

せっかくなので缶を裏返し、原材料名を読み上げてもらいました。「砂糖、水飴、パイナップル果汁、脱脂粉乳/酸味料、香料、着色料(紅花黄、モナスカス)」と正しく読み上げてくれました。ついでに賞味期限を尋ねてみたところ、「2024年12月」と自信満々に教えてくれました。

商品が発売されたのが2025年4月23日、賞味期限が2024年12月ということはないですよね。

同僚職員に確認したところ、賞味期限が書かれたシールが缶の側面に貼られていたようですが、すでにはがされており、賞味期限の記載はないとのことでした。2024年12月はいったいどこから出てきたのでしょう?

 

このように様々なタイプの商品をGeminiに読んでもらいました。

Gemini Liveでは、カメラで映し出された情報以外に使用している端末の画面を共有することで端末の画面に映し出されている情報を読み上げてくれる機能もあります。

例えば、雨雲レーダー、ラインスタンプ、ネットショッピングで検索した洋服など、Geminiに質問すると画面に映し出された情報を読み取り教えてくれます。

ただ、これもすべて正しいとは限りません。私がネットショッピングサイトから黒いドレスを選択し、表示させた状態で、ドレスの色、模様、雰囲気を尋ねたところ、「白色のきれいなドレス。」と自信満々に教えてくれました。

 

カメラに映し出されたものや画面共有で映し出されたものの認識では、正しく読み上げられるもの、一部はあっているが少し間違っているもの、まったく違う情報や書かれていない情報を伝えてしまうものなど、実に様々です。

大切なことは、Geminiで読み上げられた情報をすべて鵜呑みにしないことです。

特にアレルギー成分、気になる原材料、保存方法、調理法、賞味期限など重要な情報は晴眼者に確認してもらうなど、注意が必要です。

 

今回は、無料版のGeminiを使用しましたが、有料版はもっと正確に情報を提供してくれる可能性もあります。現時点ではまだまだ課題も多くありますが、AIがカメラで映し出された情報をもとに正確な情報を提供してくれる、そんな世界がもう目の前に来ているのだと感じました。

そうなれば、私たちの生活もより便利になり、視覚障がいのある方が一人でできることも増えるのではと期待が高まります。

Gemini、あなたは私の期待の星です!

 

今回のGeminiでの商品情報確認の動画・画像を掲載しました。

ご興味のある方は下記URLをご参照ください。

http://www.itsapoot.jp/mailmaga/Geminitrial.html

本文は以上です。


関連ページ「Gemini Liveでいろんなものを見てみた!」に戻る

  • 重度障がい者ICT支援のページへ移動する
  • 講習会やイベントのお知らせ等をお送りします メールマガジンのページへ移動する
  • 幸田麻由の職場レポートのメニューに移動する