1. ドリームの気まぐれ情報局
  2. 第15回 Google NotebookLMの音..
2025-05-03 21:23

第15回 Google NotebookLMの音声概要が日本語に対応したので試してみた

apple_podcasts

Google の NotebookLM の音声概要機能が日本語に対応したので試してみました。ソースで使用したYouTubeの動画はこちらです。
 

サマリー

このエピソードでは、GoogleのNotebookLMの音声概要機能が日本語に対応したことに言及し、視覚障害者向けのスマート歩行支援デバイス「グライド」を使ったYouTube動画を用いた実験が行われます。グライドのデモンストレーションにより、ユーザーの独立した移動をサポートする様子が詳しく説明されています。また、第15回のエピソードでは、視覚障害者向けのスマート歩行支援デバイスグライドの機能と利便性が論じられ、AI生成の音声概要機能を通じて異なる情報を効果的に受け取る体験についても触れられています。

NotebookLMの音声概要機能
はい、どうもどうも、ドリームのお好み情報箱です。
ドリームのお好み情報局でしたかね。名前忘れちゃった。
今日はですね、GoogleのNotebookLMって皆さん使ったことありますでしょうか。
これは何かと言いますと、ドキュメントとかですね、
YouTubeの動画とか、PDFファイルなどのドキュメント、YouTubeの動画とかですね、
ウェブサイトとかを、ノートに追加するとですね、追加してAIに質問すると答えてくれたりとかですね、
AIで分析したり、概要を分析したりとか、そういうことができるサービスなんですけれども、
これに最近、音声概要というのが追加されました。
追加されましたというか、これまであったんですけれども、数日前日本語に対応しました。
今まで英語とかにしか対応してなかったんですけれども、最近日本語に対応して、日本語で使えるようになりました。
今日はですね、使ってみたらなかなかすごかったので、それをやってみようかなと思いますね。
はい、では、今回はですね、何をしようかなと思ったんですけれども、YouTubeで動画でやってみようかなと思います。
グライドのデモンストレーション
YouTubeの英語の動画ですね。英語の動画を音声概要、日本語で概要を作成してみようかなと思います。
ちょっと面白い動画がありまして、グライダンスというのかな、グライドというのかな、盲導犬ロボットみたいなやつ。
米国とかで今年の秋に発売を予定している盲導犬ロボットみたいなやつなんですけど、
自立走行ができて、カメラとかセンサーとかで周りの状況を認識して誘導してくれるみたいな、
日本でいうAIスーツケースみたいな感じかな、そんなような感じのものかなと思うんですけれども、
よくわからないんですけれども、そういうデバイスがあってですね、それのYouTubeの動画というのがありますね。
ちょっとそれを今から再生してみたいと思います。今も検索しておいてあるので、
クリック可能、見出し、レベル3、記録、リンク、グライド、デモンストレーション、ビデオ、マイナス、ユーズ、ケース、アンド、セナリオ、ウォーク、スルー、シャープ、1。
これですね、ここでエンターを押してみます。
クリック可能、はい。
こんな感じで英語でしゃべりますね、当然。アメリカの動画なんですね。
で、これ止めました。
これ止めて、このURLをですね、コピーしましょう。
Alt、Dを押して、アドレスバーに移動して、Ctrl、Cでコピー。
コピーできました。
これできましたので、今度はですね、ここから、
えーと、ここで、ノートブックLMを開きましょう。
間違えたかな。間違えた。もう一回。
NOTBOOK.GOOGLE.COMと入れました。
で、エンター。
あー、失礼いたしました。ノートブックLMですね。
ノートブックLMっていらない。
NOTBOOK.GOOGLE.COMですね。
はい、えーと、失礼しました。
いつもはBOOKMAKUとかからしかやらないので、
まあ、ノートブックLMとかで検索すればいいのかもしれないですけどね。
はい、今度はURLで入力しました。
で、えーと、今、ノートブックLMのページを開きましたので、
ここで、えーと、そうしましたら、タブキを押していきますね。
はい、ノートブックを新規作成というのがなりました。
えーと、初めてやると、ノートブックLMを試すという、いいかもしれませんね。
そこでエンターを押して、今度はノートブックLMを新規作成。
ここでエンターを押しましょう。
そうすると、新しいノートブックが作成されましたので、タブを押していきますね。
これはパソコンから、例えばPDFファイルとかテキストファイルとか、
MP3ファイルとかもアップできたりするんですけども、
そういうソースをアップロードするときにこれを使います。
タブを押して、
Googleドキュメントからインポートすることもできます。
Googleスライドね。
ウェブサイト、これはウェブサイトを追加して、AIで解析できます。
もう一回タブ。
はい、YouTubeがありました。
ここでエンターを押しましょう。
タブ。
もう一回タブ。
できましたね。YouTubeのURLを貼り付ける。
さっきコピーしておいたURLを貼り付けます。
はい、これで入り付けました。タブを押します。
はい、挿入でエンター。
はい、これで追加されたはずです。
ボタン折り畳み、Googleアカウントコロン、旧用コーディング、ノー、エディット、グライドデモ、ボタン、アナリティフス、エディット、グライドデモンストレーション、コロン、使用例とシナリオ、ボタン、アナリティフス、ボタン、ノートブックを共有、メニューボタン、折り畳み、サブメニュー、設定、タブ、ソース、タブ、選択、チャット、タブ、スタジオ、ボタン、白杖、見出し、レベル1、グライドデモンストレーション、コロン、使用例とシナリオ、1、ソース、このソースは10、グリダンスの
グライドを使用して馴染みの悪いルートを歩く様子を紹介し、点、障害物回避、ターゲット認識、0、コロン、交差点、ドア、カウンター、直角フィードバック、音声案内など様々な
やすぜん機能とガイダンス機能を実演しています。0、ユーザーが速度を制御し、グライドが安全なパーツを維持する様子や、点、交差点やドアを安全利用する方法も示されています。0、全体としてこのテキストはグライドが視覚障害を持つユーザーの独立したいどうどのようにサポートするかを示しています。0、ボタン、メモに保存。
ユーザーの独立した移動サポート
このように、グライドが視覚障害を持つユーザーの独立したいどうどのようにサポートするかを示しています。
今から音声概要を生成しています。これにはかなり時間がかかります。時間がかかりますので1回録音を止めます。数分かかると言いましたが結構かかります。10分くらいかかったりしますね。
はい、生成が終わりました。結構時間かかりましたね。10分近くかかったかな。結構かかった。では、これです。音声概要というのはどうなっているか見てみましょうね。
ボタン、メニューボタン、折り畳み、サブメニュー、オーディオ、プレイヤーに関するその他のオプション、ボタン、音声を再生。
音声を再生というボタンがありましたね。ここでエンターを押すと音声概要が再生されます。ではどうなったか聞いてみましょう。
こんにちは。今回は視覚障害者向けのスマート歩行支援デバイス、グライドについてそのデモンストレーション映像を基に詳しく見ていきたいと思います。
はい。
ユーザーがグライドをどういうふうに使ってどんな体験をするのか、そのあたりを掘り下げていきましょう。
よろしくお願いします。映像に出てくるのはエイモスさんという方で、使い慣れた道を通って近所のジュース店に行くという内容ですね。
なるほど。
まず基本になるのがフリースタイルモードです。特にルートを設定しない場合、これがデフォルトの動き方になります。
フリースタイルですか?あ、じゃあユーザーがこっち行きたいなと思ったら、それにグライドがついてきてくれるみたいな。
まさにそういう関係性ですね。ユーザーが行き先を決めて、グライドが安全な経路を維持したり、障害物を避けたりするのをサポートする、と。
ふむふむ。
デバイス自体は車輪が2つ全て経由対応です。
はい。
それからセンサーとかLEDがついた本体部分。
ええ。
それとハンドルですね。ここに触覚フィードバックとか、ボタン、マイク、スピーカー、あとカメラなんかも全部入ってるんです。
へえ、ハンドルにそんなたくさんの機能が。それでこのフリースタイルモード、利点はどういうところに?
やはりユーザーが主導権を握れる点ですね。ハンドルを軽く押して始めると、グライドが決してユーザーを引っ張るんじゃなくて。
あ、そうなんですね。
はい。速度とかペースは常にユーザーがコントロールします。
なるほど。
歩き始めてすぐ、グライドがラインを発見しました。音とハンドルの振動をダブルタップで知らせてくれるんです。
ラインを発見ですか?それはつまり、進むべき安全な道筋が見つかったよっていう合図?
その通りです。これはユーザーにとって、あぁ道が見つかったんだなっていう、何ていうか盤心感につながるすごく大事なフィードバックですね。
なるほど、安心感。確かにそれは大きいですね。映像でも経路にあった看板をスムーズに避けてましたよね。
あと個人的に印象的だったのは、狭い歩道で人とすれ違うシーン。
あの時、短い振動と車輪の抵抗がちょっと増す感じで、ユーザーに少しスピード落としてって促してるように見えたんですが。
よく見てらっしゃいますね。あれは単に物を避けるだけじゃなくて、周囲の状況、この場合は対向車ですね。
それを認識して安全なマージンを保つためのインテリジェントな介入なんです。
へぇ、賢いですね。
予期せぬ状況でもユーザーが落ち着いて対応できるようにっていうサポートですね。認知的な負荷を減らすとも言えるかもしれません。
うーん、なるほど。平坦な道とか障害物回避はイメージできたんですけど、やっぱり一番気使うのって交差点だと思うんですよ。
そうですね。
ああいう混雑な場所だと、グライドはどうやって助けてくれるんですか?
交差点に近づくとですね、グライドが音声で知らせてくれます。歩道左、横安保道正面、横安保道右みたいに。
あ、選択肢を教えてくれる。
そうなんです。で、ユーザーがハンドルのボタンで、例えば右の横安保道に行きたいと選ぶと、
グライドは横安保道を追跡中と確認して、その横安保道の遠赤のところまでちゃんと連れて行って止まってくれるんです。
おお、すごい。じゃあ、ただ案内するんじゃなくて、ちゃんと選択させてくれるんですね。
ええ、そこがポイントです。ユーザーの意思決定をしっかりサポートするという。
で、その遠赤で停止した後、渡る前には何か特別な操作とかいるんですか?
ここにすごく重要な安全機能がありまして、スクイーズトゥアンロックと呼ばれてるんですけど。
スクイーズトゥアンロック。握って解除みたいな?
その通りです。ユーザーがまず、自分の耳とかで周囲の安全をしっかり確認する。
はい。
それで、よし、渡れるって準備ができてから、ハンドルのボタンをグッと握る。そうすると初めてブレーキが解除されるんです。
へえ。じゃあ、グライド任せじゃなくて、最終的なゴーサインは人が出す、と。
そういうことです。あくまで安全確認の主体はユーザーである。っていう、これはもう設計思想の現れですね。
Glideの機能
技術に完全に委ねるんじゃなくて、意図的に人が介在するステップを入れているんです。
なるほどね。それは安心ですね。
じゃあ、そのボタンを握っていざ横断開始したら、その間はどうサポートしてくれるんですか?
横断中はですね、今度は反対側の円積を目標にして、グライドがそれを追跡します。
はい。
で、トラッキングバズっていう、まあ継続的なブーっていう感じの振動で、ちゃんと安全な範囲内にいますよ、それでもせんよっていうのを知らせ続けてくれるんです。
ああ、なるほど。振動で方向を見失う不安が減るわけですね。
ええ、そうです。
うーん、よくできてますね。
目的地、例えばお店とか、そういうのに近づいたときはどうなんですか?入り口を探すとか。
ああ、それも便利な機能があって、音声コマンドが使えるんですよ。
音声コマンド?
はい。ヘイグライド、ドアを探してみたいに話しかけると、グライドが搭載しているカメラでくるっと周りを見渡して、それで指定されたもの、ドアとか、あるいは店内のカウンターとか、そういう目標物を認識してくれるんです。
おお、すごい。
認識したら、そこまでちゃんと連れて行ってくれて、ちいたら自動でブレーキがかかって停止。
なるほど、最後のほんの数メートルみたいなところもちゃんとナビしてくれるんですね。
まさにラストマイルのナビゲーションですね。
うーん、これらの機能を全部合わせて考えると、グライドが目指しているのって単に移動を手伝うっていうこと以上のものがありそうですね。
ええ、おっしゃる通りだと思います。まず、フリースタイルでの自由度の高い移動、それから経路維持と障害物回避による基本的な安全性、それに加えて交差点でのわかりやすいナビゲーション、そして音声コマンドを使った目標物の発見。
これら全部を通して、視覚に障害がある方がもっと自信を持って主体的に移動できる、そういう体験を提供することを目指しているんですね。
AI音声概要の利便性
自信と主体性ですか。
ええ、資料にはインテリジェントディスオビディエンス、つまり賢い服従っていう言葉も出てきましたけど。
ああ、ありましたね。
例えばトゲとかで安全が確認できるまでちゃんと待機する。これもユーザーとの安全なパートナーシップを築く上ですごく大事な考え方だと思います。
事実が単に移動を助けるだけじゃなくて、その質自体を変える可能性を秘めているということですね。
そうですね。
ここまでグライドの機能を見てきました。最後にちょっとあなたに考えていただきたい問いかけがあります。
はい、何でしょう。
こうしたグライドのような支援技術は、道を歩くっていう基本的な行為をサポートするのはもちろんですが、それ以外に視覚に障害のある方々の日常生活の中で、他にどんな課題を解決したり、どんな側面を豊かにしたりできる可能性がありますか。
はい、はい、はい、はい。すごいですね、これ。
これ本当にAIが作ったんだっていう感じ。
ふーんとか、はいとか、うんうんとか返事したりとか、うなずいたりとかですね。
なるほどーとか、すごいなこれ。
言ってみたりとかですね。最後、問いかけで終わったりとかですね。
いやー、なんかイントネーションもかなり自然ですしね。
いやー、これはすごいな。これ本当に、えー、これがAIなのかって思いますよね。
えーと、それではちょっとタブを押していきましょうかね。
えーと、しちゃい中かな。
あ、あ、あ、わかりました。
フォーカスモードにして。
えーと、ここで。
こんにちは。今回は視覚障害者向けのスマート歩行支援デバイス、Glideについて。
スタジオプロパティブラウザ音声サイゼロゼロコロン見出しメニューボタン使用不能オリジナルサブメニュー。
ボタンメモを追加。
ボタン学習ガイド。ボタンブリーフィングドキュメント。ボタンよくある質問。
ボタンタイムライン。保存したメモがここに表示されます。
ノートブックLMは不正確なフォーカスモード。
なんかね、ウェーブファイルとかで保存できてもらっていいのかな。
ツールはGlideデモンストレーションコロン使用例とシナリオマイナスノートブック。
えーと、それをやってみようかと思ったんだけど、ちょっとわからなくなっちゃった。
えー、わからない。
質問。ボタンブリーフィングドキュメント。学習ガイド。ボタンメモを追加。
音声再生。音声を再生。ボタン。オーディオプレイヤーに関するその他のオプションを表示。
メニューボタン。折りたたみ。サブメニュー。再生速度を変更。サブメニュー。ダウンロード。
あ、ダウンロード。そうそう、この。すみません、ここでした。
これ、これだ。このダウンロードでエンターを押すと。
スタジオグライドデモンストレーションコロン使用例とシナリオドットワグのダウンロードが完了しました。
そうすると、ウェーブファイルでダウンロードできるんですね。
音声を再生。オーディオプレイヤーに関するその他のオプションを表示。
メニューボタン。折りたたみ。サブメニュー。音声を再生。ボタン。
再生ボタンからシフトタップ一回押すと。
オーディオプレイヤーに関するその他のオプションを表示。再生速度を変更。サブメニュー。ダウンロード。削除。
再生速度を変更。サブメニュー。0.5倍。0.8倍。1.0倍。1.2倍。1.5倍。1.8倍。2.0倍。
スタジオプロパティ音声を再生。オーディオプレイヤーに関するその他のオプションを表示。
そのデモンストレーション映像を元に詳しく見ていきたいと思います。
ユーザーがグライドをどういう風に使ってどんな再現をするのか、その辺りを掘り下げていきましょう。
再生時間のオーディオグライドデモンストレーション。スタジオプロパティページ。
音声再生。24,256音。オーディオプレイヤーに関する音声を再生。
映像を見てくるのは、エイマさんという方で、使い慣れた道を通って近所の重製肉という内容になるようですね。
まず、基本になるのはフリースタイルモードです。
スタジオプロパティページを再生速度ダウンロード。0.5倍。1.1倍。スタジオ音声再生。
設定しない場合、これがデフォルトルトルトルトルの動き方になります。
フリースタイルですか?
ユーザーがこっちに行きたいなと思ったら、それにグライドがついてきてくれるみたいな。
まさにそういう関係性ですね。ユーザーが行き先を決めてみて、グライドが…
こんな感じで止めたり、再生したり、速度を変えたりとかね。
ウェーブファイルにダウンロードできるんでね。好きなプレイヤーで再生したりとか。
ファイルになっちゃったから、そのままポッドキャストにアップしたら、ポッドキャストになっちゃったりとかですね。
これでスパッドキャスト作っちゃおうかなって思っちゃったりしますね。
そんな感じですね。なかなかこれ素晴らしいですね。
ノートブックLMの音声概要という機能。これをご紹介させていただきました。
こういう英語のYouTubeとか、何かのドキュメントとかを会話形式にして聞くと、空いた時間に情報が得られて便利かもしれませんね。
今日はこの辺にしたいと思います。ではまたお会いしましょう。
ではごきげんよう。
21:23

コメント

スクロール