ep78 AI文字おこしツールを使った会議の効率化は、音声と文字を併用した情報整理がカギ
ポッドキャストでもオンライン会議でも便利な、音声からの文字書きおこし。特に会議では、構造化された議事録作成や共有、記憶補完に使えるツールであるFirefliesの実際の使い方に触れながら、音声と文字のうまい組み合わせについて話しました。01:25 Apple Podcastで聞いているエピソードの書きおこしが見られるようになった02:42 Spotifyの文字おこしの見え方:カバーアートの下に大きな文字04:26 音声文字おこしを会議内容のサマライズに使うのは有用07:25 Firefliesの議事録例:会議の発言の要約が読めて、クリックすると詳細が表示・再生される09:33 文字は会議内容を思い出せて検索性もあるが、音声と文字が合わさると話した時の熱量も思い出せる10:20 録画したオンライン会議は見返さない <> 記録しているという安心感11:20 文字おこしと要約の進化:情報が構造化されて整理されることが大事12:07 わずか3年で議事録取りと要約すべてがAIで完結するとは思わなかった14:33 セキュリティ:会議で話されること(秘匿情報)の扱われ方18:39 議事録と記録動画/音声の共有範囲とアクセスコントロールエピソード内で取り上げた情報へのリンク: Apple Podcastにおける書き起こし Fireflies CalendlyとFirefliesを使ったビデオ会議の効率的な運営方法(Fireflies編 - 2024年版)テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。及川卓也 @takoratta プロダクトマネジメントとプロダクト開発組織づくりの専門家 自己紹介エピソード ep1, ep2関信浩 @NobuhiroSeki アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋 自己紹介エピソード ep52上野美香 @mikamika59 マーケティング・プロダクトマネジメントを手掛けるフリーランス 自己紹介エピソード ep53Official X: @x_crossing_ https://x-crossing.com
ep77 映画マトリックスの公開25周年を話題にしていたら、映画で覚えた英語表現がスラスラ出てきた
革新的な映像表現で一世を風靡した映画「マトリックス」が公開から25年。記憶に残る表現から、今になって気づいたものまでを徒然に話しました0:46 映画「マトリックス」が25周年04:25 マトリックスで覚えた英語表現:Gotcha05:28 普段書いているプログラムの世界に入っていく感じを映像化した衝撃06:05 マトリックスで覚えた英語表現:I'm in06:51 特殊なカメラワークを支えていたのはカーネギーメロンのテクノロジー08:01 IMAXレーザー再上映で初めて知ったこと:冒頭の緑文字の滝の後ろに、もう一つダークグレイの文字の滝があった(!)10:07 文字を上から下に流すという発想のユニークさと落ちゲー12:04 みんなが知っている象徴的なシーン(赤いピルと青いピル))をプレゼンで使いたい13:05 マトリックスに影響している攻殻機動隊はさらにすごい13:26 今度5作目を作るらしいが、もういいんじゃないか14:23 1作目は(続編など考えていないから)まとまりもテンポも良く完結しているテック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。及川卓也 @takoratta プロダクトマネジメントとプロダクト開発組織づくりの専門家 自己紹介エピソード ep1, ep2関信浩 @NobuhiroSeki アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋 自己紹介エピソード ep52上野美香 @mikamika59 マーケティング・プロダクトマネジメントを手掛けるフリーランス 自己紹介エピソード ep53Official X: @x_crossing_ https://x-crossing.com
ep76 全会話を録音するウェアラブルLimitless Pendantが開く、生成AIの可能性とプライバシー問題
ウェアラブル生成AI端末AI Pinにより、どこでもAIに質問できるように。全会話を録音し、検索できる製品も今年末に登場。スマホで気軽に録画できる時代に、会話のプライバシーをどう変わるのか00:41 スーパー・ニンテンドー・ワールドが開業3周年00:58 マリオカートに7000回(!)乗った人03:24 スーパーニンテンドーワールドに週5で通っている女性05:46 寝坊してXCrossingの収録を飛ばしスライディング土下座07:49 Ai Pinの発表、英語での記事、日本語記事のそれぞれのタイミング11:24 新しいガジェットAi Pinはどういう製品?12:06 もう一つの新しいAIガジェットRewind Pendant(4/15にLimitless Pendantに名称変更)14:27 会話相手が話していることも記録するのか?プライバシーの問題は?16:00 許諾無いまま取得するデータはどう扱われるのか、どうやって許諾をとるのか17:17 (AIに学習させるという側面で)独自のコンテンツには価値があるが、マネタイズや法整備は追いついていない20:16 「わたしたちの会話はすべて録音されています」というガジェットつけていたら話すことが7割減になりそう20:49 スイッチオフにしてオフレコを明示的に行うプロトコルが生まれる可能性23:44 カメラ付き携帯電話が出た前後で写真に撮られるという敷居が下がったが、音声もそうなる?エピソード内で取り上げた情報へのリンク: USJ任天堂エリア3周年(日経記事) Ai Pin(日経記事) Ai Pin プロダクト公式サイト Rewind Pendant (4/15にLimitless Pendantに名称変更)テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。及川卓也 @takoratta プロダクトマネジメントとプロダクト開発組織づくりの専門家 自己紹介エピソード ep1, ep2関信浩 @NobuhiroSeki アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋 自己紹介エピソード ep52上野美香 @mikamika59 マーケティング・プロダクトマネジメントを手掛けるフリーランス 自己紹介エピソード ep53Official X: @x_crossing_ https://x-crossing.com
ep75 「他人がやるゲームを観るだけで何が楽しいの?」 ― デジタル体験が進化して変わるゲームの楽しみ方
ゲームのデジタル化が進み、スポーツのように、プレイヤーに加えて「観客」も「実況」を楽しめるようなった。一方で、観る側がプレイヤーにより近づくハプティクスやイマーシブ体験も進化している00:51 ハプティクスを体験するためにFinal Fantasy XVIをプレイした04:21 ゲーム実況を見るのと、スポーツ観戦の共通点08:45 ハプティクスは(ゲーム実況では)シェアできないので自分で体験しないと分からない09:50 お金の流れがコンテンツを売る人から実況する人へ移っていく11:54 Google Mapsを使ったゲーム「GeoGuessr」13:31 世界中のある場所の写真から、国を判別できる変態的にスゴイ視点が面白い17:44 交通標識、電柱、植物、光の方向、車のミラーの付き方などへの着眼点18:33 カードゲーム「テレパシ」の「見ない、聞かない、話さない」のどれかでコミュニケーション20:29 コミュニケーションするときに頼っているもの25:03 脱出ゲームや新宿のアノマリー・クエストと、イマーシブ・フォート東京の体験は違う?27:40 テーマパークとイマーシブ・フォート東京はどう違う?記事や写真では分からない31:05 ケニアのストリートビューカーには「シュノーケル」が付いているリンク FF16のハプティクスがすごいらしい、について話した回(ep73) GeoGuessr - RTA in Japan Summer 2023(世界マップ) GeoGuessr - RTA in Japan Summer 2022(日本マップ) GeoGuessr テレパシ ソードアート・オンライン -アノマリー・クエスト イマーシブ・フォート東京テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。及川卓也 @takoratta プロダクトマネジメントとプロダクト開発組織づくりの専門家 自己紹介エピソード ep1, ep2関信浩 @NobuhiroSeki アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋 自己紹介エピソード ep52上野美香 @mikamika59 マーケティング・プロダクトマネジメントを手掛けるフリーランス 自己紹介エピソード ep53Official X: @x_crossing_ https://x-crossing.com
ep74 イベントは、主催する側にも、参加する側にも、まだまだ改善したいところがある
イベントに参加する立場だと、例えばチケットぴあの「発券は別サービス」は不便と感じる。しかし主催する側に回ると参加者とは別の懸念が出てくるもの。イベント企画経験者ならではの視点も交えていろいろと話しました01:35 オフライン・イベントを地理的に離れた場所からアレンジするときのコツ04:37 マリオカートの超シンプルな3つのルールでさえ覚えていられない05:19 事前に提供されている情報をまったく読まずに当日聞いてくる人向けの対応08:13 チケットぴあと、なぜか別だったチケット発券を担うサービス「Cloak」が統合09:34 サービス提供者側の便利と理論は、時としてユーザーにとっては不便でしかない11:01 スマホチケットと転売対策と(大多数のユーザーにとっての)使いにくさ11:36 発券されたチケットや入館証を扱うプラットフォーム15:07 スマホやPCをシームレスに移動して本人認証できるサービスが増えた16:51 カスタマーサポートの問い合わせIDが管理されていても、ユーザーにとっては都度、担当者が変わると戸惑ったり不便になる20:19 リアル店舗での買い物体験の変化:店員さんに相談して買いたいという機会が減っている22:37 情報が多すぎるのと、自分がほしいタイミングまでは考慮してくれないネット上の情報テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。及川卓也 @takoratta プロダクトマネジメントとプロダクト開発組織づくりの専門家 自己紹介エピソード ep1, ep2関信浩 @NobuhiroSeki アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋 自己紹介エピソード ep52上野美香 @mikamika59 マーケティング・プロダクトマネジメントを手掛けるフリーランス 自己紹介エピソード ep53Official X: @x_crossing_https://x-crossing.com
ep73 Final Fantasy XVIの触覚表現はスゴいという話から、ハードを生かすソフトウェアの話で盛り上がる
ハンドトラッキングやハプティクス(触覚)など、「体験」を変革する技術に惹かれ、さまざまなガジェットを試してきた3人。後半はガジェットの進化に欠かせないソフトウェアの話に01:07 SHUREのワイヤレスピンマイクMOVEMICがよさげ03:00 レシーバー不要、スマホと直接接続、環境音がうるさくても話者の声を集音09:01 一眼レフカメラやPCで撮影・録音するときはレシーバー付きで12:51 昔話題になったLeap Motionを買って使ってみた結果…18:09 ハンドトラッキングの精度とフィードバックと音19:16 ファイナルファンタジー16のハプティクス(触覚)表現がどれだけすごいかを語る研究者20:18 サウンドエンジニアがハプティクス調整21:57 触覚表現の定義:過去の記憶や経験、身体感覚を創発するもの23:31 ソフトウエアを良くするとハードウエアの表現が劇的に変わる(のに、そこに投資されない)25:22 ソフトウエアには「手触り感がない」?27:25 ソフトウエアが可能にするもの vs ハードウエアが実現していると思う人29:39 ゲームコントローラーに耳を当てて触覚を”聞く”研究者31:15 人間に直接作用するにはすべてをアナログにする必要がある32:34 ソフトウエアに遅れをとってUXが進化しない日本企業?36:37 ロボットとハプティクスと技能承継40:35 寿司ロボットのすごい進化エピソード内で取り上げた情報へのリンク: SHURE MOVEMIC DJI MIC Leap Motion 2 FF16の触覚表現がすごい、というお話テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。及川卓也 @takoratta プロダクトマネジメントとプロダクト開発組織づくりの専門家 自己紹介エピソード ep1, ep2関信浩 @NobuhiroSeki アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋 自己紹介エピソード ep52上野美香 @mikamika59 マーケティング・プロダクトマネジメントを手掛けるフリーランス 自己紹介エピソード ep53Official X: @x_crossing_ https://x-crossing.com
ep72 ポッドキャストツール「LISTEN」の有料版を使い始めてみて、改めて音声と文字の関係を考えてみた
専用ツールより性能が高いので、LISTEN有料版を文字起こしツールとして使ってみている話から、文字と音声とリアルで得られる情報の違いなどを話しました00:54 ポッドキャストサービス「LISTEN」を有料版で使用中02:15 B2B向けの会議音声文字起こしサービスよりもLISTENのほうが良いクオリティ03:04 利用ユーザーからフィードバックを得て猛烈な勢いでクオリティが良くなっているB2Cサービスのいい例04:30 文字起こし自体の精度向上、話者分離、Whisperの使いこなし07:51 日本語と英語が混ざった話になっても、英単語として文字起こしされている08:31 文字起こしの冒頭に「今回の話題は●●です、文字起こしには以下の登録済み単語を優先してください」09:40 文字起こしする段階でメタデータをしっかり入れておくことで精度を高めているのでは11:05 話されていることの内容と理屈が通っていつつ、抽象的で一般化できそうな見出しがついている13:11 目で見る・目で読むものと、耳で聞くという使い分け17:27 音で情報を取得するほうが人間にとっては自然で負担が少ないらしい20:09 言語の習得は音から入るほうがいいよという研究結果22:40 顧客インタビューでは、言いよどんだり、スピード速くなったりするときはそこに何が意味がある27:16 コミュニティとして広がるポテンシャルを持つ「LISTEN」28:22 mixi 20周年:”人がいないからいいエピソード内で取り上げた情報へのリンク: ポッドキャストサービス「LISTEN」 LISTEN開発者 近藤さんをゲストにお迎えして語り合った回(ep37) 「audiobook.jp」で実現する「聴く文化」の創造!学習にも娯楽にも活用できるオーディオブックとは 多言語の習得は「音」から 脳領域特定、文法理解早く 約7割の人は「目」より「耳」からのインプットが得意 企業の人材育成における、学習手段の「格差」の問題点テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。及川卓也 @takoratta プロダクトマネジメントとプロダクト開発組織づくりの専門家 自己紹介エピソード ep1, ep2関信浩 @NobuhiroSeki アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋 自己紹介エピソード ep52上野美香 @mikamika59 マーケティング・プロダクトマネジメントを手掛けるフリーランス 自己紹介エピソード ep53@x_crossing_https://x-crossing.com
ep71 ミュージカル「ジョジョ」や「ハリー・ポッター」に見る舞台装置のテクノロジー進化の光と影
舞台装置や演出テクノロジーの進化が止まらない。「ハリー・ポッターと呪いの子」のように、世界各地でロングランを誇る舞台の演出は目を見張る。一方で公演ドタキャンの原因になってしまうことも02:04 舞台「ジョジョの奇妙な冒険」が公演初日から7公演分が中止になった(理由:準備不足で)05:32 チケット代の払い戻しのみならず、宿泊費や交通費も補填08:12 舞台を見た人曰く、人の動き、舞台装置、技術的演出、音楽の使い方など凝っていたらしい08:36 舞台『ハリー・ポッターと呪いの子』を観た時の衝撃 − 舞台芸術の表現がここまでひろがっているのかと感動09:39 技術がうまく使われることで、デジタルな世界でしかできなかった表現がリアルな舞台でも表現できるように11:04 野村萬斎さんとライゾマティクスによる、伝統芸能と最新テクノロジーの実験的なコラボ舞台11:36 技術は黒子で、ストーリーと世界観を伝えることに主眼があるのがハリーポッターの舞台14:22 JKローリングが書いたシナリオで、ロンドンのチームが制作・デザイン16:12 あらゆる表現と技術を駆使 − 最新技術の演出、従来の手品トリック系の演出、人間の身体の動き、音楽、衣装の美しさ18:18 人が演じる舞台はあれ以上表現が広がることはないと思っていたが、技術を活用することでもっと拡張する可能性がある19:54 技術を取り入れた舞台芸術では、人の表現よりも技術のほうが勝ってしまいがち22:18 「そんな大げさな」と思っていた舞台ハリーポッターの宣伝文句22:56 世界の演出の差分があるかどうか見てみたい25:11 使われてるマイクは直径3mm、サウンドデザイナーはロンドン五輪の音響を手がけた人リンク: ミュージカル『ジョジョの奇妙な冒険 ファントムブラッド』一部公演中止に関するお詫びとお知らせ 舞台『ハリー・ポッターと呪いの子』 舞台 ハリーポッターの予告動画 CORE 6000 "サブミニチュア・マイクロホン"テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。及川卓也 @takorattaプロダクトマネジメントとプロダクト開発組織づくりの専門家自己紹介エピソード ep1, ep2 関信浩 @NobuhiroSekiアメリカ・ニューヨークでスタートアップ投資を行う、何でも屋自己紹介エピソード ep52上野美香 @mikamika59 マーケティング・プロダクトマネジメントを手掛けるフリーランス 自己紹介エピソード ep53@x_crossing_https://x-crossing.com
ep70 「表情」と「声」が食い違ったときに覚える違和感の正体は?
コミュニケーションする上で「表情」や「声」が果たす役割は多い。また文化の差により、同じ表現でも、受け止め方がまったく異なってしまうことも01:30 ゲーム中のキャラクターの顔のキャプチャと声のあて方のパターン02:10 実在の俳優をキャプチャし本人が声をあてているのに、声が浮いていると思うことがあるのはなぜか、を考察してみる04:46 CGで作られた顔の動きの制限をカバーしてストーリーに引き込む声の演技06:06 話す言葉に乗ってくる感情と情景08:17 ビデオ会議で気になるノイズは背景の環境音か人の声か10:12 NTTの大規模言語モデル「tsuzumi」では、AIが人の声色や声に乗っている感情を理解するらしい12:26 声に乗るものを理解するには、言語や地域で異なる文化的なコンテキストを高度に理解する必要がある13:21 満足度調査やNPSで、日本人は低い値が出がち17:03 アメリカ人上司は注意したのに、面談したフランス人の部下は褒められたと喜んだのはなぜか22:55 「笑い」は共通の文化的コンテキストがないとなかなか難しい23:46 同じ英語圏でもイギリスの笑いのポイントはアメリカ人には伝わらない28:48 HoloLensの開発者の指摘:3D空間での設計では音を大事にするべき30:50 片耳が聞こえない時、行方不明のガジェットを音で探す時に位置が分からなかったエピソード内で取り上げた情報へのリンク:ロボットが人間に嫌われる「不気味の谷」が証明される:研究結果NTT版大規模言語モデル「tsuzumi」異文化理解力――相手と自分の真意がわかる ビジネスパーソン必須の教養(書籍)
ep70 「表情」と「声」が食い違ったときに覚える違和感の正体は?
コミュニケーションする上で「表情」や「声」が果たす役割は多い。また文化の差により、同じ表現でも、受け止め方がまったく異なってしまうことも01:30 ゲーム中のキャラクターの顔のキャプチャと声のあて方のパターン02:10 実在の俳優をキャプチャし本人が声をあてているのに、声が浮いていると思うことがあるのはなぜか、を考察してみる04:46 CGで作られた顔の動きの制限をカバーしてストーリーに引き込む声の演技06:06 話す言葉に乗ってくる感情と情景08:17 ビデオ会議で気になるノイズは背景の環境音か人の声か10:12 NTTの大規模言語モデル「tsuzumi」では、AIが人の声色や声に乗っている感情を理解するらしい12:26 声に乗るものを理解するには、言語や地域で異なる文化的なコンテキストを高度に理解する必要がある13:21 満足度調査やNPSで、日本人は低い値が出がち17:03 アメリカ人上司は注意したのに、面談したフランス人の部下は褒められたと喜んだのはなぜか22:55 「笑い」は共通の文化的コンテキストがないとなかなか難しい23:46 同じ英語圏でもイギリスの笑いのポイントはアメリカ人には伝わらない28:48 HoloLensの開発者の指摘:3D空間での設計では音を大事にするべき30:50 片耳が聞こえない時、行方不明のガジェットを音で探す時に位置が分からなかったエピソード内で取り上げた情報へのリンク: ロボットが人間に嫌われる「不気味の谷」が証明される:研究結果 NTT版大規模言語モデル「tsuzumi」 異文化理解力――相手と自分の真意がわかる ビジネスパーソン必須の教養(書籍)テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。及川卓也 @takoratta プロダクトマネジメントとプロダクト開発組織づくりの専門家 自己紹介エピソード ep1, ep2関信浩 @NobuhiroSeki アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋 自己紹介エピソード ep52上野美香 @mikamika59 マーケティング・プロダクトマネジメントを手掛けるフリーランス 自己紹介エピソード ep53Official X: @x_crossing_ https://x-crossing.com