1. となりのデータ分析屋さん
  2. 60. 後発で検索エンジンでなぜ..
2024-04-17 22:48

60. 後発で検索エンジンでなぜ勝てた?Googleの検索アルゴリズムのカラクリ【渋谷】

Google本社は渋谷にあるよ。ご飯もついてるんだって。羨ましいね。なんでそんな凄い会社になったんだろうね。ご飯が美味しいからかな。違うよ、ネットワークサイエンスでめっちゃ使われるページランクがすごかったからだよ。


番組の感想や、質問はXから「⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠#となりの分析屋⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠」もしくは、以下おたよりフォームからお寄せください! ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://forms.gle/1Qq3cfqYgVXgs5Qr6⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠


=========================

本田技研工業が手掛けた位置情報を活用した新しいポッドキャスト配信アプリ「

」でも配信中! 【PR】sponsored by:RoadVoice


========================= ▼りょっち 第3回Japan Podcast Awards受賞Podcast「⁠⁠⁠⁠⁠佐々木亮の宇宙ばなし⁠⁠⁠⁠⁠」はこちら! X (⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠@_ryo_astro⁠⁠⁠⁠⁠⁠) Instagram (⁠@ryo_astro⁠⁠⁠⁠⁠) ▼たっちゃん X (⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠@⁠⁠⁠⁠⁠tatsuki_2022⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠)

サマリー

Googleは渋谷にオフィスを構え、ネットワークサイエンスの要素を取り入れた検索エンジンのアルゴリズムにより世界の覇権を握った後発の企業です。渋谷は日本のシリコンバレーとして他のテクノロジー企業も集まり、再開発によりますます注目を集めています。Googleの広告収入構造がブレイブという新しいブラウザーによって脅かされていることが明らかになりました。Appleがブレイブを推奨ブラウザーとして使用することで、Googleの収益源が変わっていく可能性があります。なぜ後発で検索エンジンで勝てたのか、それはGoogleの検索アルゴリズムのカラクリにあります。

Googleのオフィスと渋谷のシリコンバレー
Ladies and gentlemen, welcome to Google.
ようこそGoogleへ。私がGoogleです。
OK Google。
ということで、渋谷にオフィスを構えるGoogle様。
普通にすごくねって。Googleはすごいですよ。
Google何がすごいかっていうと、多分みんな知らないけど、検索エンジンすごいんだよ。
まあ、検索エンジンのイメージですよね、Googleは。
その中でも、このポッドキャストで繰り返し紹介してるネットワークサイエンスの要素が実は組み込まれてる。
しかもそれのおかげで、Googleはこの世界の覇権を握ったと言っても過言ではないみたいな。
日本のシリコンバレーにも来たと。
日本のシリコンバレーというよりは、もうシリコンバレーです。東京のシリコンバレーとか言い始めるから、そのうち。渋谷のシリコンバレーみたいな。
それが渋谷ね。渋谷のシリコンバレーだからあそこらへん。光江ぐらい。ストリームとかあそこらへんが渋谷のシリコンバレー。
日本のシリコンバレーであり渋谷のシリコンバレーであり。シリコンバレーオブシリコンバレー。
シリコンバレーにもシリコンバレーがあるかもしれない。
もういいっすよ。
ということで、今日はGoogleの話をさせていただきたいと思います。最後まで楽しんでください。どうぞ。
隣のデータ分析屋さん。
この番組は隣の席に知らないことを気軽に聞けるデータ分析屋さんがいたらいいなぁをかなえるポッドキャストチャンネルです。
データアナリストのりょっちです。
データサイエンディストのたっちゃんです。
Googleってすごくない?
Googleってすごいですよ。
Googleってすごいよね。入りたいよね。
入りたいですね。確かに。
入れてくれるのかな。
なんか社員職場のタダとか。
いいなぁ。正直あれじゃない?出社のお金かかるのの8割ぐらいって食費じゃない?
確かに。昼飯がね。
そうだよね。なんかちょっとジュース買わなきゃいけないとかと食費だよね。
食費だね。
食費浮いたら永遠に働いちゃうよね。
そうだね。
なるほどね。いい会社だなぁ。
そこじゃないと思うけどね。
いいなぁ。飯食わせてほしいなぁ。
Googleの話を今日はしていこうかなっていうので。
Google紹介する理由いろいろあって。
なんでかっていうと、まずネットワークサイエンスの話、このポッドキャストで割と好評じゃない?
ネットワークサイエンスの要素とページランクのアルゴリズム
ネットワークサイエンス的なアプローチががっつり使われてるからGoogleって勝ってるみたいな。
っていう話と、あとは単純にそれがそのままSEOってやつに関わってくるとかで。
検索のランキングの話?
検索エンジンオプティミゼーションね。
そうなんだ。
検索エンジン最適化っていうようになってて。
そこを今までなんか結構俺はハックしてきた感じもあるから。
ポッドキャストも検索をGoogleとかで学んだことをポッドキャストに活かしてるから、このポッドキャストの検索理由にめっちゃでかいし。
宇宙話なんてフォローしてる人より検索で入ってくる人の方が最近倍ぐらいいるから。
それすごいですよね。
そのSEOとかって言葉になる大前提でGoogleがなんで検索エンジンとして勝ち上がったのかみたいな話を今日はしようかなっていう。
なるほどですね。いいっすね。
だからGoogleすごいよねっていう話じゃない?
Googleのすごいさはあれじゃないですか。渋谷にでっけえオフィスあるからじゃないですか。
渋谷のでっけえオフィスある情報筋によるとGoogleが入ることによって建物の宣伝になるからちょっと家賃が安くなったっていう噂があるよ。
そうなんすか。確かに渋谷の光江川?宮増坂の出口の階段なのにようこそみたいな、ウェルカムグーグルみたいな。
そんな書いてある?
書いてる書いてる。
見てないな。
いやそうなの。集客効果はそれだけある。
あそこのなんか建物作った某会社がGoogleさんが入ってくれるならみたいな。
そうなんだ。
前どこだっけ?東京駅とかだった?
いや六本木にオフィスあってヒルズかな。
でももともと2000年ぐらいはGoogleがそれこそアメリカから来た時は最初渋谷に本社構えて。
そうなの?
いわゆるインターネット時代があったじゃないですか。2000年頃から。
はいはいはい。
あの時代は本当に渋谷がそういうインターネット企業GMOとかが渋谷にわーって。
今もあるもんね。そこら辺の会社基本渋谷に。
そうそう。なんだけど渋谷の再開発あって、あれ単純にオフィスがもうパンパンであふれちゃって。
あーまあそうだよね。
渋谷で仕事できないってなったから各企業が東京のいろんなところにバラバラになって。
あそういうこと?
そう。
一回散らされたんだ。
で、また今回の再開発でやっぱり渋谷を日本のシリコンバレーにしようみたいな。
出た。
っていうデベロッパーとかの。
世界中に何個丸々のシリコンバレーってなんだろうね。
そうそう。
で、ちゃんとオフィスビルを作って、企業を集めて、Googleもそうだし、サイバーとかも渋谷にいるし。
DNAもいたりとか。いわゆるテクノロジーの企業が。
テクトック光江だもんね。
っていう、またIT企業を渋谷へ呼び戻そうでできたっていう。
へー。
日本のシリコンバレー。
そういうことらしいですよ。
なんかあれだよね。東京駅側と渋谷側って働いてる人の属性なんか違うよね。
あー違うね。
俺なんかよく聞くそのさ、なんかサラリーマンの、なんていうの、どんな会社で働いてるみたいなさ、合コンでのキラーワードみたいな。
なんか聞くやつとかすごいなーと思って。渋谷近辺にそんなのないよなーみたいな。
俺ずっと渋谷でしか働いたことないから。
まあ確かにそうか。
なんか不思議な感覚。
まあなんかスーツ着てる会社員がいるのが東京駅のイメージですね。丸の内とか。
堀堂街行くんでしょ?それで。
そうそうそう。自分バイトしてたからわかりますよ、あの感覚。
え?堀堂街でバイトしてたの?
堀堂街の手前のスキー屋橋の交差点の1階にあるビールレストランみたいなところでバイトしてて。
えー。
で、金曜日とかは東京駅側から流れてくる有楽町駅から流れて堀堂に行く途中のお客さんを僕らがキャッチして入れるみたいな。
へー。
そう、あのなんか。
鼻の下全員こんなじゃん。
そうそうそうそう。
5メートルぐらいになってる。
で、もしくは堀堂で敗れた人たちがまた飯食いに来るみたいな。
あーいい場所だなそれ。
いい場所でやってたからわかりますね。
あ、捕まえられた人たちは来ないんだ。
あ、捕まえられた人たちは来ないね。
うん、そんな店には来ない。
そんな店には来ない。もっとちょっといかがらしい方に行っちゃうんじゃない?
なるほどね。
そう、ならまあ、じゃあGoogleの人は行ってないのかな、堀堂街。
てか渋谷の会社員はみんなパーカーとか着て仕事してるイメージやね。
確かにね。
スニーカーパーカージーパンみたいな。
スニーカーパーカージーパンでこれとか言っちゃダメだ。
言っちゃダメだね。1ミリも持てないと思うわ。
スーツだ。
スーツスーツ。
確かにな。
まあいいや、Googleの話しましょうか。
しましょう。
で、Google、そのネットワークサイエンスめっちゃ組み込まれてたんだよっていう。
それが独自性だったっていう話をしていくのが今回のメインで。
だからこうおさらい的に話すと、もうネットワークサイエンスの話って4回ぐらいした?
してるね。いろんなところで学会参加とか、本の紹介とか。
したよね。成功者の秘訣みたいな。
そうだね。
で、そのネットワークサイエンス、簡単に言うと、もう何かの情報を点として、
で、その情報と情報の関係性を線で結ぶみたいな。
なってるのがネットワークサイエンスのざっくりとした表し方。
それがバーって繋がってる。
人間の関係性、友達の関係性とかでやると、
6人繋がったら、平均6人繋がれば世界中誰とでも繋がれるみたいな話とか、
この間話したベーコンの話とか。
コラックルオブベーコンっていうね。
っていう話とか、いろいろあると。
Googleの後発と世界の覇権
で、そんな中で、Googleは結構検索エンジンとして後発へ出てきたのに、
そのネットワークサイエンスのページランクっていうアルゴリズムを開発して、
それによって世界の覇権を握ったって言われてて。
後発なんだ、そもそもGoogleは。
後発、後発。
Googleが出た時ですら、もう世界中にいろんなこう、
もちろんその時インターネットエクスプローラーとかも多分あるし、
他にも多分、他にもなんかいろいろ。
やっとるとかもあるよね。
あると思う。
し、あとなんか日本に特化したブラウザーとかも当時はあったらしいね。
あ、そうだったっけ。
ワードとかエクセルで言うところの市太郎的なやつ。
えー、もう覚えてないな。
市太郎ピンときてない?
市太郎はわかる。
市太郎スマイルみたいな。
市太郎スマイルから市太郎に変わるじゃん。
小学校のパソコンの授業で。
あ、そうだったっけ。
あ、そっか。
多分ね。
市太郎は覚えてるけど。
あの時代はまだだから、マイクロソフトがワードで世界を接近するとかの前だし、
インターネットの検索エンジンもまだなんかこう各国とか各地方で流行ってるものがあるみたいな状態になってるところから、
Googleが後から入ってきて、検索エンジンに革命を与えたみたいな。
Googleの検索アルゴリズムのカラクリ
で、なんかそれまでの検索エンジンって、例えばなんだろうな、データサイエンス、その当時はないけど、
データサイエンス系のページを見つけたいってなるとするじゃん。
そうしたら、データサイエンスってとにかく文字数が入ってれば入ってるほど勝てるみたいな。
例えばシンプルに。
だって、例えばデータサイエンスの記事見つけたいってなったら、それはデータサイエンスいっぱい含まれてるページの方がそれっぽいじゃん。
けど、それが分かった瞬間に、なんか無駄に主語これとか言わないで全部データサイエンスとかって言うでしょ。
確かにね。
言うし、あとはなんかそのウェブページの全く関係ない画像の裏とかに死ぬほどそういう単語を入れるっていうハックとかもあるのよ。
なるほどね。そっか、できるか。
そう、サーチエンジンを最適化するっていうハック方法の一つに実はそういうのもあるのよ。
そっかそっか、表に出てる情報だけじゃなくて、裏にあるシステムとかにもファイル名とかで入れ込んじゃうんだ。
そうそうそうそう。画像とかにもさ、オルトとかなんかいろいろあるじゃん。
あるね、HTMLの情報入れるところが。
ああいうところにもとにかく入れまくったりするみたいな。
面白い。
っていうのがあったんだけど、それだとやっぱなんかクソみたいなサイトがいっぱい上位に上がるじゃん。
で、Googleが後から入ってきて、何をこう検討したかっていうと、論文の引用みたいな感じの検索エンジンにすればいいんじゃねっていうのを提案してきた。
なるほど。論文の引用。
そう。どういうことかっていうと、論文って超すごい誰もが引用したくなるような実験とか研究結果とかを出した人って、例えば1000とかサイテーションがつく。
引用されるってことね。
引用数が。
はい。
で、その論文って絶対すごいじゃん。
すごいね。みんなそれをもとに、次はこういう方法でやったっていうそのなんか基本となるところを抑えたってことだよね。
そうそうそう。
っていう関係性がある。
で、じゃあその論文を引用した論文がさらにまた1000人に引用されたとかってなったら、その1000人に引用された2個目に出てきた論文もすごいけど、この論文のベースになってるこいつもめっちゃすごいじゃん。
うん、すごい。
っていうので、この論文がどれだけすごいかっていうのは、この引用数で一定決まるっていう。
確かにね。
で、今の話してたこの関係性をそのまんまネットワーク上に書いてあげると、そのウェブページってリンクとか貼れるじゃない。
だから参考にしたウェブページのリンクを誰かが貼ると、そのページから元のページに対して矢印が飛んでいく。線が繋がる。
今の話でいうと、ネットワークの中の点がウェブページで、関係性がリンク。
で、それがもうインターネットっていう、ネットっていうぐらいだから、それがブワーっと無限の世界に広がってる状態。
あー、なるほどね。
で、それで欲しいワードを検索したときに、そのワードが含まれているウェブページとかの中で、ページランクが一番でかいものを優先的に表示してあげるっていうのがGoogleがチャレンジした。
おー、なんか理にかなってる感じがするわ。
みんなが見たいページを優先的に出してあげるってことだよね。
最終的に満足感的にはそうなるんだけど、見たいの出てくれたってなるんだけど、みんながウェブページで、いやこのページが最高だったって言ってるやつを一番上に出したい。
あー、なるほどね。人気者を出すみたいな。
今までは文字数だけで表現してたとかの世界で、いろんなルールでやってたけど、その非リンクされる率っていうのが結構検索の上位に引っかかるためにめっちゃ必要なこと。
これが革新的すぎて、Googleの検索エンジン最高じゃねって上がってった理由になってる。
実際に使ってる人がGoogleのアルゴリズムで検索してみると、なんかいい感じの出てくるじゃんってことになってたことですよね。
満足度が高いってことか。
無限にあるウェブページの中からどうやって検索っていう行為を助けてくれるかっていうところにそれぞれの会社の強みが出てくるわけじゃん。
確かにね。
っていうのでGoogleの検索は、そのページランクっていうのが一番最初に出てきたのが一個でかいポイントだったっていう。
なるほど。納得感はあるけど、それで本当に満足なものがちゃんと出るのかっていうのがなんか。
もちろんね、今までのインターネットの探索の仕方とかとの差分があって、めっちゃ例えば検索結果が早く出るとか。
その名残でGoogleの検索って検索したときに上に検索時間何秒とかレレレレレレレレみたいな出るじゃん。
確かに確かに。
あれはなんか俺すげーべーみたいなのを漕じしてるときの名残。
そうなんだ。
で、なおかつ的確なやつが出てくるみたいな。
待って、そんな一瞬で出てくるウェブページゴミみたいなやつだったらさすがに使わないから。
その検索のクオリティと検索のウェブページを探索するスピードみたいなところをしっかりと担保したGoogleがその当時を圧勝していったと。
Googleのアルゴリズムの革新的な要素
名前にあるそのページランクっていうのはまさにその引用のランキングみたいなのを裏で作ってるってこと。
そうそうそうそう。
検索の窓に入れたキーワードがあって、そのキーワードにひも付くまず集団をわーっと探してくると。
見つけてきた集団の中でさっきの引用のとかのランキングをバーっと出して上位から順番に出すみたいな。
そういうイメージ。
そういうことか。
だからそれのせいでこのSEO最適化みたいな仕事が一時期さ、たぶん今って結構衰退してる業界なんだと思うんだけど、
それをやるために例えばちゃんとリンクを持ってきてもらえるような記事作りしましょうとか、
ウェブサイトとかもリンクされてるほうがすごいから、
例えば政府の覚書みたいなのがバーンって出たときにその覚書みたいなやつをリンクで貼って紹介してるページとかがたくさん増えたら、
政府のそのページとかは良くなるし、そもそも政府のページのほうが優先で出るようになってるらしいんだけど、
あと検索優遇されるのはお金の話と命の話みたいな。
それはGoogleがそういうのを先に出そうとしてるってこと?
そこのしかも検索アルゴリズムはハックがめちゃめちゃできないような固い仕様になってたりするらしい。
そういうのなんかあるんだ。
デマの情報が流れたときに異常に損をする人とか、
例えば健康を害する人とか、
最悪死に至るケースみたいな。
なるほどね。
に繋がりそうなものはめちゃめちゃ丁寧に扱いますよみたいなのがあるらしくて。
Googleから見ると恣意的に情報の取捨選択ができる。
といえばできるのか。
Googleの検索エンジンの信頼性
検索に別に平等とか自由っていう概念必要ないといえばない。
まあないんじゃないね。
例えばやってないとは思うけど、
Googleが出資してる会社のページを優先的に表示するとか。
できるよね。
できるじゃん。
これがたまにこのポッドキャストの10回に1回ぐらいのWeb3の話するけど、
ああいう世界での不満に繋がってるというか。
中央集計みたいな。
あの人たちが公平にやってくれてるとは思ってるけど、
それが公平じゃなかった時に俺らの生活大丈夫なのみたいな。
まあそうだね。
ってなるじゃん。
そこを懸念してWeb3とかクリプトの世界っていうのは広がってるんだけど、
でもある程度検索エンジンの信憑性というか信頼度っていうのは引き続きずっと担保されてるかなっていうか。
そうだよね。
それもバカじゃないからなんかこの検索サービスなんかちょっと嫌な感じの情報出してくるなとか思って離れるしね。
でなんか今収録してるのが3月半ばなわけじゃん。
この間ね、俺も詳しい話ちょっとあんま覚えてないんだけど、
Appleのデフォルトの検索なのか、なんかこうおすすめブラウザーみたいな感じで、
ブレイブがバンって出たらしくて。
ブレイブってひたすら広告を削除できる能力があるじゃん。
あとなんかトークンももらえるみたいな。
トークンもらえるね。
そう。
で、あのブレイブをなんかこう推奨ブラウザーとしてAppleが出したみたいなニュースが。
あ、そうなんだ。
あれフェイクニュースなのかな。
でもなんかそれでブレイブのユーザー数が今激増しているっていう話があって。
はいはい。
Googleの広告収入の脅威
で、だからGoogleって結局収益構造として広告の割合がめっちゃ高いらしいのね。
YouTubeの広告もそうだし、検索に出てくる広告もそうだしっていうので、
Googleアドバタイズとかあるじゃん。
っていうのがこう重要な収益源になってるんだけど、
それを弾くというか、
っていうので多分ブレイブってめちゃめちゃ目の敵というか最悪な存在だと思われてるはずなのよ。
はいはい。
Googleからすると。
だからそれをAppleが。
なんかね、推してるのはそういう構造なのか。
Appleは別に広告収入の会社じゃないわけだから。
そうそう、あそこは物理プロダクトの会社じゃん。
相性はいいのか。
そう。
っていうので、なんかこう検索性能だけじゃなくて、
さっき言ってたクオリティとか使い心地とか、
なんかこう訂正的なところにアプローチするように、
ブレイブみたいな新しいの出てきてるから、
検索エンジンの性力図がこれから変わっていく。
まあそうだね。
でもまあ一時を支配したのはGoogleだったってことですね。
まあそうだね。
それがページランクっていう仕組みと。
ちなみに、俺がもうハックしきってるなっていう
あのポッドキャストのSEOについては、
これはね、多分大体の確率で初期のウェブサイトと同じ感じ。
カウントベースってこと?
カウントベース。
ああ、まあそうか。
シンプルだもんね。
そんな感じがする。
じゃあうちのアートワークの裏にめちゃめちゃデータとかやってきます?
画像はね、多分ね、検索にあんま入ってないっぽい。
エピソードの中で喋ってるワードとか
多分ちょっと読まれてるっぽいし。
ああ、そうか。
あとは概要欄とタイトル。
そうだね。タイトルは結構気をつけて考えてますもんね。
もうタイトル魔術師だから。
新聞社から褒められてるぐらいある俺。
はずき職人ならタイトル職人。
タイトル職人マジで。
こないだもなんかね、めっちゃちょうどいいタイトルつけるもの
いろいろこう探ってるポッドキャストチャンネルみたいのがあるらしいんだけど。
へえ。
いわゆるキャッチコピーみたいな。
で、ポッドキャストのタイトルで宇宙話がやたら引っかかるって。
そうなんだ。
やっぱいいらしい。
ちりばめてるんですね、いろんな方向にも。
ちりばめてる。
で、それのおかげで宇宙話は宇宙っていうワードで引っかかるし、
隣のデータ分析屋さんはデータでもう引っかかるようになって。
そうだね。
もうね、しつこいくらい入れてたからね、初期の頃に。
間違いない。
それのおかげで上位に上がるようになってるから、
これがね、Googleもたまに検索エンジンの優先順位をガラッと変えて、
いろんな人を困らせるときがあるんだけど、
それがSpotifyとかAppleに出たときに結構えぐいことになるなって。
なるほどね。
非リンクっていうシステムがあんまりないからね、ポッドキャストに関しては。
そっか。
今そのLLMが流行ってきて、音声から言語というか文字にすぐ切り替えられたりもするわけだから、
絶対中身ベースで見られているってのもあってもおかしくないですよね、これから。
まだあるかわからないけど、じゃあちょっとやっとく?やっときます?
データデータデータデータデータデータデータデータデータデータ。
怖いな。
これでね、検索が引っかかってくると。
字幕取られても大丈夫。書き起こしされても大丈夫。
あ、この番組はデータの番組だっつって。
もう十分わかってるよ。
っていう感じで、まあなんか今日はGoogleすげえなっていう話をさせてもらったけど、
まあなんかネットワークサイエンスはそういう横幅もかなりあるから、やっぱ面白いなっていう。
この番組のリスナーにはね、もうちょっと染み込んでいってほしいから。
共用としてね。
そう、共用としてのネットワークですね。
これからもいろいろ紹介していこうと思います。
隣のデータ分析屋さん、今回も面白いと思ったらフォロー・レビューよろしくお願いします。
番組の感想や質問は、ハッシュタグ、隣の分析屋。
隣のがひらがなで、分析屋は漢字でお願いします。
また概要欄に貼ってあるお手紙方法からコメントを寄せてください。
ではまた。
バイバイ。
22:48

コメント

スクロール