1. STEAM.fm
  2. 住所と名前のよくある誤解【第..
2023-06-16 24:58

住所と名前のよくある誤解【第134号】

spotify apple_podcasts

1️⃣コンピュータープログラムは住所を扱うのが苦手です

2️⃣地球上のあらゆる場所を指し示すジオコーディングという技術が使われ始めています

3️⃣実は名前も大変なんです

ご紹介したTEDトーク👉 Derek Sivers: Weird, or just different?

Photo by Jonathan Kemper on Unsplash

----more----

ニュースレター「STEAM NEWS」

金谷一朗(いち)

TEDxDejima Studioファウンダー・パイナップルコンピューター代表・長崎大学情報データ科学部教授

📚バックナンバーはこちらから👉 https://steam.theletter.jp/

🎙️ポッドキャストはこちらから👉 https://steam.fm/

📝文字起こしはこちらから👉 https://listen.style/p/steam

💭匿名質問・コメントはこちらから👉 https://marshmallow-qa.com/kanaya

🐘つぶやきはこちらから👉 https://mstdn.jp/@kanaya

🐤DMはこちらから👉 https://twitter.com/kanaya

📬メールはこちらから👉 steam.newsroom@gmail.com

☕️コーヒーの差し入れ(400円のご支援)はこちらから👉 https://ko-fi.com/steamnews

❤️‍🔥《STEAMな言葉》👉 https://steam.micro.blog/

 

住所のややこしさと表記揺れの問題
いちです。おはようございます。このポッドキャストは、僕が毎週お送りしているニュースレター、スティームニュースの音声版です。
スティームニュースでは、科学、技術、工学、アート、数学に関する話題をお届けしています。
スティームニュースは、スティームボートのリクミンのご協力でお送りしています。
このエピソードでは、スティームニュース第134号から、住所と名前のよくある誤解についてお届けします。
改めまして、いちです。このエピソードは、2023年6月14日に収録しています。
このエピソードでは、最近話題になっているマイナ保険証のトラブル、 その原因となった住所のややこしさについてお届けしていきます。
今週も25分間どうぞお付き合いください。
マイナンバーカードと健康保険証を一体化したマイナ保険証で、別人の医療情報が間違ってひも付けられてしまうトラブルが相次いでいます。
原因は、同姓同名かつ青年合併が一致した人の取り違えのようで、住所の不一致は意図的に見逃されていたからなんだそうですね。
ではなぜ住所の不一致を見逃していたのか、わざと見逃していたのかというと、そもそも住所には表記揺れがあるために、同じ住所でも一致しないことがよくあるそうなんですね。
なので住所はもうそもそも見ないことにしていたんだそうです。
本事業に対し河野太郎デジタル庁大臣は、テレビ番組日曜報道ザ・プライムの中で、将来的にはAIの技術を使って住所の表記揺れを判断することがあり得るかもしれないと述べました。
えっ、住所の表記揺れごときにAIが必要?
あれでしょ、一丁目一番値と書くか、一の一とか書くぐらいの違いでしょとネットでつぶやいてしまった人物に、エンジニアやプログラマーたちから激しい突っ込みが入れられています。
どうしてでしょうか。実は住所って超めんどくさいんです。
京都を訪問したことがある人なら、住所が日本の他の地域とだいぶ異なっていることに気づくと思います。
日本の住所システムの問題点
実際京都では2010年代前半までGoogleマップが使いづらくというか、まあ使い物にならなくてですね、京都専用の地図アプリがあったぐらいなんです。
今でも住所としての市場河原町と河原町市場の区別をGoogleマップはつけていないようですから、京都の人にとってGoogleマップは、まあ初めてきはった人にはよろし押せやろうなというところちゃいますかね。
いや京都の方ほんますいません。あのエセ京都弁でした。あの僕は大阪出身です。
こういった事情は京都だけではないようで、プログ記事とにかく日本の住所のヤバさをもっと知るべきだと思いますでは、例を挙げて日本の住所のヤバさを伝えています。
一つ住所を引用すると長野県長野市南長野旗町。
これ漢字で書くと南長野旗町の旗という字が長野県の県という字と同じなのですね。
なので住所の中に長野県という文字列が2回出てくるんです。
これはですね、エクセルなんかで処理をしていて長野県で切り分けようと思うと長野県が2回出てきますので処理に困ってしまうということが起こり得るんですね。
またTBSのテレビ報道によると兵庫県明石市に和坂という地名と神ヶ坂という地名があるのですが、漢字表記がどちらも同じ。
和食の和に坂道の坂と書いて和坂という地名と神ヶ坂という地名。
これは異なる土地なんですね。この2つがあるということが報道されています。
僕は早速グーグルマップでこの和坂と神ヶ坂を調べてみたんですが、なんとですね、僕が中学生の頃よく遊んだ砂浜の近くでした。
少し離れた地域の人ですらわからないのですから絶対迷うでしょうってなことを感じました。
日本の住所システムはユニークだというテッドトーク、これデレクシバーズのテッドトークがあるのですが、
ひょっとしたらリスナーの方はすでにご覧になった方おられるかもしれないのですが、そのデレクシバーズのトークよりもさらに日本の住所というのはややこしいということなんですね。
ウェブサイトに住所を入力する際によくほら、都道府県、市区町村、番地、建物名、部屋番号とかこうバラバラにフォームが置かれていることがあるじゃないですか。
で、これなんで一行にしてくれないのかなって思いません?一行だったらコピペできるじゃないですか。
でもこれは住所の表記揺れを少しでも押し留めるための技術だったということなんですね。
確かにAIなんとかしてよってなりますよね。
新しい住所システムの提案
で、そもそも所在地に住所などという古臭いシステムを使っているから問題なのだという考え方もあります。
経済成長が早すぎて住所の割り振りが間に合わない国や、もともと有募国民が多くて住所の意味がない国など、そういった国のケースでは新しい住所システムが必要になります。
例えば住所をすべて緯度経度で表してみるとどうなるでしょうか。
東京都墨田区押し上げ1丁目1-2を緯度経度で表すと、
35.71075813823494N-139.812537598323224Eになります。
Nが北緯、Eが東経を表しています。
今読み上げた数字、それからアルファベットをそのままGoogleマップに入れていただくと、正しく東京都墨田区を押し上げ1丁目1-2、つまり東京スカイツリーの入り口に連れて行ってくれます。
このようにピンポイントの住所から数字に変換することをジオコーディングと呼びます。
ジオコーディングによって住所を緯度経度で表すと、確かに曖昧さはなくなります。
しかし、誰も自分の住所を長い数字の列で覚えたくはないものですよね。
もっと良い方法ないでしょうか。
イギリスのワットスリーワーズ社は地球上をおよそ3メートル四方の区画に区切り、それぞれに英単語3個を割り当てました。
単語はランダムに割り当てられています。
例えば僕の家の近所には出島があるのですが、その出島の館長が住んでいたカピタンベアの入り口の住所。
これをワットスリーワーズ社のジオコーディングを使うと、インフォームドパンケーキスロットとなります。
単語3つですね。インフォームドパンケーキスロット。
この言葉に意味はないのですが、長い数字を覚えるよりは、もし僕がオランダ商館の館長、カピタンだったら、
郵便物はインフォームドパンケーキスロットに持ってきなさいって言えるわけですね。
まあ覚えやすいということになります。
ちなみにこの3つの単語、インフォームドパンケーキスロットを使って、文章を作りなさいと文章生成AIチャットGPTに命じてみました。
その結果ですね、ちゃんと文章を作ってくれました。
私が用意しておいたパンケーキを友人たちにインフォームすると、彼らはすぐに次の朝食会のスロットを予約してくれました。
まあこれならもっと覚えやすいかもしれませんね。
ワットスリーワーズは地上を3メートル四方に区切ります。
3メートル四方というのはおよそ3坪。畳で言えば6畳分ずつなので十分細かいように思うのですが、
軍用には3メートル四方のジオコーディングでも足りないことがあるんですね。
ナトウ軍はそのために1メートル四方まで絞り込めるジオコーディングシステムを採用しています。
またですね、僕たちエジプト調査隊は砂漠の中という元々住所がない場所で発掘をしたり測量をしたりするために、
元からジオコーディングシステムというものを使っています。
エジプトの場合はUTM36というふうに名付けられたジオコーディングを使います。
これ横メルカトル図法36番というふうに言うんですが、地球全体を覆うようなジオコーディングシステムなんですね。
僕たちはエジプトでは精密測量を使って、数センチメートルのサイズまで絞り込みをしています。
さて、住所には地球上の位置という正解がありました。
地球上の位置は緯度経度で表すことができますから、住所と緯度経度を正しくひも付けることさえできれば、住所の曖昧さは解消します。
その技術のことをジオコーディングと呼ぶのでした。
一方の人間はどうでしょうか。
人間の名前は住所以上に難しいんです。
同性同盟は日本にも多くいますが、これがキリスト教権になるとさらに増えます。
ロシアには子供の名前を成人カレンダーから選ぶという伝統がありましたし、
ハンガリーではハンガリー科学アカデミー言語研究所が作成したリストから名前を原則選ばなければなりません。
なので日本以上に同性同盟が多いということになります。
そもそも人名は住所以上にややこしいということがブログ記事
人名について
プログラマの抱いている名前についての語尾に書かれています。
名前に関する誤解が40個並べられているのですが、その40番目には
人には名前があるという誤解が選ばれていました。
実際アマゾンのマチゲン家族は個人名をつけないことが知られています。
日本人に限って言えば出生時に名前を届け出ることになっていますから、
名前がないことは滅多にないわけですが、
名前が衝突する、つまり同性同盟になるということはよくあります。
また漢字文化圏特有の問題として異字体の問題もあります。
異字体というのは同じ漢字なんだけれども書き方が違う、形が違う文字のことですね。
有名な例で言うと、牛丼の吉野家の吉野寺。
土吉というふうにも呼ばれる2個目の上から2番目の横棒が1番目の横棒よりも長い文字ですね。
これは本来1番目の横棒が長い方の吉と同じ字なのですが、商標としては区別をしていますね。
高島屋さんの高の字、これも高いという字のはしご高という異字体を使っています。
確かですね、はしご高は過去の文献に出てくるんですが、土吉の方はひょっとしたら日本固有の方言かもしれません。
こういった異字体というのは原則どちらをどの表現を使ってもいいので、漢字で書く渡辺さんとか斎藤さんとかいろんな種類の書き方があるんですが、
基本同じ字なのでどれを使ってもいいんですね。
日本の場合、戸籍の届出というのが手書きが認められているので、
書き間違えたらそのまま採用されているということもあったわけです。戸籍というのは明治まで遡りますから、その時代に書かれた文字がそのまま採用されていることもあるわけですね。
なので、違う文字に見えるんだけれども実際には同じ文字という同性同名とは逆の問題も日本では生じます。
こういった個人を区別したり、あるいは同じ人だよというふうに認識したりするのに、個人をDNAで区別するわけにもいきませんから、国なり地方自治体が国民に番号を売るしかないんです。
日本で言えばマイナンバーですね。
ただ冒頭でご紹介した通り、マイナンバーというのはどうしても評判が悪くて、こういった二重のひも付けとかの事故が起こるとものすごく叩かれてしまいます。
そのメリットに比べて危険すぎるというふうに見られてしまいます。
ここで提案なのですが、携帯電話の普及率や利便性を考えると、もう日本人全員に携帯電話を配ってしまって、その電話番号をマイナンバーにしちゃった方が簡単かもしれません。
赤ちゃんが生まれたら携帯電話プレゼント。
政府が配る携帯電話。
名前は日本の電話だからJフォンがいいかなと僕は思っています。
地名学とバスガイド地名学
というわけで、このエピソードでは住所と名前についてのよくある誤解についてお届けしました。
住所って面白いなと思って、このエピソード、それからメールでお送りしているニュースレター、スティームニュースを執筆するために、いろいろ興味を持って調べてみたんですね。
地名学という学問分野、まだまだ小さな学問分野、研究者の少ない分野ではあるのですが、地名学という学問分野があって、それを興味深く調べさせていただきました。
ただ、地名学の分野にはまだとんでも研究者、とんでも学説がかなりの割合で混じっているようで、中にはプロの研究者の方で、そういったとんでものことをバスガイド地名学というふうに揶揄される方もいらっしゃるようです。
バスガイド地名学というのはね、バスツアーに乗っているとガイドさんが、この土地はこういう由来でっていうふうに案内されるところから取ったんだと思いますが、言えて妙なのかなぁとも思います。
例えば、心理学の世界では、学術的な心理学と、それから占いに近いような大衆心理学というふうなものと区別されるんですが、地名学というものも、ひょっとしたらその本来の地名学と大衆地名学、バスガイド地名学みたいなものに分かれるのかもしれません。
ここらへんはね、語源の研究と似ているのかもしれないですね。
語源の研究っていうのも、もちろん純粋な学問としての国語学であったりとか、日本で言えばですね、あるんですが、本でも説もかなり多く世の中には出回っているので、そういうのを気をつけないといけないのかなということを感じながら調べ物をさせていただきました。
この構造は、科学という分野でも同じことがあって、サイエンスに対してジャンクサイエンスというものがあるんですね。
日本語では疑似科学とか衛生科学とか偽科学とか呼ぶのですが、こういった科学の不利をしたインチキを見抜く力をリスナーの皆さんに持っていただきたくて、こうして魅力ながらエピソードをお届けしています。
また感想などお寄せいただけると励みになります。
聞いてくださってありがとうございました。steam.fmのイチでした。
お疲れ様でした。
ご視聴ありがとうございました。
24:58

コメント

スクロール