1. はやつ~のしゃべる練習
  2. 「カメラアプリでテキスト読み..
2025-10-05 10:06

「カメラアプリでテキスト読み取れる時代」

言い忘れたこと

  • オンデバイスで処理されるみたい、という点も重要なポイント
  • ↑・・・と思ったけど、どうも、オンデバイスで処理される、という明確な根拠を見つけられず・・・💦うーむ

サマリー

カメラアプリの進化により、QRコードだけでなくテキストも読み取ることができる時代が到来しています。テキストデータの読み取り精度の向上やセキュリティの重要性についても考察されています。

QRコードの進化
おはようございます。しゃべる練習をやります。今回のテーマは、「カメラアプリでテキストが読み取れる時代」です。
まずテキストの前に、QRコードの話をしようと思うんですけども、 まあ世の中ですね、ペイペイあたりからQRコードが
世の中どこにでもあるみたいな状態になってきて、なんかポスターとか雑誌とか本とか紙とか
なんでもそのQRコードがポイッとあって、そこからネットにつながっているみたいな状態ですよね。
ネットだったりインスタグラムだったりLINEだったり、ネットですね。 そういう時に、昔はね、そのQRコード読み取りアプリみたいなやつをインストールして、みたいな感じでスマホでやってた
時代もあったような気がするんですけども、ある時からですね、iPhoneの標準カメラアプリを起動して、そのQRコードを
カメラのレンズに映るようにすると、写真とか撮るんじゃなくて映るようにすると、その時点で
ターゲットをロックオンしたみたいな状態になって、そこのQRコードに示される
リンクに飛べるように、サファリとかが起動する感じですかね。 デフォルトブラザーなのかな。
開くようにもなってきてですね、便利便利という感じになりました。 なので、それまでそのネットで
ネットを見てもらう、そのポスターとか、そのリアルの世界からネットにリンクをつけるっていう時に、そのURLを
書く、その HTTPSコロンスラッシュスラッシュホニャララみたいなやつを書いて、それを手で打つみたいな
時代からどんどん進化していって、今はそんな感じでQRコードでピョロッと見れるようになったわけですけども、
その後ですね、どんどんまた時代が進化していく中で、カメラアプリでね、その文字を
レンズの中に収めると、その文字をOCRっていうんですか、そのテキストデータとしてコピーできるようになってきたのですけれども、
これを皆さんご存知ですか、ご活用されてますでしょうかというお話です。 これね、なんか
できることを、なんとなく頭ではわかってても、あんまりやれてない、やれてないというか、
それを思い出せない時があるなぁと思うんですけども、一つには
さっきはQRコードがある前提で言いましたけども、そうじゃなくて、普通のURL、アドレスが書かれてあって、
これQRコードにしておいてよ、これ手で打つのめんどくさいわ、と思ったことが仮にあったというか、最近のやつではそんなにないと思いますけど、
昔の情報とかね、昔の書籍とか雑誌とかで、例えば見たとして、
それをね、手で打つのめんどくさいなと思った時に、そのカメラアプリで読み取ったら、それでコピーして、それをブラウザに貼れば、
というかブラウザに貼らなくていいのか、そのURLだと多分にポチってやると、ブラウザが開いちゃうと思うんですよね。
ただこれはちょっと危険だなと思う部分もあって、テキストの読み間違いもすることがある。QRコードに比べると間違う可能性は結構あるんじゃないかなと思ってて、
そこは信仰心が問われるところかもわかんないですけど、僕の感覚で言うと、ちょっとまだ怪しいんじゃないかと思う時も、
そこまで100%安心しきって、信頼しきって、ノールックで、バイブコーディングだ的にチェックをしないという考え方がある可能性もあるかもわかんないですけど、
やっぱり良くないというふうに、このシャベレンでは言いたいと思いますが、ちゃんと確認しましょうと。特にドメインですね。
それが、まかり間違ってフィッシングサイドみたいなところに飛んじゃったら、もうえらいことなんでね。それは要注意ですけども、
テキスト読み取りの未来
まあそれともかくとして、完全に自分で手で打つよりは楽できていいんじゃないかなと個人的には思います。
でも、もっとあれで言うと、そういうことをすること自体がセキュリティ的によろしくないという考え方もあるかもしれないので、今しゃべりながらちょっと自信がなくなってきましたけども、
アドレスはコピーする、読み取るものの信頼性がどれだけ求められるかによっては、ちゃんとチェックを人間の目でもチェックする必要があるケースもあるよということが一般論としてはあると思いますけども、
そこまででもないテキストとかだと結構便利に使えるんじゃないかなと。日本語とか英語とか記号とか混ざってると間違いが増えるとは思いますけども、それなりの信頼度でいいときにはそれなりの便利さがあるよということでいいんじゃないかなと思いますね。
この辺はどんどん精度も上がっていくところだと思いますね。実際のカメラとしての読み取りの精度もそうだし、後処理で読み取ったテキストを見て、いやいやこんなテキストないやろって思って、それをAIが手直ししてくれるとかっていうステップを入れたりとか、あの手この手で精度を高めていけるんじゃないかなと思っています。
なんでも最近ね、めんどくせえめんどくせえ息をするのもめんどくせえじゃないですけども、テキストを選択してコピー、メニューを開いてコピーしてそれを別のアプリでペーストするのもめんどくせえという界隈に置かれましてはですね、スクショ撮ってぽいってやるっていうスタイルもあろうかと思うんですね。
なんか僕としてはデータ両用がもったいないと思っちゃうんですけど、テキストデータだったら10バイトとか100バイトとかで済むのをね、画像データで何メガバイトみたいな感じのデータにして、ああもったいないという気持ちになってしまいますけども。
ちなみに僕はiPhoneのカメラアプリをね、今標準のアプリも使いますけども、それとは別にカメラアプリがあって、そのカメラアプリの基本の設定は640ピクセルの解像度にしてるんで、それで撮ったら写真のデータ容量が少なくて済むぞという風に思いながら撮ってます。
やってますけども、どうなんでしょうね、あんまりそういうことで蹴散るのも脳みそのリソースの無駄遣いかもしれないんで、そこは今はアドキュアも容量は何本でもあるんだという感じでやるという考え方もあるとは思いますけども。
何日をですね、このしゃべれんでお伝えする、しゃべる内容としては、送る側はともかくそういうのを受ける側としてそういうデータがテキスト化されてないのを手でタイピングするのが面倒くさいと感じるときにそういうアプローチもあるんだなと。
注意事項や懸念点もあります。リスクもゼロではないですけども、それをちゃんと理解した上で活用するといいんじゃないかなということが趣旨になります。
あと余談としては、こうやってあの手この手で情報をインプットするときの手段が増えていって、例えば音声入力で文字を入力したりすることもできる精度も上がってきているので、
そうなるとキーボードをですね、QWERTY的なキーボードを打つということをする頻度、時間、必要性というのがちょっとずつ今削られていっているんだろうなというふうに思います。
最終的にフリック入力でもありますけども、そういうキーボードを全く使わない、ほぼ使わないというところまで持っていけるのかどうか気になりますね。
今はiPhone SEの第2世代でキーボードをやってますけども、ローマ字が打つのがQWERTYキーボードだとすごいボタンが小さくてミスタッチが多くてちょっと辛いですね。
ローマ字入力をフリック入力でできる人はすごすぎるなと思って全くできるようになる気がしないんですけども。
ということで、そんな感じで今回の喋れんは以上です。ではまた次回。
10:06

コメント

スクロール