1. アシカガCAST
  2. 第92回「読めない漢字をググる..
2019-07-18 05:59

第92回「読めない漢字をググるには文字認識を使えばいいじゃない」

画像からの日本語文字認識を今さらながらいくつか試してみて、十分実用レベルなんだと実感しました。こどもYoutuberの「漢字はググればいい」発言から連想してのネタです。
00:00
アシカガCHチャンネル登録お願いします。
CHはチャンネルという意味です。
アシカガキャスト
最近、子供のYouTuberの漢字はググればいいし、計算は電卓叩けばいいという発言が話題になっていました。
漢字はググればいいですが、漢字の読みを調べたいのか、どういう漢字を書くのかを調べたいのか、意味を調べたいのか、何を指しているのかがこの発言だけではわからないんですが、
読めない漢字を調べるときに、まず入力できないと検索できないという指摘をしている人がいっぱいいました。
ちょうど最近、LINEで文字起こしをしてくれるアプリが出たというニュースを見ました。
文字起こしバリグットくんというのなんですけども、友達になって文字の入った画像を送ると即座にテキストで返事が来るというものでして、
早速試してみて、一瞬で返事が来て、認識の精度も高くて、おおすごいと思いました。
手書きの文字ではなくて、学校からもらうプリントみたいなパソコンで作られてプリントアウトされた文章であれば、今の技術ではかなりの精度で認識されるんだなと思いました。
そうやって一回画像からテキスト化されれば、わからない漢字でもわからない言葉でもグーグルとかで検索することができるようになりますね。
何でもググれるから勉強しなくていいという考えには賛同しかねますが、少なくても今の技術で十分読み方がわからない漢字でもすぐにググれると言えそうです。
画像からの文字認識をOCRと言ったりするんですが、考えてみればOCRを日常的には使ってないなぁと思い、これを機に改めて使ってみようかなと思い、ちょっと調べてみました。
私が馴染みのあるものでは、Adobe Acrobat DCとGoogle Document、Google KeepでOCRが簡単に使えることがわかりました。
一番おすすめなのはGoogle Keepで、これメモを書いて保存しておけるサービスなんですが、Googleアカウントさえあれば無料でパソコンからはブラウザーで使えてスマホのアプリもあります。
03:04
スマホからだと、Google Keep上で写真を撮って、その画像を開いて、点々のメニューから画像のテキストを抽出というのを選ぶと、自動で写真の中の文字がテキストに変換されます。
もちろんカメラロールにある画像からも変換できますし、パソコンからでも画像を追加して、その画像に対して文字認識させることができます。
Googleドキュメントの場合、文字が写っている画像のファイルかPDFのファイルをGoogleドライブにアップロードしておいて、ブラウザ上のGoogleドライブでその画像を選んでアプリで開く、Googleドキュメントというのを選んでGoogleドキュメントで開くと、
自動的にテキストに変換されてドキュメントが開きます。
Adobe Acrobat DCの場合、文字が写っている画像をPDFファイルにしておく必要がありますが、PDFファイルを開いて、右側のメニューからPDFを編集を選ぶと、自動でテキストに変換されます。
Acrobat DCのすごいところは、レイアウトもほぼそのまま、フォントも似たようなフォントで、ちゃんとテキスト化されると。今までやったことなくて結構驚きました。
画像から認識させるのではなく、手書きで書いてすぐに文字として認識させるということもできて、例えばiPadの手書きキーボードというアプリを入れると、どんなアプリを使っているときでも、キーボードとして手書きキーボードを呼び出して、指やApple Pencilで文字を書けば、日本語が普通に認識されます。
これも結構びっくりするぐらい、ちゃんと日本語を認識してくれます。なので、読めない漢字をググりたいという場合は、そっちの方が便利そうですね。
手書き文字入力はGoogleドキュメントでもできますし、Android版のキーボードアプリのGboardには手書き入力機能があるらしいです。
ということで、読めない漢字をググりたかったら、画像から日本語文字認識させる、あるいは手書き文字認識という方法があって、どちらも今の技術では十分使えるものになってるなという話でした。
05:59

コメント

スクロール