1. ごりゅごcast
  2. 614.音声入力ってオフラインで..
2021-02-22 12:27

614.音声入力ってオフラインで使えるし「カスタマイズされる」らしいぞ

spotify apple_podcasts
デバイス上の音声入力
デバイスを使うたびにキーボードの音声入力が向上し、徐々にカスタマイズされます。デバイス上の音声入力では、すべての処理を完全にオフラインで実行することでプライバシーを守ります。検索時の音声入力には、サーバベースの音声入力が使われます
iPadOS 14 - 特長 - Apple(日本)

書いてあることがこれだけなので、正直わからないことが多いんですが、「カスタマイズされます」というのは明確に書かれています。

これなら、イマイチだと感じてた人も使い込んでみる価値は出てきたかも、と思います。



ご意見、ご感想はTwitterのハッシュタグ#ごりゅごcastお便りフォームにお送りください。

ごりゅごcast Newsletterも毎週配信しています。

00:00
こんにちは、goryugo & haruna1221です。今日は、Mac、iPadの音声入力について、新しい発見があったので、そういう話をします。
この間、iPadOS 14のセミナーをやるにあたって、もう一回そう復習してたんだよね。
iPadOS 14で、新しくなった機能とか、どこか変わったところみたいなのを、全部一通りチェックしてたら、
音声入力についても、その新機能として紹介されている部分があって、
簡単に説明すると、デバイス上の音声入力の入力精度が、やればやるほど向上していくよ、みたいなことが説明に書いてあったんだよね。
俺の中で驚きだったのが、そこの説明で書いてあるのが、基本的にiPadの音声入力はデバイス上のみオフラインで完全に実行できるようになっていて、
Siriを使って音声入力をするときだけサーバーにつながるっていうふうに書いてあって、
まじで、いつの間に完全オフラインになったの?って驚いて、iPadでオフラインモードにして音声入力がちゃんとできるか試してみたんだ。
全く何の1ミリも問題もなく、すごくスムーズに音声入力ができていた。
いつの間に完全にオフラインでこんな賢く音声入力できるようになったんだろう?って驚いたのと、
そこで学習して、この声を学ぶのかな?端末が。
春名はすごい音声入力が使えば使うほど使いやすくなっているみたいなことを言っていたんだよね。
この音声入力便利だよとか、去年2020年から音声入力をすごい使うようになったっていう話をいろんなところでしてるんだけど、
結構さ、もらう返信というかコメントが、うまく入力できないみたいな、全然使えないみたいなことを言ってる人が多くて、
自分の環境下ではめっちゃ早くて、めっちゃ正確に音声入力されるのに、なんでこれがダメなのにやろう?文法っていうか、喋り言葉と書き言葉みたいな、
そういう違いとかもあるから、そういうので慣れてないから、うまく入力できないのかな?ってなんとなくは思ってたんだけど、
今回、音声入力を使えば使うほど、学習していってカスタマイズされていくみたいなところを読んで、
もしかして、自分が音声入力をめっちゃ使うから、自分カスタマイズされてめっちゃ使いやすくなってるんじゃない?っていう。
03:05
謎なのが、Appleの説明文では、なんて書いてあるんだったっけ?
説明文をそのまま読むと、キーボード項目のところで、デバイス上の音声入力っていう項目、
デバイスを使うたびに、キーボードの音声入力が向上し、徐々にカスタマイズされます。
もうちょっとその辺り、オフラインがあるんだけど、カスタマイズはそんだけなんだよね。
だから、詳しくどうこうとかっていう話は全然ないんだけど、Appleはいつもこうやん?
詳しいこと全然教えてくれんけど、なんか変わったかもしれんみたいな。
Appleはっていうか、どこでも大体そうだと思うんだけど、わかることはカスタマイズ、音声入力はカスタマイズされる。
それ以上のことはわかんないんだけど、可能性として、はるなはいっぱい使っているから、カスタマイズされて使いやすくなったのではないかという仮説が立てられる。
っていうのを改めて思った。
で、さっきのオフラインで音声入力が使えるようになったっていうのは、
これね、ここ最近とかの話じゃなくて、結構ね、2、3個前のiOS、まだiPadOSになる前の時からそれできたはずで、
でもその制限がかかってて、例えばiPad Proはできるみたいな、そんな感じで始まってたような気がする。
でね、それに関して、確か前にMacだと音声入力の精度が悪くて、iPadとiPhoneがなんかいいんだよねっていう話をしたんだけど、
そういえば、昔Macで音声入力をする時って、オフラインとオンラインっていうのを設定できたんだよね。
で、オフラインで使うためにはなんかデータをダウンロードしないといけなくて、
で、3、4年前、もっと前だったかなの記憶だと、オフラインで音声入力をしようとすると、
まあひどいもので使い物にならないっていうまだレベルだったんだよね。
で、それがオンラインにして使ってあげると、結構良い精度で、まあまあ音声入力は使えるぐらいの印象だったんだ。
で、今Macの音声入力ってどうなってるんだろうって改めて見たら、もはやオンライン、オフラインっていう選択項目はなくって、
推測するに全てオフライン。で、あれ、そしたらさ、なんかMacも同じように賢いんじゃないの?と思って、
10分ぐらい音声入力を試してみたところ、その10分間に限って言えば、iPadとiPhoneとその遜色ない出来で音声入力がうまくできたんだよね。
で、まあちょっと謎は多いんですが、使えば使うほど良くなるという可能性は十分にあって、
06:00
で、Macが悪いっていうのも、なんかそのひょっとしたらそのつい最近変わった?ってなんかもう分かんないんだけど、
良くなっている感じがして、まあもうちょっとこれだったら俺普通にMacでも使うぞってぐらい、
その試した限りで良かったんだよね。もう一回。
まあただ少なくとも言えることが、そのローカルで処理をしている場合、
マシンスペックが結構ダイレクトにその影響してくるはずなので、
そのiPadの場合だったら、iPad Proならサクサク動くけど、
その無印iPadだとちょっと辛いみたいなことはあり得るんじゃないかなって思う。
ああまあ多分あり得るね。だからひょっとしたらなんだけど、
でも新しいMacでもなんかダメだったからちょっとやっぱ謎かな。
Macだけはちょっと分かんなくて、なんか仲間外れというか、その挙動が違う。
iPhone、iPadでやってる音声入力と、どうもなんかやってることっていうか使ってるところとか、
そういうのが違うように見える、感じるって感じ。
まあね、開業って言ってもさ、Macだと開業してくれなくってね。
なんかその変換、全部の文字が確定して終わると、開業っていった言葉が開業として入っているっていう、
なんかもうその時点でこういろいろ難しいし、
Appleのサポートのページを見ても、iPhone、iPad、iPod touchで音声入力っていう項目があって、
Macの場合はなんかその同じくくりに入ってないんだよね、ヘルプのページでも。
まあそれはヘルプ上のなんかあれかもしれないけど、ちょっと分かんない。
まあなので、少なくとも言えることは、iPhone、iPadで音声入力を使う場合は、
カスタマイズされますとサポートのページに書かれているので、
使ってみたら良くなるという可能性が存在している。
まあサポートのページじゃなくて、iPadOS14のページっていうのかな、
特設ページが毎年作られるんだけど、そこでその全ての機能を見るみたいな、
見せ方が綺麗な方じゃなくて、機能だけが、
いっぱい書いてあるやつの方だよね。
そう、羅列されている方を見ると、そういう風な表記があったので、
もしかしたらカスタマイズされてるんじゃないかなっていうのも思った。
ただ自分が使っているそのマシンスペックが、
iPadの中で言えば一番最新のスペックのもの。
iPad Proの2020年モデル。
今だとiPad Air第4世代の方が、チップ自体は上のやつが入ってるけど。
新しいだけで上だとは言ってないよね。
新しい、一番iPad Proの最新モデルを使ってるっていう。
09:03
iPad ProのチップよりiPad Airのチップの方が新しいけれども、
単純にベンチのスコアとかだとほぼ一緒だよね。
一部上回るものもある。
多分ニューラルエンジンというか、GPUよりの処理をしそうな感じがして、音声入力とか。
それを考えるとA12Xとかの、そっち側の方がiPad Airの処理よりも良いのではないかという可能性もあるし、
分からんものは分からんでしかないんだけど、
何にしても音声入力がカスタマイズされるっていうことを覚えておくと、
全然使えなくてももうちょっと使ってみようということで何か良くなるかもしれないよっていうことかな。
自分が音声入力を始めた当初、2020年の頭の方で、
音声入力がうまくいかないみたいな印象というか記憶があんまりないから、
もうすでに覚えてないからっていう意味でね。
ちょっと分からないんだけど、でも少なくとも直近、ここ最近の音声入力制度についてはほぼ完璧だし、
変換の、漢字の変換の仕方とかもめちゃくちゃ普通にきれいにしてくれるっていう感じで、
それはこの1年間ずっと音声入力をして、
はるなの声っていうのを学習したりとか、
この人こういう喋り方すんじゃないみたいな、そういうのをやってくれてるんじゃないかなっていう。
どうなんだろうね。専門認識とかそのあたりの特徴を分析してとかあるのかな?
もう分からんから分からんとしかならんけど。
ちなみにさっきのiPad Proのチップの話で言うと、
今最新の2020モデルはA12のZね。
Zね。Xじゃなくてね。
Xはね、2018年モデルのiPad Pro。で、XからZになった。
一応変わったってやつね。
あとMacの音声入力に関しても、少なくともそれを知って試した限りではiPadと同等だった。
以上のデータというか実験がないので分かんないんですが、
どうやらMacもオフラインで動くっぽいので、何か使ってみたら、
これもまたはるながあれなのかな。
俺は学習が足りなくてすごい反応しづらいとかなのかな。
うまく起動しないってことがすごく多かった感じで、Macの音声入力の場合。
そこが何かが分かれば、またそのあたりもPodcastなどで話せたらいいなと思います。
もしかしたら音声入力たくさん続けていくうちに、
すごい精度が上がるかもしれないよっていうお話でした。
あとMacは外部マイク繋ぎっぱにしておいたら結構いいんじゃないかということもちょっと思っていたりする。
12:04
でもはるなはMac miniだから外部マイクを繋いだ状態で音声入力してたけどダメだったよ。
じゃあやっぱ分からんね。
ということで今日はiPhone、iPadの音声入力、
Appleのページによるとカスタマイズされるっていうことがあったので、
使ってみると変わるかもしれないよっていうお話でした。
12:27

コメント

スクロール