機械翻訳の進化
みなさんこんにちは、wptv podcastです。
今回のテーマは、機械翻訳です。
機械翻訳という言葉ですね。あまり最近、こういう言い方をしなくなって、AIという言葉がよく使われているような気がしますけれども、
昔々、専門的なプロフェッショナル用途のお高いツールがあったかと思うんですけれども、
一般の人が無料とか無料に近いぐらいの、比較的安い価格で使える、みたいな感じになってきたのは、
私が知っている範囲では、エキサイト翻訳とか、というところから当たったような気がするんですね。
その後、Google翻訳というのが出てきて、これまた衝撃だったように記憶しているんですけれども、
さらに最近にDeepLというのも出てきたときに、それまでのGoogle翻訳とかは直訳はしてくれるけれども、
あまりスムーズな感じじゃない、ぎこちないというか、結局英語をみなよくわからないみたいな感じになるんです。
英語のやつを見ないといけないし、英語の文章だけでは何を言っているのかあまりよくわからないなという感じだったところが、
DeepLになってきて、日本語に翻訳された文字を読むだけで、だいたいわかるみたいな感じのクオリティになってきたようなイメージがあります。
DeepLで日本語にしてくれた文字をちょこちょこっと3発で最後に飛び出した毛を1本2本ちょこちょこって切って整えるみたいな、
それぐらいの作業で済んでしまう。
昔だったら3発を全部やってたところがだんだんバリカンみたいなやつで、ハサミだけでやってたところがバリカンみたいなやつでガバガバっとできるようになってきたりとか、
最終的には最後のちょこちょこっていう微調整みたいなところだけやれば、
例えば英語を日本語に翻訳していくみたいな作業ができるような、そういう空気感にだんだん変わってきたような気がするんですよね。
それ以外にもAIの絡みでいうと、Whisperとか、あとChatGPTとかでも翻訳してくれると思うし、
WordPressコミュニティと機械翻訳
あとOtterとか、あとはこないだご紹介したUDトークとか、AmiVoiceとかいろいろあると思うんですよね。
こういう全部、とりあえず今日のテーマとしての機械翻訳っていうところにひっくるめて話をしていこうかと思うんですけれども、
wordpress.tvというか、WordPressコミュニティとしてこういう機械翻訳をWordPressに関する翻訳として使うということについては、
どういうルールがあるのかなっていうのが気になっていたところなんですね。
あんまり細かく把握できてないんですけれども、何年か前にWordPressじゃないところのオープンソースのあたりで、
こういう機械翻訳を使うということに対するディスカッションというか、もうちょっと穏やかじゃない感じの状況があったような記憶があります。
あんまり深いところまで調べているわけじゃないんですけれども、
一つの話としては、機械翻訳で出てきたアウトプットとしての、例えば英語をインプットにして出てきた日本語というのが、
その日本語のテキストの著作権というか権利みたいなものについてどうなるのかなっていうあたりが、
Googleの翻訳はグレーみたいな、エキサイト翻訳は黒って言っても悪いという意味じゃなくて、
勝手に翻訳したやつを自分の成果のように出していくみたいなのはよろしくないみたいな、
そういうことだったんじゃないかなと思うんですよね。
その後、いろいろDPLが出てきた、さらに生成AI、ChatGPTが出てきたみたいな感じでAIがどんどん進化していく中で、
その議論もなんとなくよくわからない、ふやむやな感じになってきてしまうのかなっていう。
ChatGPTとか、最近その著作権とAIというのは議論があるところかとは思うんですけれども、
それの広い大きなテーマには乗っかっていると思うんですけれども、
画像を生成するとか、生成AIというのはインプットとして、
これまでのネットに上がっている情報とかをインプットにガバガバ取り込んでいるという噂ですので、
そういったところが著作権でどうなるのかなみたいな、
法律的なところもあるし、道徳的なレベルの議論もあるでしょうしという感じなのかなというふうに見ておりますね。
ちなみに日本の著作権法的には、どういう経緯で誰が入れることにしたのか、
あまり分かっていないですけれども、そういうAIへの学習をさせることは、
著作権侵害に当たらないということがずばんと明言されているという話を聞いたりもしましたけれども、
多分その辺の解釈とかもいろいろあったりとかして、本当にいろいろややこしいところかなとは思うんですね。
そんな状況を踏まえつつ、
WordPressコミュニティの今日現在、2024年の現在の状況ってどうなのかなというのを先日ですね、
Word SlackのDocsチャンネルのほうで聞いてみたりしました。
その内容をここでご紹介したいなと思っております。
ちなみにこのWord Slackの内容というのは3ヶ月で見れなくなってしまうというのがちょっと残念なところでして、
それをちょっと残しておきたいなというような意図もあったりはします。
教えていただいた内容としては、
まずWordPress自体ですね。
WordPressオートTVは全然システム化されていない。
素朴に翻訳して字幕ファイルをテキストでアップするって感じですけれども、
プラグインとかそういうのの翻訳というのはかなりシステム化されてきているように感じております。
ちょっと具体的にあまり理解できてないんですけれども。
それでいうと、翻訳するプレムワークというか、
仕組みの中にGPTとかDeepLとかのAPIキーを設定できるようになっているということを教えていただいたんですね。
それはただ参考訳として表示できるということなので、
それを参考にしながら訳しましょうということですね。
それを機械翻訳をそのままアウトプットにするという形にはなっていないということだと思うんですね。
あとは機械翻訳や予告翻訳の仕様についてというところも、
翻訳のサポートツールと挑戦
ハンダブックにそういう説明が書いてあるということも教えていただきまして、
参考訳をちゃんと精査すればOKみたいなことのようなんですよね。
そうなってくると今度は精査という二文字が重くのしかかってきて、
自分の英語力がすごく高くて、自分でも全然時間かければ略せますけども、
全然というか、チャットGPTとかにサポートしてもらえるとより早くとか、
より精度高くできるっていうぐらいの能力を持った人であればいいような気がするんですけど、
英語はあんまり分からないし、自分でも話したりできないですし、
訳してもらった普通の英語の記事とか見るときも翻訳を基本的には読んでますみたいな。
もちろん時々日本語を読んで分からないなって思うときもあったりします。
英語と日本語と横に並べて見たりすることも多いですけれども、
そんな感じで結構翻訳の方に頼ってしまいがちなぐらいの英語スキルだと、
それを精査するっていう感じにまで高めることが難しくて、
大体意味わかるし大丈夫そうみたいな感じでやっちゃったら、
それは精査と言えるのかみたいなことを思い悩んだりしてしまいそうなんですけれども、
精査AIも出てきて、AIとどうやって付き合いながら自分の作業とか生産性を高めるみたいなところですかね、
アウトプットを出していくのかみたいなところは本当に今大きく動きがあるところなので、
今日の時点での私の悩ましいなと思っているところも、
また今月、来月、来年とかになってくればまた事情が変わってくるのかなとは思うんですけれども、
ということで、ちょっといろいろ悩ましい思いを抱えつつではありますけれども、
ある程度クリアになったこととしては、機械翻訳とかツールを使って翻訳するということをツールとして使いつつ、
参考にしつつ翻訳するというサポートツールとして使って翻訳するということはOKとなっているということですね。
それをそのまま丸ごと出すということはやめてね、内容がちゃんとなっているかということは確認してねということが求められていますよということですね。
だからなんだろうな、この翻訳無茶苦茶やってなった時に、
ちゃんとGPTにやってもらってそのままですわっていうような回答しているようじゃダメだよということだとは思うんですよね。
だから今言ったぐらいのところは何とか言えそうなのかなというふうに手応えというか理解が深まりました。
ただそこから先の細かいところはさっき言ったみたいな悩ましいことがいっぱいありそうな気がしますけれども、
そんなにシリアスにならずにやっていくということでいいのかなという気持ちになってきたというところで、
最近は文字起こしとかっていうところもウィスパーとかウィスパーで文字起こししてそれをDPLで翻訳してみたいな、
それをさらに字幕にするっていうのはタイムスタンプですね。タイムスタンプのところをいい感じにするっていうのと、
あとまだこれは決定的なシステム上の改善策は見つけられてないですけれども、
普通に字幕としてちょこちょこっと切っていって、その切ったやつを個別に日本語にするっていうのはかなり翻訳の品質が下がっちゃうなっていうのを感じてるんですよね。
だから字幕で英語だと例えば英語のワードが何だろうな、10個は出せなさそうじゃないですか、5個とかなんですけど、
英語のワード5個とか1文とかって10ワードとか15ワードとか20ワードとかってなってるので、
それがぶつ切りで4等分とかってされてそれぞれの別々で翻訳したっていうのだとやっぱり前後の文脈とか文全体での翻訳品質からすると相当下がってしまうので、
なんとか1文があったら、喋ってる時に1文っていう区切りもなかなか難しい時もありますけれども、
一つの意味的な繋がりが強い塊ですね、その塊ごとに英文が固まっててその英文が日本語に翻訳されて、
その時間を等分に割りつつ字幕の区切りっていうのをつけていくっていうそういう仕組みがうまくできるといいなと思ったりはしますかね。
今まで見たやつだとDaveさんという方が説明されてる中ではそのChatGPTにそんな曖昧な指示を曖昧なというか漠然としたらできるっぽい情報があったのと、
あとはUDトーク字幕エディターの方で箱割りっていうのをやる中で、箱割りをやる前に翻訳しておいてその後箱割りをするのかな、
そういうふうに手順を踏むことでさっき言ったようなところもクリアできそうかなっていうふうに感じているので、
そういうところは一通りクリアできると相当翻訳の時間をとんでもなく劇的に短縮できそうな気がして、
それを短縮しつつさっきの機械翻訳を使うときの注意事項のラインもクリアした形で作っていけるんじゃないかなっていうすごい期待がありますので、
それを今後取り組んでいければなというふうに思っております。
ということで本日のWPTVポッドキャストは以上になります。ではまた次回。