続いて伊藤さん、伊藤さんもちょっと簡単に自己紹介をお願いしてもいいでしょうか。
自分は今東北大学の大学院情報科学研究科というところの修士2年で、
大学院での研究は自然言語処理という分野を中心に行っています。
まさにLLMに関連しているような分野です。
レイアXのALE事業部では2024年なので、去年の2月から7月頃までインターンをしていました。
今年の4月からはレイアXのALE事業部に新卒として入社する予定になっています。
もうスタートアップで半年経っているといろいろ条件も変わっていると思うんですけど、
半年前のインターン経験を中心にいろいろ話せればなと思っています。
よろしくお願いいたします。
ありがとうございます。
伊藤さんが去年夏にインターンしてくださっていて、
プロダクトもその頃だいぶよちよち歩きだったので、大きく変わっているかなという感じなんですけど、
ちなみに伊藤さんが自然言語処理大学でやっているという中で、
事業会社でレイアXでインターンしようと思った経緯やきっかけはありますか?
もともとレイアXのことは経緯の方々や社員の皆さんが知っている発信を見ていて、認知自体はしていて、興味が会社としてあったんですけど、
ただ自分自身にソフトウェアエンジニアとしての強いバックグラウンドとかもなかったので、すぐには縁がない会社だなと思っていました。
そんな背景があった中で、自分が修士1年で10月頃に博士課程に進学するか、修士卒で就職するか悩んだタイミングがあったんですけど、
その時にレイアXがLLM事業にも力を入れ始めたというのを知っていて、
この事業部だったら自分が大学で学んだことを活かしてインターンとしても活躍できるし、レイアXに貢献できるかなという気持ちと、
またレイアXは顧客目線に立ってUIとかUXとかに強くこだわるプロダクトを作っている会社というイメージがあったので、
そんな会社がLLMでどんなプロダクトを作ってビジネスをしようとしているのかに興味があって、インターンをしたいなと思うようになっていました。
その後はレイアXさんが主催していたイベントに参加して、そこで松本由紀さんと話す機会があって、
その時の会話の中で、事業部としてはモデル自体の開発はしないで、APIを日本で一番呼び出すプロダクトを作りたいというふうにおっしゃっていて、
その考えが自分もすごく共感できる部分があったので、その話を聞いてすぐにインターンの応募をしたという流れで、インターンを始めました。
ありがとうございます。今のモデルを学習しないみたいなところだと、結構モデル自体を作っていく、国内でも作ってらっしゃる方々いて、
それはそれでものすごい知見を得られるので重要なお仕事かなと思うんですけど、我々はちょっとそことは違うアプローチでどんどん使っていくぞってアプローチを、
1年ぐらい前に一つ意思決定みたいな形でして進んできて、その背景にあるのって結構途中でもおっしゃっていただいたお客様目線みたいなところ、
企業文化としてあるかなと思っています。伊藤さんも実際に入った案件があると思うので、そっちのお話にシフトしていきたいなと思うんですけど、
実際にインターン中にやった案件みたいなところでいうと、どういう取り組みをしたとかっていうのをお話しいただいてもいいですか。
自分は当時Ai WorkforceというLinuxで開発しているプロダクトを顧客企業に向けて導入するプロジェクトに参加していて、
プロジェクトの流れとしては大体3ステップぐらいあって、最初のステップ1で要件とかタスクの定義をして、クライアントさんとすり合わせをして、
ステップ2として定義したタスクにおいて十分な精度が出るように試行錯誤をする。
最後ステップ3としてその成果を報告するみたいな流れで、主に自分が行った業務はステップ2のタスクの精度上げの部分と、
ステップ3の成果をきちんとクライアントの方に報告するといった作業をしていました。
ありがとうございます。今のでいうと精度上げとかはかなり技術的にも面白いトピックかなと思うんですけど、
具体的にどういうタスクで、精度としてはどういう精度が求められるのかというのはありますか?
自分が当時具体的に取り組んでいた案件としては、三井物産クレジットコンサルティングさんへのプロダクト導入で、
そこで実際に行われていた作業として、あるテキストから必要な情報を抜き出して転記するといった作業だったり、
長い長文、何百ページも渡るPDFデータから必要な該当する部分を抜き出して、
それを情報編集して、人が読みやすい形に再編集するといった作業をLLMで行うということをしていました。
当時の技術で難しかったこととしては、やるべき必要な処理として、ただのテキスト処理じゃなくて、
画像情報が必要になるケース、例えば、PDF上で表形式になっていて、その表のレイアウトにも意味があるパターンだったりがあって、
そこの精度上げがすごく難しかったです。当時は画像認識モデルのAPIが出たばっかりで、
いろんなノウハウなどもたまっていなかったですし、単に表の画像をそのモデルに読み込ませるだけでは、望む処理というのは実現できなかったです。
いろいろ試行錯誤をしていく中で、ただ単に画像だけを読み込むんじゃなくて、
まず一旦画像をテキストに書き下す処理を行って、その画像プラス書き下したテキスト2つを入力にして、
あとはプロンプトを工夫することで望みの処理が達成できるっていうような、まさにただモデルを使うんじゃなくて、
モデルの性質とかを踏まえた上で、一工夫入れて、精度を上げる、実用に耐えうる精度に持っていくっていうのを実現できたことがありました。
その時は楽しかったですし、達成感もありました。
ありがとうございます。そうですね、当時も本当に画像のモデルが出てきたばっかりという形、画像というかマルチモダルモデルが出てきたばっかりで、
今回、このリツイブスさんクレジットコンサルティング様の業務っていうのが、
すごい長い決算資料みたいなのを読んで、そこから値を取ってくるっていう業務だったんですけど、
今伊藤さんがおっしゃっていただいたように、結構人間が見るとあれですよね、
わかるんだけど、LLMにやらせようとすると、途中でインデントが下がっていて、
人間はそれをサブカテゴリと認識できるけど、機械だと難しいっていうので、
テキストと画像、両方インプットにするみたいなアプローチを去年夏にやっていて、
それで精度が上がっていてすごいなって、NLPとかそういったところのスペシャリティがある伊藤さんならではなかったなって思ってました。
文字とか色とか文字の太さとか、人間が見たら一目でわかるんですけど、
機械では難しいだろうなっていう特徴に対処するのが結構難しかったですね。
そうですね、太字とか難しかったですね。
続けてコウセイさんの方にも聞いていきたいと思うんですけど、
コウセイさんが実際にやっている案件でしたり、ユースケースみたいなのでもいいと思うんですけど、
そこら辺ちょっとお話いただいてもいいですか。
まだお客さんの名前を出すことはできないんですけど、
ユースケースとして契約書の検索みたいなところに主に行っておりました。
いろんなビジネスチームにおいて契約書を巻くことが多いかなと思うんですけど、
その契約書を自分で作るときに結構過去にどんな契約を作ったのかとか、
そういったところの知見を使って今自分が巻こうとしている契約書を作るみたいな、
そういったことが多いかなと思います。
それをAIマークコースを使って過去の契約書を適切なタグ付けを行うことで、
構造化された契約書データベースみたいなのができて、
それを元に例えばこの業界ではこういう契約だったんだなみたいなところを
うまく振り返れるようになる、そういったユースケースを行っておりました。
ほうせいさんを横で見ていると、
かなりドメインに対して深く潜り込むみたいなところをしっかりやって
業務を進めているのかなと思うんですけど、
結構この契約書の検索といったときに、
タグ付けなりキーワード検索なりを組み合わせて、
過去に類似の契約書みたいなのを探すアプローチなのかなと思うんですけど、
業界に深く潜り込まないとなかなかそういうのが難しいのか、
もっと一般的にできるのかというと、
それでいうとどっちが経験上あったりしますかね。
そうですね。やっぱり深く潜り込まないと
お客さんとの話がしにくいというのがあるかなと思いますね。
お客さんは普段の業務のお話をされるので、
結構専門用語とかそのまま使われたりだとか、
仮定を置いたまま話されたりとかするかなと思うので、
そこをドメイン知識で補ったりとか、
これってこういうことですかみたいな仮説をぶつけるといったところが
ドメイン知識がないと、
うまく要件定義までもしにくいのかなとは感じています。
ドメインキャッチアップするのに厚生さんがやったこと。
そうですね。一つは一緒に取り組んでたビジネスサイドのメンバーの方もいらっしゃるんですけど、
その人にちょっと聞いて、
ドメインのおすすめの書籍とか、
おすすめしてもらって、
それをめっちゃ読み込んだりとかしてみたりしたんですけど、
ただやっぱりそれだけでは補いきれない部分もあったりだとか、
むしろ逆にドメイン知識がついたことによって、
これってこうなんじゃないかという仮説と事実の切り分けをできていないタイミングもあったりして、
そこはメリットとメリットがあるというか、
うまく使い分けが必要なのかなと思いました。
ありがとうございます。
メンバーとしても結構、
過去にLAXブロックチェーンをやっていたときの、
そのときの活躍していたメンバーみたいなところで、
結構金融に強いメンバーとかもいたりするので、
そういうところで社内でも聞きながらという感じですかね。
ありがとうございます。
結構お二人、ちょっと技術的に深堀る方と、
ドメイン深堀る方って形で、
ちょっと違う具体例聞けたんじゃないかなって思うんですけど、
ちょっと具体例というよりは抽象度を上げて、
ぶっちゃけLAXのAILM事業部のインターンってどうなんだろうっていうのを、
ちょっと雑にそれぞれ振って聞いていきたいと思うんですけど、
伊藤さんからじゃあまずちょっと聞きたいんですけど、
LAXのインターン参加してみて、
ぶっちゃけ良かった悪かったところ、
それぞれ挙げるとしたらどういうのがありますか。
はい、それで言うとまず、
LLMのパワーを実感できるっていうのは、
技術的に面白かったなと思ってます。
大企業で使われているいろいろなテキストデータに対して、
プロダクト上で実際にLLMに処理をさせると、
こんなにもいろんなことができるのかっていうのは、
当時すごい衝撃だった記憶があります。
研究文脈では、
翻訳をやるとか会話をやるとか、
テキストのポジティブ・ネガティブ度を判定するとか、
結構決まったタスクに取り組むっていうことが多いですし、
日常的にLLMを使うといっても、
プログラムを書いたりとか文章を書いたりするぐらいしか、
大学生の日常使いのユースケースって限られてると思うんですけど、
大企業の中で実際に使われている文章とか、
いろんな業務とかを実際に体験して、
この場合はこんなにLLMの使い方ができそうとか、
こうしたらもっとLLMを有効的に使えそうっていうのを、
いろんなユースケースを見ながら考えることができるっていうのは、
すごい楽しかった記憶があります。
最後にお二人の今後みたいなところも聞いていければなと思うんですけど、
ざっくりとした質問にはなってしまうんですけど、
この結構LLMが盛り上がっている世の中だったり、
お二人とも新卒でAIX選んでくれたっていう状況もある中で、
今後お二人がやっていきたいことっていうのを簡単に一言いただければと思います。
まず後世さんからお願いします。
そうですね、今後なんですけど、
結構世の中ではお客さんごとのカスタマイズされた、
LLMのアプリケーションみたいなのを作ってきたところがあるんですが、
今後もっと汎用的にLLMをどういうふうに扱っていくべきかみたいな、
それをプロダクトに落とし込んでいくみたいなところの開発とか実装を
ご利用に進めていきたいなとは考えています。
ありがとうございます。
伊藤さんもお願いしていいですか。
自分新卒ではあるんですけど、
受け身で仕事をするのではなくて、
こんなプロダクトだったら世の中がより便利になりそうとか、
この技術は世の中をこの方向に変えるかもしれないといった、
誰も正解はわからないものに対して、
自分なりのビジョンとか思いを持って、
それを自分の言葉で周りに伝えたり話し合ったりしながら、
自分の思いを持って仕事できるようにしていきたいなっていうのは
すごい抽象的なんですけどあって、
実際今のLLM事業部のプロダクト作りも、
レイアエクスに新卒で入社した比較的若い先輩方たちが
中心になって作り上げてきたっていう背景もあるので、
そういうのをいいお手本にしながら、
自分も頑張っていきたいと思いますし、
あとはレイアエクスさんには外部から中途で経験豊富な方たちが
たくさん入ってくることもこれまでもこれからもきっとあると思うんですけど、
これから事業が成長していって、
ポジションとかチャンスとかが増えていったときに、
中に人がいないからそこを埋めるように外から誰かを呼んでこようじゃなくて、
その時に中を見て自分には任せられそうだから、
信頼してそこを頼んでもらえるような存在になれたらいいなというふうには思っています。
ありがとうございます。
ぜひ新しいLLM時代ならではのポジションを作って、
ぜひお二人になっていただければなと思います。
今日は後世さん伊藤さんのお二人に、
かなり面白いお話を聞けたんじゃないかなって思うんですけど、
AILM事業部ではインターン生鉄算募集中です。
概要欄の方に募集のリンクというか応募のリンクを貼ってありますので、
そちらの方から応募っていうふうに書いてあるんですけど、
本当に気軽にカジュアル面談からすごく募集しておりますので、
お気軽にご応募いただければと思います。
それでは本日のLeia XNOW、以上とさせていただければと思います。
ありがとうございました。
ありがとうございました。
ありがとうございました。