資金調達を実施されたばかりの企業家の人生や事業の裏側に迫る、Startup Now🦄、
ストックマーク株式会社代表取締役CEO 林達さんへのインタビューの続きをお送りいたします。
前編では、日本に生まれて台湾で育ち、ご両親が貿易のビジネスをされているところを間近で見られつつ、
そしてご本人も圧巻していたというところもいただきましたけれども、小説家を目指されたり、そして大学では企業の宗教論というところを学んだりされながら、
そして学生企業もされ、日中間の学生フォーラムなど主催され、そして新卒で伊藤中将理に入られまして、4年間勤められた後に有馬さんと一緒に起業されたと、そんなエピソードをお伺いしてまいりました。
後編では、そんな林さんが仕掛けていらっしゃる事業や組織について迫ってまいります。
ここで、Startup Now🦄を応援いただいている番組スポンサーからのお知らせです。
この番組はOPSRの提供でお送りします。デザインでビジネスを前進させるなら、OPSR、UI、UX、コミュニケーションデザイン、どんな依頼でもOPSRなら制作実績を基に経験豊富なデザイナーとマッチング。
共同創業者の田子さんとは大学が同じで、諸石さんとはStartup Now🦄のイベントで出会いました。デザインの力に対する熱い思いに刺激をいただいています。
デザインにお困りのスタートアップは、ぜひOPSRと検索してみてください。
それでは、林さん、改めましてよろしくお願いいたします。
はい、よろしくお願いいたします。
よろしくお願いいたします。まずは、どんな事業をされているのかという点、詳しくに教えていただけますでしょうか。
前編からつなげて言うと、我々はもともとB2BのSaaSではなく、2Cのアプリを作っていたんですね。
その前編で話したアリマといろんな企業プランを考えていて、100個ぐらい考えて、その中から何か選ぼうみたいな、そんな感じでいつも合宿とかしながら話し合っていたと。
その時は全然今のAIとか関係なくて、当時僕昔台湾に住んでいたので、タピオカドリンクをやろうみたいな10年前の話をしたんです。
そしたらもっと実はSaaSより儲かったかもしれないみたいな、多少の気持ちはあるんですが、みたいな関係ないいろんなビジネスを考えていたと。
その中でとはいえ、我々の軸って何か、なぜかというと、最近創業者なんでマーケットフィットみたいな話もありますけど、
ちゃんと自身でもやりきれるものって何だろうと思ったら、やっぱり我々ってデジタルネイティブの最初の走りだと思ったんですよ、世代的に。
そこで一番最も起きている課題って何かっていうと、情報の非対称性だと思う。
例えば総務省が出しているデータでいうと、01年、2001年か2009年までの間に、情報の消費量っていうのは人間でそんなに進化しないんで、
変わってない、情報の接種量っていうのは。一方、情報の流通量は2倍ぐらいになっていて、どんどん情報があふれてしまっていると。
例えば当時、我々が企業省と考えた2015年とか4年とかも、キュレーションアプリがどんどん出てくる。
情報量が増えていくんだけど、うまく人間接種できない。本当に世の中が良くしているのかというのを思っていたので、そこを解決したいと思った。
最初は、実は情報キュレーションアプリの本当のAI版を作りたい、みたいなことを思った。
GNACさん、スマニューさん、ニュースティックさんみたいな、そんなような。
そうなんですよ。なんですけど、それを今作ってもマーケットフォーはしてるんでよくないなと思って。
端の高い人何やってるんだろうと思ったら、情報を貯めてると。その情報を貯めて、それを使ってるんじゃないかみたいな。
僕自身も企業の準備のためにEvernoteとかに数万記事貯めてたりとかしてた。
それすごい貴重なデータでもあったけど、使い切れてないというのがあったので、ストックしたデータを意味付け、マークするという意味でストックマーク。
個人向けの、今でノーションみたいな、そんなサービスを作ってた。
そこ解凍中辞めて半年ぐらいは、当時で言うと最先端のAIがゴリゴリに入ったスーパーアプリみたいなのを作ってたんですね。
とにかく頭でっかちで、企業したことないやつらが考えそうな、最高峰の機能を詰め込めばみんな使えるだろうみたいな、そんなゴリゴリのアプリを作ってたという感じですね。
当時、7、8万、10万弱ダウンロードまで行ったんですけど、全然バレンタインズでも考えてなくて、どうしようみたいなことを考えてたら、
当時、テックランチがまだあった時代だったので、テックランチにストックマークの記事が載って、それを見たとあるビジネスパーソナルの方が、君たち面白そうだった。
と話してみようということで、メールくれたんですね。じゃあ会いに行きますって言って、会いに行ったら、その人、ドイツ系の日本の伝送みたいな、ティアワの自動車部品メーカーの日本の広報部長さんだったんですね。
その方が言ってたことが、我の運命を変えたという感じですね。
言ってたのは非常にシンプルで、日本の企業はユデガエル化していると、それを情報で変えたいんだということを言ってたんですね。
なぜかというと、2016年、2017年でもグローバルで言うと、スマートシティが始まってたりとか、EVだったりとか、自動運転が来てたりとか、日本の自動車メーカーもそれと同じことが続くと思っていると、みんな事業の進化しかやらないというふうに言って、もっと探索しなきゃいけないと。
そのために海外の最先端事業、日本のスタートアップとか、新しい事業にコメントをつけて発信していったりとか、そういうようなサービスになって、みんなの目を外に向けさせたいんだということを言って。
そこで僕もすごく共鳴して、商社なんかまさに情報で仕事をやっているような業態でもあったり、その情報の重要性というのも分かったし、確かにどんどん日本人の情報の接種とかも、キュレーションによって狭まってきているなと感じたので、そういうようなサービスを作れないかみたいなシーンだった。
その日からストックマークってアプリを捨てて、2週間でプロタイプ作ってくるので、できたら買ってくださいねってその人が言って、よっしゃよっしゃ、分かったと。少しから当時有馬ともう一人エンジニア、僕が高校の同期、後輩を引っ張ってきているので、その3人でも一気に開発をして、その2週間後に持ってったら、もうこれだよと、面白いなと思って、もう買うよと。
ある意味、いくらぐらいだったかな、600万とか700万とか、シードマネーみたいのを最初に受託で取ったんですね。なので、ANSは実は最初は受託のサービスから始まっていて、そこから東映サースにしようと思っていたので、ロゴと色変えたらもう展開できるように準備は進めていたという感じですね。
一人の大企業の中の挑戦を熱くたぎっているおじさんの熱意に応えていったら、今の絵にたぎった、前回ご紹介したビジネス版のGoogleみたいな、世界中の情報を改めてビジネスカットで整理をして、ビジネスパーソナルの情報収集を支えるような、そんなサービスに仕上がっていった。
そういうことだったんですね。製造業のお客さんを中心に活用が進んでいますというのがプレスリリースに書いてあって、パッと見ると別に製造業に受けるっていう業界特性ってあるのかなって思ったんですけど、やっぱり発端が自動車メーカーさんからの依頼だったから、そういう業界的に使いやすい仕組みとしてなっているってところがあるんですかね。
ありますね。あとは製造業ってやっぱり日本の製造業は、特に製品分離、作るところと売るところが結構分離している。お客から結構遠くなっちゃってたりするんですね。さらに日本ってもっそり革紙の材料系とかもすごく強かったりするので、お客さんから遠いという状態になってしまうと、どんどん情報感度が下がってしまうというところがあるので、製造業の方々の情報収集より使っていただいているという理由かなと思います。
ありがとうございます。今のお話が多分、Aニュースと呼ばれるビジネスニュースを集めて、ご客企業に合う内容をAIが分析するみたいなサービスだと思うんですけど、これ以外のサービスでいうとどんなものがあるんでしょうか。
我々は今、SATという精製AI基盤、データの構造化基盤といったような、そんなサービスを運営しています。何をやろうとしているかというと、簡単に言うと、ラグの精度をもっと上げますよという、精製AIの活用を促進しているというイメージですね。
今、大体日本の企業7割ぐらいが精製AI活用しているという状態になっている。そのうちのほとんどのユースケースは、まずは社内のデータ、PowerPointとかPDSとか、そういうデータをどこかにアップロードして、それを検索するんだけれども、それを検索するだけじゃなくて、その中から情報を読み取ってまとめてくれるみたいな、そんなユースケースがある。
それをAIの領域で言うとラグという言葉で言うんですが、そういうことをやっていると。そのときに何が課題になるかというと、LM、精製AIの知識みたいなことが話題になりがちなんですけど、実はここはもう結構過疎になっていると。一方、未だにデータはずっとぐちゃぐちゃ。ぐちゃぐちゃなデータをAIにインプットしてもぐちゃぐちゃなアートプットしか出ない。データをきれいにしないとダメなんですね。
特に日本とかって紙エクセル紙パワーポイント、複雑な資料を作る人が多いじゃないか。それをAIにうまく読み取ってくれない。なので我々で言うと、SATというサービスを使ってデータとLMを間に入って、LMがうまく解釈しやすいようにPowerPoint PDF Excelみたいなものを変換するみたいな、そんなサービスをやっている。
なるほど。ちょっと文中に出てきたラグというものは、Retrieval Augmented Generationと呼ばれる、LMに対して外部の独自の情報を組み合わせて回答の精度を向上させるような技術というのが一般的な定義かなというのはちょっと補足しておきます。
そしてそうなると気になるのが、モデルってどうしてるんでしたっけっていうところでして、まず何を対象としたモデルにするのかっていうところからお伺いしたいなと思ってるんですけど、一番最初の2020年頃、ウィルさんから調達した時のプレスだと文章を解析するAIってありまして、つまり構造化されたデータが中心だったのかなと思うんですけど、直近のリリースを見ますとどちらかというと非構造化データの強みみたいなのをされてるなと思っていて、
これはもともと最初構造化から入って非構造化にいくぞっていうところだったのか、それとも近年の生成AIのブームによってできることが変わってきたから、じゃあ非構造化もやるかっていう感じになったのか、その辺りを教えていただけたら嬉しいです。
ずっと我々一貫してビジネスによるドキュメントの検索だったりとか、さらに生成というところに動かしてきたと。なので非構造化は非構造化の領域からずっと最初からやってたんだけど、その非構造化で扱える領域と非構造化度合いがどんどん高くてもできるようになってきたという感じですね。今までは一定のフォーマットで書かれたものしか読み取れなかったのが、今でいうとかなりフリーフォーマットで自由に書かれたものでも自在に我々のモデルのLMが読み取ってくれるみたいな、そんな状態になってきたという変化ですね。
ありがとうございます。こういういろんな情報をユーザーさんに最適な形で届けるというサービスをやっていくと、どこかで自分たちの独自の記事を書こうとか、独自リソース元になろうという構想も出てきてしまうような気もするんですけど、そこには行かずにあくまで情報というのはパブリックのもの、もしくはお客さんにあるものを使って、合わせるところだけをフォーカスするんだというのはずっと変わらない軸なんですか。
そうですね。我々がコンテンツを生成するというような得意分野でもないので、基本的にはオープンになっているもの、そして今でいうと企業の中に眠っている構造化データを活用してモデルに学習させていくみたいな、そんな動きになっている。
例えばリリースするものだとパナソニックさんと一緒に、パナソニックさんの社内のデータを使ってパナソニックLMを作ると。チャットGPTに回答させると汎用的な答えしか出てこないけれども、パナソニックLMに回答させたら、あたかもパナソニック社員、例えばパナソニックのコンテキストですね、パナソニックの製品情報とか、競合とか、ご客とか知っているようなアウトプットが出せるようなモデルを作っていくみたいな、そんなことを支援して。
パナソニックさんだけじゃなくて今後はどんどんいろんな企業でも展開していくし、我々も実は水面下でソニックさんとご一緒していくみたいな、そんな意味ですね。
ありがとうございます。ちょっとモデルの話にまた戻りたいんですけれども、これだけグローバルでLLMのモデルに対して注目が集まってきて、他社だと例えば桁違いの資本でモデルの精度を上げていく中、
ここ独自のモデルにこだわるのかどうなのかっていう、もしくは他社のデータに対して追加学習をさせるのかっていうアプローチで戦略の分かれ目があるなと思っていて、数年前のリリースを拝見するとあくまでベースは他のLLMを使って、そこからの追加学習っておっしゃってたんですけど、直近だと他社のLLMを使わずにフルスクラッチで事前学習っていう戦略にシフトされたのかしら?
なんていうこともちょっと思ったんですけど、この辺りはちょっとどんな背景があったのかとか、今どんな戦略になっているのかというところを教えてください。
我々も当然ですね、いろんなLLMは使いこなしていますと、自社のものだけではなくてというところですね。その中で、当然汎用LLMが素晴らしいところもあれば、限界も見えてきたというところ、その限界を超えるためには自社で作らなきゃいけない、自由が出てきたというところが非常に大きなところですね。
当然、ハイパースケーラーたちが巨額の資本を使ってLLMを作っているということをやっているんですが、それでも結局幅広く全員に使ってもらうことを汎用LLMで試行しているので、そうするとどうしても一領域ごとのデータだったりとか知識が薄くなるんですね。
例えば日本語という意味にとってみてもですね、実はGPT-4とか汎用モデルに入っている日本語の量って0.1%か0.1%ぐらいと言われていると。そこでいうと実は、弊社のほうが既に日本語のデータ量としては多くのデータ量を持っていて、日本語には強いみたいなものが作れたりとか。
そんなに実際にB2Bで使うときに、例えば俺のお客様で自動車の知識を持っているか、科学の知識を持っているかというと持っていないと。そうするとそこの領域というのを深掘りすると、実際にはGPTみたいなモデルよりも大きな精度が出るみたいな、そんな状態になると。
なのでLM自体も使い分けになっていくと。ソフトウェアがいろいろあるようにLM自体もユースケースに応じて使い分けになっていくという観点で言うと、より小さく特化したモデルでもグローバルでしっかり戦えると。そんな状態が作れるかなと思う。違う戦いかどうかが違うというイメージ。
なるほどなるほど。そういう意味で言うと、ストックマークさんはどの領域に特化されている強みがあるLMになってくるというふうに理解すれば良いでしょうか。
我々はビジネスというところに特化をしている。なぜかというと、ANewsを使って7年から8年ぐらい世界中のビジネスウェブデータを集めてきたんですね。実はこれが最も貴重なデータ資源になっていて、だいたいLMを作る会社さんってほとんど実は同じようなデータを使ってるんですね。
なぜかというと、言語資料を自分では持っていないので公開されている共通のコモンクロールと言われるようなウェブのコーパスを使っている。一方、我々はそこで結構雑多なデータが入っている。ブログとかSNSとか。一方、我々はビジネスに特化したクオリティメディアの情報だけをしっかりと抽出してそれを学習させるので、一緒にビジネスの知識が豊富なモデルを作れるというところが大きな特徴ですね。
ありがとうございます。すごい面白い話だなと思いつつ、今回皆さんが気になっているのはやはり資金調達のところかなと思ってまして、ちょっとそちらに切り込んでいきたいなと思っております。今回ですね、やっぱり注目されているのはポラリスさんと呼ばれる日系のプライベートエクイティファンドですね。
投資家に迎えておりまして、ポラリスさん、グロース株でいうとベイクさんとかボヤジグループさん、古くはワークスさんなんかに投資されていることで知られていますけれども、あまりこのテックのグロース株を100%買収ではない投資っていうのはやられていないPEなのかなというふうに理解しております。
そんな中、今回ポラリスさんをなぜ投資家に迎えたのかみたいな経緯と何を彼らに期待しているのか、そしてこういったテックグロース投資に慣れてない人と組むことに対して不安じゃなかったですかっていうところ。あとは他にどんな選択肢があるのかポラリスさん選んだんですかみたいなシャケトークをちょっといただけたら嬉しいなと思います。
まず大前提、どんなファイナンスの方針を持っていたかというと、基本的にはハイパスX系だったりとかオープンエラーとか含めたところで巨額の資本が戦っているので小さく特価とはいえ、我々の実力値で集められる分を集め切るというところを考えていたと。
特にグロースの市場も難聴な中で上場してもそんな資金調達が上手くいかないという中でいうと、微小上でも集め切れる分は企画化はあまり気にせず、事業を中長期的に大きくするための最後のラストファイナンスとして集めるというところでフォーカスをしていたと。
その結果、VCさんとPEさんという形、あと事業会社も含めてデュアル、トリプルでいろんなところと話をしていた中で最も好条件かつ金額として大きく出してくれたのがプライベートさんだったからプライベートさんを選んだというのがすごくシンプルな話と。
条件面で違ったと。
そうですね、もちろんですもちろん。そこがシンプルな話という感じ。
あとはどうですかね、PEさん入ってきて怖くないの?みたいな話もよく聞くので、その辺のお知らせをすると、まずポラリスさんがこのグローツに投資するというのも新たなチャレンジであったというところですね。
そこで代表の小木村さんだったりとか、今回我々の投資をリードしたのが梶村さんとか、そういう方々もやっぱりチャレンジをしていきたいんだという気持ちをすごく感じていって、さらに我々と一緒に新たな事業を作りたいという気持ちをすごく感じたというのが大きなところですね。
当然彼らも慣れてはいない領域だと思うので、100%で行ないし、一緒に事業を作るパートナーとしてすごくまず馬があった、気持ちがあったというところが大きなところかなということですね。
さらに我々今後のやっぱり成長を考えていっても、スタートアップVCってある意味村的なところもあったりとか、なのでその中で通じる言葉だったりとか、ビジョン、ミッションとかもその中で受け入れやすいものとか、事業もその中で受け入れやすいものというのをどうしてもスタートアップ最適化しがちだと思うんですね。
一方、最初に当然ポライズさんにお話しする時にも伝わらないことが多々あったわけですよ。でもそれってある種、我々が分かりづらいんだなと思ったんですね。これからより大きくいろんな人たちにサービスを使ってもらう。
もしIPOも含めて、社会の好機になっていく中でいうと、我々がもっと分かりやすくならないといけないし、感覚を合わせなきゃいけないなと思って、そのための準備期間でもあるということを考えても、合わないということは悪いわけではなくて、そこをしっかり我々がアジャストしていくべきだなと思ったというのが優等生的な回答です。