AIはファッションじゃない。Gaudiyが画像生成AIとGenerative Agentsに本気で投資する理由

2023年8月31日 10:47

未来へのワクワクと不安に満ちた最高におもしろい時代に、最高に無謀な探求を続けるGaudiy社員に話を聞くシリーズ「#今こそ無謀に」。

Gaudiyでは、2023年4月に生成AI/LLMを研究開発する専任チーム（以下、AIチーム）を発足。IP特化の画像生成モデルや、AIヒューマンのシミュレーションなどに取り組んでいます。

今回は、AIチームを主導するMLエンジニアの北川さんと3DCGデザイナーの篠原さんに、CEOの石川からインタビューを実施しました。

Web3スタートアップのGaudiyが、なぜAI領域に注力するのか。どんな未来をつくろうとしているのか。それぞれの野心とビジョン、それを実現するためのチームの在り方とは…？

北川和貴 | Kazuki Kitagawa | @k2_rod
2007年〜2020年まで大和証券でクオンツとしてアルゴリズム取引の開発・運用業務を経験。2020年〜2022年、OLTAで与信モデルとリスク管理システムの開発。2022年10月にGaudiy入社。現在は、レコメンドエンジンの設計・実装や生成AI・Agentシミュレーションを行うAIチームのマネジメントに従事。

篠原雅佳 | Masayoshi Shinohara | portfolio
2010年頃から独学で3Dを学び、フリーランスの3DCGデザイナーとして活動。スタートアップから大企業まで、数々の有名企業でキャラクターモデルの作成業務を受託。2023年1月、1人目の3DCGデザイナーとしてGaudiy入社。現在は、IP特化の画像生成モデリングに取り組む。

私たちが本気で生成AI/LLMに取り組む理由

石川：はじめに、AIチームの取り組みについて教えてもらえますか？

北川：Gaudiyではいま、主に2つの軸で生成AI/LLMに取り組んでいます。ひとつがGenerative Agentsという、LLMを活用したAIヒューマンのシミュレーション。もうひとつが、画像生成AIを活用したIP特化のクリエイティブ生成です。現在、AIチームには業務委託のメンバー含めて10名ほど所属していて、そのうち5名が専任で動いています。

石川：北川さんはクオンツ出身で、前職ではMLエンジニアを経験されてますよね。いま、生成AI/LLMのどこにモチベーションを感じてますか？

北川：実は、Generative Agentsの取り組みは、自分が元々やりたいと思っていたことにかなり近いんです。それは、社会のシミュレーションを実現すること。金融のキャリアのなかで「社会科学系の実験のしづらさ」を感じていて、社会の実現するパスがひとつしかないために検証ができないのはバグだと思っていました。

これが自然科学であれば、同じ実験環境を用意して何百回、何千回と再現できるじゃないですか。でも、社会科学はそれができない。例えば会社で新しい組織制度を導入するときを思い浮かべてみても、気軽な実験はしづらいと思うんです。

この問題は、Generative Agentsを使った社会のシミュレーションを実現できれば解決に近づきます。そのために、人間の感情までも再現できるようにしていきたいと考えています。

石川：篠原さんはいかがですか？

篠原：僕は3DCGデザイナーとして「人間をつくる」を追求してきたなかで、整形ってなんのためにあるんだろうと考えることがあって。その時に思ったのが、整形は "美の追求" のためだけでなく、事故で障害を負った人や、通常の生活を送れない人たちの "支え" でもあるなと。

そういう広い意味で、ルッキズムって人々が幸せに生きる上でノイズになりがちだと思うんです。だから、現実の容姿なんて気にしなくていいようなユニバースをつくりたい。生成AIやLLMがでてきたのは、その実現手段が増えたことだと捉えています。

石川：現在の生成AI/LLMの技術に対しては、どんな印象を持っていますか？

篠原：生成AI/LLMの登場によって、作品のクオリティが一気にひき上がったと感じる人が多いと思いますが、個人的には、お金を払いたいと思うような作品は少ないと感じてます。

ただ、これはAIの問題ではないと思っていて。本当に精巧にできているイラストでも、お金を払いたいかは別であるのと同じ感覚です。人間かAIかに関係なく、この作品にどこに価値があるのか、どんなものにお金を払いたいと思うのか。

僕の考察としては、3DCGの映像作品は、シェイプ、バリュー、ディティールの順に作られるべきで、その価値はシェイプでだいたい決まると考えています。でもAIは、技術力が要求されるディティールを先行することが多く、そこで「本物みたいだ」という評価を受ける。

なので、AIと人のどちらが優れているかではなく、AIが登場したことで、制作プロセスの良し悪しがより明確になったんじゃないかなと。テクノロジーの発展を否定するつもりは全くなくて、重要なのは、それを扱う人間の意思だと思っています。

AIをファッションで使ってない

石川：テクノロジーの進歩に対して、篠原さんはフラットだなと思います。生成AIやLLMに対して過小評価も過大評価もしていないというか。

フルスクラッチで制作できる技術力をもちながら、生成AI/LLMが現れた当初から積極的に触ってましたよね。でも自分が知る限りだと、既存のテクノロジーで成功してる人は新しいテクノロジーに対して否定的なスタンスの人も多い気がしていて。これについてはどう思いますか？

篠原：「自分の仕事が奪われるんじゃないか」「苦労して手に入れた優位性を侵害されたくない」といった感情はあるかもしれませんね。

だからと言って、新しいテクノロジーを否定したり、使わない理由にはならないと思っています。基本的に、テクノロジーがどれだけ進化しても、それを最終調整するのは人間です。そこで重要なのは、テクノロジーにすべてを依存するのではなく、なくても同じことができるように努力すること。

そもそも誰かがこの流れを止めようとしても、もはや止まらないと思うんです。それに対して「今まではこうだった」「これは間違ってるからやめた方がいい」と意見したところで、人類にとっては意味がないと思っていて。僕はただ、どんな道具も、表現方法も、技術も選ばずに、それらを使って自分が納得できる世界をつくりたい。

石川：実現したい世界が先にあってAIは手段ということですよね。北川さんはどうですか？

北川：同感ですね。私たちはAIをファッションで使ってない。とにかく真剣なんですよ。あくまでツールなので、現実世界をAIに合わせるのではなく、現実世界にAIを提供すべきだと考えています。

石川：たしかに、テクノロジーをファッションで使ってないですね。

篠原：北川さんやチームメンバーを見ていると、AIに向いている人は、実は現実世界が好きな人が多いのかなと感じますね。それがAIに本気で取り組んでいる理由なのかもしれない。

北川：そうですね、少なくとも現実を無視してない。まだ技術的なハードルが高いので、現実世界とAIとの接点を見つけることが大事なフェーズだと思いますが、それには現実世界に興味がある人の方が向いているのかもしれません。

布石を打つ点の高さが揃ってるから、議論が噛み合う

石川：AIチームは特に、全員の志がめちゃくちゃ高いですよね。ヒットを狙う人は誰もいない。北川さんは「社会のシミュレーションを実現したい」、篠原さんは「ルッキズムの概念を変えたい」という野望があって、本気で世界を変えようとしているなって。

僕としては、資本主義やコミュニケーションの問題を根本から変えたいと思って、Gaudiyを創業し、ファン国家づくりを目指している。なので全員がまったく同じビジョンを持っているわけではないんだけど、目線の高さが揃っているから、テクノロジーの議論が噛み合うというか。

北川：わかります。みんな言いたい放題ですけど、布石を打つ点の高さがあっているからこそ、チームの誰と話しても根底は気が合うねってなります（笑）。

石川：お互いに野心があるから、いい意味で寄り添ってないというか。志のために各々が持っているものをうまく使い合うみたいなイメージ。

北川：そもそもチームワークって仲良くすることじゃなくて、「圧倒的な個」が前提にないとおもしろくないじゃないですか。

私は、世界的な物理研究チームが理想だなと思うんです。例えば核融合の研究チームって、少数精鋭のメンバーが世界中の拠点にいて非同期でやってるんですけど、プロジェクトがきちんとワークするんですよね。個々のレベルが高いから、お互いの弱いところを自発的に補完し合える。

石川：言葉としては「協力」より「力の掛け合わせ」ですよね。それぞれの野心や美学をベースにした上で、お互いのクオリティの水準をお互いにひき上げられる。

最近ある書籍で読んだ「自分の美学や信念を貫きながら、周りを幸せにしていく」という一節が、まさにその通りだなと思っていて。僕らって全員が自分のやりたいことをやるタイプの人間じゃないですか。でも、そのためには周りの人の力が絶対に必要で、そこでは協調性やチームワークが大事だなと思います。

北川：もうひとつ、いまのAIチームにはアニマルスピリットが必要だと思います。生成AI/LLMは新しい分野なので、アンチパターンがわからなかったり、ゼロから設計しないといけなかったりする場面も多々あります。

例えば、Generative Agentsの論文を元に実装するにしても、結局、どんなサービスにしたいのかによって設計の仕方が全然違うんですよね。前提としてスキルの高さは間違いなく必要ですが、自分の頭でしっかり考え、諦めずに挑戦し続けられるマインドセットが、特にこのタイミングは重要だと思っています。

「圧倒的な個」に必要なプロフェッショナリズム

篠原：僕は他の人と、技術で殴り合いをしたいんですよ。石川さんは本気で殴っても殴り返してくれるからやりやすいんですけど（笑）、反撃してもらえないことも多くて。ただ身近にいなかったとしても、作品を通じて遠くからぶん殴られることもあるので、そういう出会いをしたいです。

北川：負かしてくれる人の存在が、自分を前に進めてくれますよね。過去を振り返っても、そういう経験ができたときが一番成長したと思うし、いまだにずっと求めてるのかもしれないです。たまに「こいつやべえな」っていう人がいますから。

篠原：僕は14歳くらいの子にボコボコにされたいです（笑）。

石川：たぶん二人とも勝ち負けにこだわりがあるわけじゃなくて、目的を達成するために、自分を強めてくれる人がほしいっていうことなんでしょうね。

篠原：結局、テクノロジーでも人間でも、自分のレベルをひき上げてくれる機能をなにかしらに求めてるってことかもしれません。興味の方向性が大体決まっているから、そこにアンテナを張ってると敵とエンカウントして、勝ったり負けたりしながら一歩一歩進んでいく。すると全然関係ないことにも興味が出てきて、幼稚園児が描くような落書きをみて「これはちょっと芸術かもしれない」って思ったりもします。

北川：点と点がつながる感じ、ありますよね。私もインプット期間は「横に広げる」のを意図的にやってるんですが、去年は「毒」の研究をずっとしてました（笑）。

篠原：わかります。側から見てると頭おかしいけど、本人は大真面目なやつ（笑）。

石川：複雑な社会だからこそ、様々な視点や知識をインストールするのは大事ですよね。プロフェッショナルな人に共通する部分っていくつかあると思っていて、インプットの仕方もそのひとつだと思ってます。他にも、お二人の社会の見立てや、専門領域に対する心構え、戦い方など、めちゃくちゃ勉強になってますね。

最先端のR&D技術を、社会実装できる可能性が高い場所

石川：実務者の目線で、Gaudiyで生成AI/LLMに取り組むことの魅力ってなんですか？

北川：R&Dで扱うような最先端の技術を、真っ先に社会実装できる可能性が高い場所がGaudiyだと思ってます。特に、IPとユーザーという2つの要素が揃っているのが大きいですね。

生成AIはIP企業にとってビジネス的な影響が大きいので、当然ながら関心は高いです。一方で、技術的な不確実性や既存ブランドの毀損リスクなどを孕むため、自社内でスピード感をもって本格的にコミットするのが難しい現状があります。Gaudiyは、これまでのIP企業との信頼関係が技術とコミュニティ運営の両面にあるため、「生成AI技術もGaudiyに任せよう」となりやすい点が強みに感じています。

またR&Dだけでなく、それを実際のサービスに落とし込む際に、触ってくれた人から「おもしろいね」っていう反応をもらえるのが楽しいんですよね。いまはまだ課題もたくさんありますが、そこを突破できたら世界に行けるっていう感覚があるので、総じておもしろいです。

篠原：IPを公式に扱えることの魅力ももちろんありますが、自分たちにIPがないからこそ、どういう体験にすべきか、どんなことが実現できそうかを考える余地が広いと思いますね。柔軟性と自由度が高い。

北川：それはありますね。癖のあるメンバーしかいないけど、このチームなら実現できそうだなって思います。

石川：生成AI/LLMの社会実装や先端テクノロジーのマスアダプションって、すごく複合科学だと思うんですよね。例えばインターネットのブレイクスルーを起こしたのは、ブロードバンドであり、スマートフォンだったと思うんですよ。

なので、LLMにおいてもまずインターフェースが必要で、僕たちの場合はコミュニティサービスを持っている。加えて、人を集める部分はIPの力を借りることができて、その魅力を生かすには3DCGなどのクリエイティブの力がすごく大事なんですよね。そう考えたときに、複合的な環境要因と、複合性を扱えるプロフェッショナルな人たちがいるということが、Gaudiyの魅力になっているのかなと思います。

AIの未来は「Virtual Doing」から「Virtual Being」へ

篠原：テクノロジーの発展とともに "愛" が消えていってるのではないか、という仮説について、先日北川さんと話していたんですけど。これまでの現実世界にあるコミュニティでは、多くの人に "愛" が発生していたのに、SNSなどのデジタルに変換された瞬間に、それが消えていったように見える。それはなんなんだろうって。

北川：その原因は、情報の欠落だと思うんです。まさにAIエージェントを開発しているなかで、人間って非言語コミュニケーションがすごいなと改めて感じていて。話すときの「間」や声のトーンなどにもかなりの情報量があって、そこから愛があるかを察したりするんですよ。

石川：東北大学で行われた最新の脳科学実験でも、「オンラインでは情報は共有されるが、感情を共有するのが難しい」という結果が出ていますよね。感情パラメータの共有がなされないデジタル社会では、そりゃ揉めるよねって思います。デジタル社会における誹謗中傷なども、情報しか伝わらないから悪意に見えるっていうのが根本の問題にある気がしますね。

北川：結局、愛のあるAIを実現するためには、Virtual Doing（バーチャルドゥーイング）からVirtual Being（バーチャルビーイング）に移行する必要があるんですよね。

Virtual Doingとは、話す、聞く、みたいな機能で、これだと愛が伝わらない。これまでの人工知能は、このVirtual Doingだったわけです。一方のVirtual Beingは、その人が存在する情報がすべてある状態だから、その人の感情もわかるようになる。Virtual Doingのうちは所詮AIだと思っていて、Beingまでいかないと、デジタルは現実を超えられないと思うんです。我々はそこを目指していきたいですね。

篠原：僕は社会の生きづらさみたいなものに対して、人を変えるより、世界を変える方が実はコスパがいいんじゃないかと思っていて。他人を変えるのは難しいからこそ、その環境を変える方が、まだ実現の余地があるんじゃないかと思っています。幸せから人を遠ざけるようなノイズを排除し、人の想いを集めて、愛を生む。そこに取り組むことで世界を変えていきたいです。

（取材：石川裕也、文・編集：山本花香、撮影：都築空）

💁‍♀️インタビュイーに話を聞いてみたい方へ

📣「#今こそ無謀に」をテーマに、各種コンテンツを発信中です！

🌻会社に興味を持っていただいた方は、ぜひ下記リンクもご参考ください。

- コーポレートサイト：https://gaudiy.com/
- 採用サイト：https://recruit.gaudiy.com/
- 会社説明スライド：https://speakerdeck.com/gaudiy/culture-deck
- カジュアル面談ページ：https://recruit.gaudiy.com/casualtalk
- 公式Twitter：https://twitter.com/gaudiy_inc