生成AI研究スタジオの構築

Adventures of the Persistently Impaired (…and Other Tales)及びPI & Other Tales, Inc.は、メディアとエンターテインメント分野における創造的なソリューションの研究開発に特化したクリエイティブスタジオです。

2024年後半、元音楽業界マーケティングディレクターのDavid James Lennon(Universal Music UK、スウェーデン、Warner Music UK、EMI Records UK & Ireland、First Access Entertainment)により設立されたこのスタジオは、未来の消費財と体験の研究開発に焦点を当てています。日常的な実用性とエンターテインメント価値を融合させたモデル、アーキテクチャ、製品を開発し、最新の未来技術とIoTを紹介しています…しかし、これらすべてはほぼ完全に偶然から始まりました。

年初に始めた印刷、デザイン、パッケージングへの取り組み――CDやヴァイニル制作のためのアートワークや物理パーツを制作するという長年の情熱から生まれたもの――は、すぐに別の何かへと変わりました。気づいたのです。本当に際立つためには、印刷する製品が必要だと。それがFortunes Toldの誕生につながりました。ロンドンに拠点を置くローカルギフトブランドで、Pamela Colman-Smithによる象徴的なライダー・ウェイト・タロットデッキのイラストにインスパイアされたデザインのパーソナライズドギフトとアクセサリーの製作に特化しています。

しかし、デジタル音楽業界で20年近く過ごしてきた者が、ほぼ一夜にして香りつきキャンドル作りで生計を立てるというのは、どうもしっくりきませんでした。そして、晩秋の雨の日曜日の午後、テクノロジーへの自然な好奇心に駆られてGitHubで数時間過ごしたとき…すべてが繋がったのです。

Fortunes Toldは、リテールクロスオーバーのひねりを加えた、ユニークで体験型のオンライン世界です。その中核にあるのは、78種類の独特なデザインのホームウェアとアクセサリーのラインナップで、それぞれがタロットのカードを表しています。すべてのアイテムにはNFCまたはBLE技術が組み込まれており、ロンドンで手作りされ、ブラインドボックスに入れられ、完全にランダムに配布されます。どのカードが手に入るか、そのカードが何を用意しているか――開封するまでわかりません。

Fortunes Told Companion App(App StoreおよびGoogle Playで配信中)とペアリングすると、各アイテムがパーソナライズされたタロットリーディングを解放し、リアルタイムの音声対音声のインタラクティブ体験を通じて、時間とともに展開し進化していきます。同じリーディングは二度とありません。

もう少し違う何かが必要でした――そこで、生成AIと機械学習の研究が始まりました。シンプルなコンパニオンアプリとして始まったものは、やがてミックスドリアリティの選択型アドベンチャー体験へと進化し、ユーザーが動的な仮想世界で自分自身としてプレイするものになりました。

技術面は堅実でした。ユーザーの実際の位置情報に合わせたゲーム内の天候、Fortunes Told Companion Appで集めたタロットカードに基づいて登場するゲーム内キャラクター。そこで、私たちのR&D活動は本当に焦点を移しました――この進化する体験を動かすための、より高度なAIとMLシステムの構築へと。

コンセプト自体は有望でした。数ヶ月の開発後、Pokémon GoとNintendo Amiiboを掛け合わせたような、物理的な製品と現実世界のデータに反応する遊び心のあるつながった世界ができました。しかし、一つ問題がありました。それには本当の意味での物語がなかったのです。単独で成り立つために必要な物語の基盤が欠けていました。ワインを数杯飲んだ後のディナーで説明すると、家族は熱心に微笑むけれど…あなたが見ていないところでお互いに目配せするような、まさにそんなアイデアでした。

R&Dは、特定の素材でモデルをトレーニングし、非常に細かい要件でタスクを再現できるワークフローを構築することから本格的に始まりました。しかし、これはChatGPTのような消費者向けツールを作ることではありませんでした。ボタンを押せば、ブリーフに合わせたテキストのブロックが出てくるような。これは、クリエイターが自分の作品を前に進めるのを本当に助けるツールを作ることでした。

Storybookは最初に開発されたツールで、恐ろしいライターズブロックに悩むクリエイティブライター向けに特別に設計されました。その核心は、エージェント型ワークフローエンジンです。Writers Blockは、自然なチャットベースの体験でユーザーと関わり、現在はLLaMA 4 Scout 17B(以前は3.3 70B)を搭載しており、既存の原稿、メモ、キャラクタースケッチと連携して、空白を埋め、アイデアをつなぎ、作品に一貫性をもたらします。

70,000語を超える長文でも、複数のチャンキング方法(ドキュメントストレージとベクトルの組み合わせ、関係グラフ、そしてモデルへの各個別呼び出しを関連コンテキストで開始する別の「コンテキストプロンプトファクトリー」)を介して、キャラクターとプロットポイント全体で完璧な連続性を保ちます。事実を自動的にチェックし、歴史的な不正確さにフラグを立て、検証された結果を執筆フロー内で直接返すリサーチツールも含まれています。RAGは忘れてください。これは各ラウンドごとのディープリサーチです。そして、返される前に独立した審査ラウンドを通過することで検証されます。まるで、博識で少し強迫的で、決して眠らない編集者を持っているようなものです。

そして現在開発中なのは、ストーリーボード作成、脚本執筆、キャラクターデザイン、アニメーションと映画のビジュアル開発のためのツールです。othertales Screenwriterは、Storybookで作成された原稿を、キャラクター心理デザインに基づいて言語と対話を拡張しながら、ワンクリックで業界標準のハリウッド形式の脚本に変換します。

私たちは、映画研究の成果を使ってトレーニングされたHuman Reader Simulatorsと組み合わせたEmotional Resonance Enginesの開発に取り組んできました。これらは、対話の言語からシーン設定まで、各シーンの感情的および文脈的な重みを分析します。そして、これらのエンジンが一緒になって、トーンとペーシングに基づいて各シーンをグラフィカルにスケッチしストーリーボード化し、ユーザーと手を取り合って作業します。

バーチャルキャラクターデザイナーは、著者と共に働き、会話と反復的な提案を通じてビジュアルを洗練させながら、アニメーションとフォトリアリスティックなキャラクターデザインを制作します。そして、othertales producerがあります。テキストから長編のフォトリアリスティックまたはアニメーション映画へと作業でき、キャラクターと同期した対話用オーディオも完備しています。書籍から脚本、ストーリーボード、キャラクターデザイン、最終レンダリングまで――すべてをカバーします。

しかし…それらが日の目を見ることは決してないでしょう。私たちは、いくつかの驚くべきコンセプトを実験してきました。企業全体を複製するアーキテクチャさえも構築しました――他のモデルと会議を開催するモデルとのエージェント型フロー、着信電話に応答し振り分けるレセプショニストエージェント、バーチャルエージェント型マーケティング部門が生み出した製品をプロモートするためにプレスアウトレッ

なぜか?R&Dのポイントは、可能なものを構築することだけではないからです。何を構築すべきかを理解することです。新しい技術のエキサイティングな面とリスクの高い面の両方を探求すること。何をプロモートすべきか、そして何をそっとしておくべきかを知ることです。

生成技術の台頭について、多くの懸念があるのは当然です。それらが将来の雇用にとって何を意味するのか、人間の創造性にどのような影響を与えるのか。正直なところ、その心配は正当なものです。

本格的な消費者向けビジネスソフトウェアのリリースまでにはまだ少し時間がありますが、PI & Other Talesが制作するすべてのものには、EULAに明確な持続可能性と倫理的条項が組み込まれます。商業的な観点から、私たちの研究を通じて開発されたソフトウェアやサービスは、企業内の人間の役割を置き換えるために使用されてはなりません。もし使用された場合、ライセンスは取り消されます――返金なし、例外なし。

とはいえ、この仕事から本当にエキサイティングなツールがいくつか生まれています。最も有望なものの一つは、アトリビューショントラッキングの研究です。消費者向けツールで派生コンテンツを構築するために使用された作品のオリジナルクリエイターにどのようにクレジットを与えるかについてです。

アーティストが自分の作品をライセンス供与することを選択し、DALL·EやStable Diffusionのようなモデルがそれを使って新しいものを生成するたびに、そのアーティストがロイヤリティを受け取るシステムを想像してみてください。出力に元の作品がどれだけ関与していたかに基づいて計算されます。完璧なデザインではありません。まだ。しかし、出発点です。

そして名前は?Adventures of the Persistently Impaired (…and Other Tales)?

よく眉を上げられながら聞かれることです。創設者のADHD診断書への軽妙な頷きで、そこには「Davidは複数の機能領域において持続的に障害がある」と書かれていました。前に進む新しいビジネスのために、それを自分のものとする方法です。

以上です。研究プロジェクトの詳細については、こちらをご覧ください。

Fortunes Told――完全なバーチャル体験は進行中です。Companion Appはすでに配信されており、ディナーテーブルで間違いなく相当の目配せを受けた、いくつかの未完成の人間の原稿から制作されたベースナラティブは、6月19日にハードカバー、ペーパーバック、Kindleで発売され、すべての優良書店で入手可能です。

小売売上のかなりの部分は、研究開発に直接還元されます――生成AIにおける、より持続可能で倫理的な未来のために。