本日、ThoughtSpot for Sheetsに対応したAI Explainを正式にリリースいたしました。これは、データリテラシーやデータ探索のための究極の「チートコード」とも呼べる機能です。GoogleのPaLM 2 LLMが統合されたAI Explainは、Bisonモデルを独自に活用して、ThoughtSpot for Sheetsの拡張機能で作成されたあらゆるビジュアライゼーションに最良のデータストーリーを自動生成します。
まだThoughtSpot for Sheetsに馴染みのない方は、ThoughtSpotのGoogleスプレッドシート用の無料アプリプラグインをお試しください。このプラグインでは、自然言語検索と生成AIを使用し、対話型データビジュアライゼーションを通じてスプレッドシートデータの探索ができます。このアプリは、2022年10月にリリースされ、Fortune 500企業やスタートアップ企業、非営利団体、大学などすでに数千人のユーザーがいます。
ThoughtSpot + Vertex AI with PaLM 2
LLM主導型の生成AIが拡がるにつれ、この新しいテクノロジーの独創的な応用例も見られるようになってきました。チャットボットはもちろん、喜ばしいとは言えませんが、AIが作成した詩も当たり前のように見られるようになりました。
ThoughtSpot for Sheetsの合言葉は、「データのATM」です。今や両替もデジタル処理が普通とはいえ、この比喩はなかなか的を射ています。世界のどこにいても誰もが、ATMに行ってボタンを数回押すだけで、価値あるものを手に入れられます。現在でも、ATMは世界の中で最も直感的に操作できるソフトウェアモデルだと言えるでしょう。
一方、分かりやすい分析結果をより簡単に手に入れたいという声が、マーケティング分野でかねてから聞かれます。それも至極もっともなことです。ドメインエキスパートのビジネスデータを理解する能力が向上すれば、ビジネスの軌道はきっと上向くはずだからです。ただし、それには常に難しい課題がつきまとい、それを克服するには創造的な試みが必要でした。
PaLM 2 LLMモデルは分析結果の自然言語への変換に利用できる強力なツールですが、この新しいアプローチにもやはり特有の課題が伴います。とはいうものの、そうした課題が克服できれば、これまでよりずっと目標達成に近づくことができます。
分析結果を自然言語に変換する生成AIのユースケースを予備的に調査した結果、私たちは次の2つの重大な壁に突き当りました。まず、(1)プロンプトの長さには制限があり、分析を求めるプロンプトに多量のデータを無理に押し込むことになる点、それに、(2)AIモデルがときに装飾を加える点です。冗談で言っているわけではありません。これでは結果の正確さが失われかねないのです。生成AIに少しでもかかわったことがある人には、秘密でも何でもない事実でしょう。このため、正確性を最優先し、正しく信頼できる、すぐに行動に結びつけることができる情報をユーザーに提供するにはどうすればよいのかが課題となります。
この2つの壁を打ち破るThoughtSpotの解決策は、分析結果やモデルそのものとの関わり方にありました。ThoughtSpot for Sheetsは「text-bison@001」と呼ばれるテキストモデルにPaLM 2を使っています。このモデルは「自然言語の指示を実行できるように微調整され、分類、抽出、要約、コンテンツ生成といった多様な言語タスクに最適である」と言われています。そこでThoughtSpotのプロセスの概括的な部分では、クエリーおよび分析結果に基づき、モデルに対して「この結果をまとめてThoughtSpotアプリ専用のフォーマットでサマリーを返すように」と(丁寧に)指示するプロンプトを作成することになりました。
プロンプトの長さと「装飾」の壁には次のように対応しました。
検索クエリーの結果は一時的なインメモリデータベースに送られます。このプロセスの実行に必要な時間が過ぎれば、何も残りません。
多数のSQLクエリーが企業の所定のルールに従って実行されます。目標は、プロンプトに到達する前に大量の分析結果を少数の重要なインサイトに集約することです。こうしてプロンプトに加えられるデータ量を最小化し、プロンプトの長さの問題に対応しています。
返されたサマリーは即座にフォーマットが正しいかどうかを評価し、ブラウザーに返送します。ブラウザーでは生成されたビジュアライゼーションの横のサイドバーに表示されます。
私たちのプロセスでは、AIによって「装飾」の機会を制限するために、尋ねる質問に制限を設けています。分析の照会から、どのような情報が求められているのか(上位10件か、下位10件か、それとも異常値検出かなど)が分かる場合も多いのですが、その情報を簡単な方法で伝えることがこれまでの問題でした。そこで、ThoughtSpotでは分析結果の自然言語への翻訳に生成AIを使用しています。これにより十分に対象が絞られたユースケースが作成され、AIは有益な説明をユーザーに提供することに集中できます。
生成AIでデータリテラシー問題を打破する
データの世界は広大かつ複雑です。この仕事の面白みもそこにあります。しかし私たちを悩ませ続けている数値がひとつあります。それはまるでカタツムリのように遅々として上がらないユニバーサルアナリティクスの導入率です。これには多くの理由がありますが、AI Explainがまず解決をめざそうとしている問題はデータリテラシーのようなデータの問題です。
真実は明らかです。インフォメーションワーカーの多くは、チャートやビジュアライゼーションの解釈に最適な方法を分かっていないのです。これはどう読み取ればいいのだろうか、これはどういう意味なのか。ここから得られる重要な所見は何であるのかなど、データを目の前にしたときに抱くこうした調査上の本質的な問いを、私たちは忘れてしまうことがあります。まるで数学の方程式のような結果を示されることほど、意気消沈させるものはありません。特に単純な疑問の答えを見つけ、目下の課題を片付けたいだけの人には、酷な話です。ここで登場するのがAI分析です。
物語として解説する技を極めることで、この壁は克服できます。ただし、コンテキストを理解していなければ、データを使ってストーリーとして解説することはできません。AI Explainは、この重大な課題に対するThoughtSpotの回答です。ビジュアルデータの解釈についてすでに仮説や確実性が得られているような場合でも、AI Explainを使用するとあらゆる角度から手早く確認できるだけでなく、物語の糸口を提示したり、取りこぼせない重要な要素を指摘したりと、ディシジョンインテリジェンス への道が開かれます。
分かりやすい説明が可能になった今、お客様がよりスマートなビジネス展開を実現できるようにサポートすることが私たちの目標になりました。すべてのインサイトが魔法のような瞬間をもたらすわけではありませんが、データを扱いなれた人にはありふれて見えるものが、別のコンテキストを持つビジネスユーザーにまったく新しい次元を開くこともあります。AI Explainは、お客様に代わって判断するために存在するのではありません。お客様が新しい角度から見て、学び、ビジネス判断を自ら即座に下せるようにサポートすることがAI Explainの存在意義なのです。
AI Explainの今後の展開
ThoughtSpot for Sheetsで一層の飛躍を期する私たちは、Google CloudおよびVertex AIチームとのパートナーシップに大きな期待を寄せています。世界中のGoogleスプレッドシートユーザーが自由かつ簡単に強力な生成AIにアクセスできるようになるのです。学生、非営利団体、エンジニア、マーケッター、CEOのいずれであろうと、立場にかかわりなく、AI Explain with PaLM 2は無料のデータインタープリターとしてご利用いただけます。
今後の計画として、私たちはAIモデルの正確さと信頼性のさらなる向上に力を注ぎ続けます。そして、大規模言語モデル(LLM)のイノベーションの進展に合わせて、語調、ストーリーの解説能力、ストーリーの要約の提供の実験作業を続け、言語エクスペリエンスの可能性を広げてゆきます。
当面の間、ThoughtSpot for Sheetsの拡張機能をインストールすることで、AI Explainのイノベーションを無料で体験できます。開始方法の詳細については、当社のブログGoogleスプレッドシートでのデータ分析にThoughtSpotを活用する方法をご覧ください。
また、ブログ「ThoughtSpotがGoogle Cloudと提携し、AIを中心としたBIの実現へ」もご覧ください。