BLOG ブログ
データ分析事例を紹介。コンテンツ作成だけではない、タスク解決を目的とした生成AIの活用について
ChatGPTの登場が火をつけた生成AIブームにより、大きく変わろうとしているビジネスシーン。幅広い業務が生成AIに置き換わると予想されており、各企業が取り組んでいる業務の効率化事例にも注目が集まっています。
ChatGPTの活用事例としてよく取り上げられるのが、メールの文面や議事録の作成、企画立案のサポートなど。しかし生成AIという技術の可能性はそれだけではありません。
今回はsodaのデータサイエンティスト古橋和宏に話を聞きました。生成AIとは何か。何が得意で、何が苦手なのか。基本を押さえつつ、sodaが取り組んでいるデータ分析の事例を交えて、生成AIのビジネス活用の可能性を紹介します。
生成AIの基本的な仕組みと、ビジネス活用が期待される背景
―――まずは古橋さんの担当業務についてお聞かせください。いつもはどのようなお仕事をされているのでしょう?
古橋: データサイエンティストとして、データの分析やAIの開発を行っています。具体的なところでいうと、マーケティング投資の最適化をはかるMMM(マーケティング・ミックス・モデリング)の「MEDIA CANVAS」の開発などです。感情分析やトピック解析といったテキスト解析の分野での業務もよく行なっています。
感情分析の詳しい解説は、sodaコーポレートサイトの記事をご覧ください
感情分析とSLDAで文章から感情係数付きトピックを抽出してみる | soda
―――生成AIへの対応はいかがでしょうか?
古橋: やはり最近は生成AIを業務に活用したいとご相談いただくことが多いですね。クライアントのご要望に合わせて開発や活用のご提案をしています。
テキスト解析の業務も今は生成AIを随所に組み込んでいて、以前より分析のスピードも精度もぐんと上がり、より高度な結果を提供できるようになってきました。
―――やはり生成AIに関するご相談は多いのですね。では、生成AIについて改めて教えてください。何ができるものなのでしょう?
古橋: 生成AIには、生成物の種類によってテキスト生成や画像生成、動画生成、音声生成などさまざまな種類があります。中でも業務効率化という点で注目されているのは、人が書いたような自然なテキストを生成できる、テキスト生成AIですね。
これはLLM(Large Language Models:大規模言語モデル)と呼ばれる、言語を理解し生成する能力を持った人工知能を利用しています。文章に存在している単語のパターンや関係性を学習して次の単語を予測し、テキストを出力していくという仕組みになっています。
LLMの代表的なもののひとつがGPTです。生成AIブームの火付け役となったChatGPTは、このGPTをチャットによる対話型のインターフェースで使えるようにしたものです。
―――なぜ今、これほどテキスト生成AIのビジネス活用が注目されているのでしょう?
古橋: まずはモデル自体の精度が飛躍的に向上したことが挙げられます。そして、その結果としてユーザーがプロンプト(指示文)で出力の方向性を調整できるようになったことが非常に大きいのではないでしょうか。
プロンプトを自然言語、つまりpythonなどのプログラミング言語ではなく、みなさんが日常的に使っている言葉で調整できるというのは、インターフェースの利便性を飛躍的に向上させました。
―――以前の生成AIはプロンプトで指示することはできなかったんでしょうか?
古橋: 可能ではありましたが、まったく文章として成り立たないようなものが多かったんです。精度の高い出力を得ようとすれば、プログラム言語でコードを書き、専用のモデルをチューニングする必要がありました。さらにそうしてできたものは決められた入力しか受け付けませんし、実行できるタスクも限られています。
しかし今の生成AIはひとつの大きなモデルがあって、それをユーザーがプロンプトの調整でさまざまなタスクを実行させることができます。汎用性が一気に上がったことで、生成AIの利用が広まってきたというのが、今のブームにつながっています。
テキスト生成AIの得意なこと、苦手なこと
―――さまざまなビジネスで生成AIの活用が期待されていますが、特にどのような分野や業務に向いているというのはありますか?
古橋: 基本的に何にでも使えるものではあるんですが、中でも得意なのは定型の業務です。メール文や議事録の作成などはChatGPTの活用例としてよく挙げられており、実際に使っているという人も多いでしょう。あとはアイデアの壁打ちも得意なので、企画立案のサポートにもよく使われていますね。エンジニアならコードの作成に関してアイデアをもらうなど、すでに業務に欠かせないものになっているのではないでしょうか。
―――では逆に、苦手なものといえばどのような業務でしょう?
古橋: よく言われるのは、人間の創造性や情緒に関わることは苦手です。例えば、インタビュー調査の結果を生成AIにサマライズさせてみると、内容的には正しいけれど簡潔にまとまりすぎている、なんてことがあります。インタビューで聞き出した話の中には、本筋には必要ないけれど聞き手側としてはおもしろいと思ったエピソードもあったりするんですが、そういうものが抜け落ちてしまうんです。
それから、数字の扱いも苦手です。ChatGPTは単純な計算も間違えることがあって、それで生成AIに懐疑心を持ってしまうなんてこともたまに聞きますよね。
―――生成AIの回答には、よくそういった事実と異なること(ハルシネーション)が混じることが問題になりますね。そういった間違いはなぜ起こるのでしょう?
古橋: さきほどお話したように、LLMは文章に存在している単語のパターンや関係性を学習して、次の単語を予測するという仕組みです。確率に基づいて単語をつなげているのであって、AI自身が何かを考えているわけではないんです。
だから例えば、「2025」という数字があったとき、LLMはこれを「にせんにじゅうご」と認識しているわけではありません。あくまでもひとつずつの単独の数字が並んでいるものと捉えています。ChatGPTで計算を指示したとしても、実際に計算しているのではなく、確率的にそれらしい数字を並べているだけなんです。
―――そんな仕組みになっていたんですか。では、生成AIでは数字を含むようなデータは扱えないのでしょうか?
古橋: いいえ、苦手といってもプロンプティング次第で十分に扱えるようになるんです。研究もいろいろと進んでいますし、今後どんどん状況は変わってきますよ。実際、sodaでも生成AIを使ったデータ分析をすでに実用化しています。
異常を検知してレポートを作成。生成AIのデータ分析事例
―――どういった分析事例なのでしょう。詳しく教えてください。
古橋: 出荷データや売上データなどをGPTが分析し、主に数字が急に上がっている/下がっているなどの異常を検知するというものです。専用のインターフェースがあり、ユーザーは見たいデータの期間を指定するだけで、テキスト形式のレポートが生成されます。
とあるクライアントと組んで作り上げたもので、現在はすでにそのクライアントのマーケティング担当者やEC部門の担当者の方に利用いただいています。
―――なぜ数字が上がったり下がったりしているのか、その理由まで分析できるんですか?
古橋: そこまで汎用的に出力させるのは今の段階では難しいので、現状は今あるデータに対して事実だけを確実に出力してもらうということに主眼を置いて開発を行いました。
―――これまでの方法と比べて優れている点はありますか?
古橋: 今まではAIで分析となると、エンジニアがデータを正しく成型したり抽出したりする作業が必要でした。そこへいくと今回のこの事例では、データの抽出からレポートの生成まで、一気通貫でAIにお任せできてしまうというものなんです。
しかもレポートはテキスト形式で生成されますから、データ分析に不慣れな方でもデータの概観がつかめるようになります。一方、従来からデータをよく利活用されていた方にとっても、クリックひとつでレポートが出せるというのは大幅な業務効率化になっていると思います。
生成AIによるデータ分析を実現した3つのポイント
―――数字が苦手なLLMに分析をさせるために、工夫された点などはありますか?
古橋: 数字の解釈は情報量が多かったり、さまざまなデータ同士を組み合わせて初めて意味が出るものもあるので、やっぱり難しかったです。そこをどうクリアするかが開発のメインでした。
ポイントは3つ。プロンプティング。LLMに実行させるタスクの分割。そして分析データの選択です。
プロンプティング
どういうプロンプトなら生成AIが理解しやすいのかを考えて、工夫していきました。データ分析を行うにはテーブルデータ※の理解が必要ですが、LLMにテーブルという概念は当然ないので、変換してシーケンシャルな文章として入力してあげる必要があります。その時にどのような形で入力、指示を行うかによって出力結果もかなり変わってくるので、地道な検証にはなりますが調整の余地は大きい部分です。
※テーブルデータ:表形式で整理・表示されたデータのこと。Excelでいうとシートに該当する
LLMに実行させるタスクの分割
どの商品の売り上げに異常値が出ている、ということをいきなり出すのではなく、まず商品ジャンルから始まって順番にドリルダウンしていき、最終的にSKU※単位で異常検知ができるようになっています。
最初は一度にやってしまおうとしたんですが、それではうまくいかなくて。複数のLLMをつなげて、細かいタスクに分割して出力するという形に落ち着きました。
※SKU:Stock keeping Unit。在庫管理において品目数を数える最小の単位
分析データの選択
分析するデータ自体の組み合わせもさまざまに調整しました。最終的に、マーケティングの担当者向けのレポートだったらこのデータ、EC部門の担当者向けのレポートだったらこのデータ、というふうに、タスクによってLLMが参照しているデータを設定することで精度を上げています。
最初は数値そのものを間違えるようなミスが頻発していたんですが、地道な検証を続けていった結果、最終的に数値に関するミスはほぼ出なくなりました。
―――数字の扱いが苦手とはいっても、使い方次第なんですね。ほかに開発で注意した点などはありますか?
古橋: ビジネスサイドとしてはマーケティングの現場の方が本当にほしいものになっているのかも大事でしょう。クライアントとすり合わせながら、こんなふうに出力できるものがほしいという現場の方のご要望に近づけるべく、細かく調整していきました。
sodaでは、これまでもデータ分析を軸に、マーケティング戦略の立案やリサーチによるインサイトの発見などさまざまなプロジェクトを支援してきました。技術ありきではなく、今あるタスクに対してどうアプローチできるかが、sodaの基本の進め方なんです。
生成AIの今後と、sodaが目指すニーズへのアプローチ
―――sodaはもともとクライアントのマーケティング支援が業務のベースにあり、AI開発からスタートした会社とは起点が違うというのは、これまでのsodaの皆さんへのインタビューでもよくお聞きします。
古橋: そうですね。クライアントにも通常のAIベンダーにはないマーケティングの現場感があると評価をいただいています。
今回、生成AIによるデータ分析に取り組んだのも、生成AIと相性がいいものは生成AIを使いましょうというだけで、生成AIを使って何かをやろうとした結果ではないんです。sodaとしては、ChatGPTをどう活用していくかといった話ではなく、その要素技術がこういうマーケティング的なタスクに使えるのでは、という部分に着目してさまざまにご提案しています。
―――では最後に、今後のことについてお聞かせください。生成AIを取り巻く状況はどのように変化していくと思われますか?
古橋: LLMはマルチモーダル、つまりは文章と画像、文章と音声といった異なる種類の入力データを組み合わせて出力することがホットになっています。このマルチモーダル生成AIが生かせる分野が発達するのではと個人的には思っています。
例えば医療分野だったらMRIなどの医療画像とカルテのテキスト情報、教育分野だったら生徒のテストの答案と質問の音声といった形で、複数の入力を扱いたい場面というのが多くの分野で存在すると思います。そういった所にもどんどん生成AIの活用が広がっていくんじゃないかと思います。
―――今のようなコンテンツの生成だけではなく、さらに一歩踏み出した技術になるんですね。
古橋: そうです。さらにいうと、ChatGPTをはじめ、今、話題になっているのは大規模で汎用的なモデルです。誰もが使え、汎用的にアウトプットが可能です。しかし特定の現場で使うのなら、そこまでの汎用性は不要の場合も多いです。もっと現場に特化させた、専門性の高い小さな生成AIモデルに処理させるということが、新たなトレンドになるのではないでしょうか。
いろいろなことができますというのは、結局、あんまり使い物にならなかったりもするんです。sodaとしても、何かすごいモデルを作ります、立派なものを生成します、というのではなく、クライアントが本当にほしいと思われる、ニーズに特化したサービスを提供していきたいですね。
生成AIのビジネス活用に関するお問い合わせはこちら
お問い合わせ古橋和宏
株式会社soda データサイエンティスト 製造メーカーにてデータ分析担当などを歴任した後、2021年にsodaに参画。 AIを活用した製品開発や要素技術の研究、データ分析を通じたクライアント支援に従事。直近では、クライアント向けに主にテキスト処理分野での生成AIの導入・活用支援なども行う。
AIカテゴリのブログを読む
-
ad:tech tokyo 2024に初出展! マーケティング投資を最適化する「MEDIA CANVAS」とは
2024.11.29
-
時代の変化とともに難易度を増すセールストーク スキル向上のカギとは?
2022.11.17
-
進化する画像生成AIの現在と、ビジネス活用の可能性
2022.10.31
-
AIが切り開くリテールの未来【第2回】潜在需要を掘り起こす、新たな商品レコメンド
2022.03.29
-
AIが切り開くリテールの未来【第1回】西川コミュニケーションズ×リテールのこれまでとこれから
2021.11.25
-
NICOのAI領域を担う「soda」プランナーに聞く AIのビジネス活用へのカギを握るのは、「テクノロジー×顧客×データ」の3つの視点
2021.04.26