「予測する」ってどういうこと?ベイジアンネットワークって何?
「消費者行動予測」や「ベイジアンネットワーク」、最近よく聞くキーワードではあるけれど、実際のところそれは何なんだろう?
そんな疑問を解消するために、弊社・安松と増田を訪ねてきました。
どうやって予測・推論しているのか
倉本 消費者行動予測が大事!」などとマーケティング界隈でここ数年よく言われていますが、「予測とは何なのか?」ということをわたしのような初心者でもわかりやすく説明していただけますか?
安松 わかりました。
まず予測にはいろいろな方法があるんですが、弊社ではよくベイジアンネットワークを使って予測・推論をしています。ベイジアンネットワークの概念は以前の記事で解説している通りなので、今回は「じゃあ予測・推論とは具体的にどのようにやっているか」ということを紹介しようと思います。
では、増田さんお願いします。
増田 はい。
実際は黒い画面でコマンドを打つんですが、まずlsというコマンドを用いて、ディレクトリの中にどんなファイルがあるのか、ということを見にいきます。すると、以前取得し格納されていたアンケートファイルがあることがわかります。これは、興味について聞いたアンケートです。このアンケートに対して推論のコマンドを使うことで、例えば興味のアンケートから推論したファッションの価値観を割り出すことができるんです。手順だと、「infer」コマンドをぽちっと押すだけなんですよね。
倉本 データをフォルダに格納しておき、コマンドを書けば推論が出る。すごくシンプルですね。
安松 これだけではあるのですが、イメージしにくいですよね。
私は、コマンドを書いているときは「裏でどんな処理がなされているのか」を頭の中でイメージしながら推論しています。そのイメージをビジュアルに落としてみたものをこれからご覧いただきたいと思います。
【ケース1】Twitterのつぶやきから推論する
安松 今回はTwitterのつぶやきから様々な価値観の推論をおこなうケースで紹介します。
倉本 テキストマイニングですか?
安松 そうですね。
友人や知人のツイートの内容を読むと、「この人ってたぶんこんな人だろうな」って推測はできると思うんですけど、それを何千人分ものツイートを、人が読んで理解することは、現実的に不可能ですよね。
それを実現する「Twitter-Societas」というものがあるんです。
縦軸にTwitter ID、横軸に単語が並んでいます。
たとえば倉本さんのTwitter情報があって、ツイートのテキスト(言葉)データはあるけど価値観情報はまったくない状況ですよね。
推論すると、下記のように価値観情報が入るイメージです。
「Twitter-Societas」を動画で解説
制作・デザイン:増田茂樹/デザイン:徳見理絵/コンセプト企画:安松健
つまり、予測するとか推論するというのは、すごく単純に言うと今までなかったデータや変数が増えることなんです。
倉本 今持っている情報だけで、わざわざアンケートを実施しなくても推論が導けるのはすごく便利ですね!
【ケース2】ファッションの価値観を推論する
安松 さらにここから、ファッション価値観も推論しようと思います。
倉本 どんな推論ですか?
安松 「Fashion-Societas」と呼んでいるものです。
ファッションの価値観はもちろんアンケートでも聞くことができますが、お客様側からするとたくさんのアンケートに答えなければいけない、そんな手間も取られますよね。今あるデータから予測で各々の価値観を出すことができれば、データ収集コストをかけずに顧客理解を深めることができます。
倉本 なるほど。興味深いですね。
安松 ちなみに倉本さんは、きっと「おしゃれが好き」ですよね。
倉本 そうですね。好きです。
安松 でも、ファッション誌を読んだりトレンドを追ったりは、あまりしませんよね。
倉本 雑誌は好きなので読みますが、トレンドは意識しないですね。
安松 倉本さんのデータから推論させてもらった結果によると、見事に「おしゃれ好き」って結果が出ているんですよ。
この「おしゃれ好き」の人たちは「雑誌で取り上げられているトレンドをしっかり抑えてその恰好を真似しているおしゃれさん」という意味ではなく、「服が好きで自分のスタイルを追い求めることが好きな人」を表現する価値観なんです。だから、例えばアパレルブランドがこのタイプの顧客にメールで購買促進を図る際には、「トレンドがどう」って文言で訴求しても効かないでしょうね。
それにしても、やはり当たりましたねえ(笑)
倉本 確かにその通り、当たってます(笑)
1点質問をしたいのですが、アンケートを実施せずにあえて推論を使う理由って作成者・回答者の手間を取らせない以外の理由で何かありますか?
安松 ファッションに対する価値観のようなものは、単純に聞けばわかるというものではないので、アンケート設計は簡単ではありません。企業担当者が、そのアンケート設計をするコストを削減できることも理由の1つになります。
アンケート設計がどのように難しいかというと、たとえば「値段が安かったから買った」のような客観的事実として判断できる指標に関してはアンケートで聞きやすいですが、本人の主観や意識が入るもの、たとえば、「定番ファッションが好きですか?キレイ系が好きですか?」って聞いたとしても、「定番」や「キレイ系」といっても人によって、その定義が全然違うので、それだけで解釈することはできないんですよね。
このような概念的なものって、同じ言葉でも、人によって全然意味が違うので、直接聞いてもその1問だけじゃ測れなくて、いくつかの設問で多角的に確認するために、緻密に設問設計をしなければいけなくなります。そうすると設計が大変になってきてしまう、あるいは、設計が不十分だと意図した内容が収集できなかったりしてしまいます。
一方で、Societasの設問は研究を重ねてかなり厳選されていて、かつ人の価値観の核が捉えられる設問にしているので、そこから推論していくのが実践においては効果的な方法になってくるわけです。
倉本 なるほど。ちなみに、今日教えていただいたのはファッションですが、この推論を他の業界で応用することもできますよね?
安松 はい、もちろん可能です。ですので、面白い分野やお客様のニーズに合った分野にも踏み込んでいきたいと考えています。
データビジュアライゼーションの重要性
安松 理論で説明されるだけではなく、こうしてビジュアルイメージで見るとどうですか?
倉本 そうですね。わかりやすいですし、ビジュアルから入るほうが腑に落ちるというか、より興味を持つキッカケになりやすいと思います。エンジニアでもなく分析の知識も持ち合わせていない私のような人間にとっては、まずこういったビジュアルで見てから裏にあるロジックを聞くと、なるほど!と理解できます。
安松 やはりそうですよね。私もビジュアル化することってすごく大事だなと思っていて。実はこのイメージも、案が浮かんで相談してからすぐに増田さんが作ってくれたんですよ。どのくらいの期間でしたっけ?
増田 2日くらいでまずサンプルを作って、安松さんに意見をもらいました。そのあと半日くらいで修正して見せてまた意見をもらって、また数時間で修正して見せて…という風に、しだいに所要時間を縮めていきました。
実際の案件でも、何かしらの開発って基本的にはお客様にヒアリングした後に要件定義をして、分厚い仕様書をがっつりまとめて提出して、擦り合わせをした後にやっと作り始めるといった手順が多くの場合ですが、そうなると取り掛かるまでにすごく時間が掛かるし、大枠を作った後に「イメージしてたものと違う」となる可能性が生まれてくる。そこから作り直すとなるとさらに時間が掛かります。
なので、一度まずたたき台となるサンプルを作ってみるんです。それを基にして議論を交わす方がイメージするものにより近いものを作れますし、何より方向転換のスピードが速くなるんです。だから私もビジュアル化してみることを大事にしています。
安松 ビジュアル化することで、共通言語を持たないプログラマーとノンプログラマーの間にある認識のギャップを埋めることができるような気がしますしね。まあ、その部分に関しては次回の記事でビジュアル系プログラマーの増田さんに詳しく語っていただきましょう。
※記載されている内容は取材当時のものであり、一部現状とは異なる場合があります。ご了承ください。
※iNSIGHTBOXはサービスを終了いたしました。価値観での顧客セグメンテーション「Societas」は引き続きサービスを提供しております。