CRMのプロが書く
マーケティングBLOG

世の中の人間は2種類だけではない
-顧客セグメンテーション手法の分類 Vol.1

 はじめに

世の中には2種類の人間がいる。首にロープを巻かれる奴と、そのロープを切る奴とだ。-続・夕日のガンマン- 

「世の中には2種類の人間がいる」という言い回しをよく聞きます。元ネタは映画「続・夕日のガンマン」らしいですね。作中では上の引用を含めて3パターンのセリフがあるそうです。
この言い回しは結局ジョークだと思うのですが、何か本質的に人間を2つに分類するように見せかけて、実は何でもない違いを強調して面白がるというニュアンスを感じます。 

ある映画レビューでは、この言い回しは60年代当時において人間を明確に区別する「階級」が自明の常識であったという背景から生まれているという解説があり、なるほど、そういう重い現実を踏まえてのジョークなのだなと感じました。

マーケティングにおいても消費者すなわち人間を分類する、「セグメンテーション」という言葉がよく出てきます。あまりに色々な場面で出てくるので、私などはあの「セグメンテーション」はこの「セグメンテーション」と一緒なのだろうか、と混乱することすらあります。
今回は少し場面を限定し、企業が顧客とのコミュニケーションを設計する時に行う顧客のセグメンテーション手法について書こうと思います。

消費者の異質性

そもそも、セグメンテーションの動機は消費者の多様性(異質性)というところにあります。
単純に皆が同じモノを同じように欲しがるわけではありません。究極的には1人1人、しかも時々刻々に違っていると考えることもできます。

そんな多様な消費者に近づくための方法の1つがセグメンテーションです。多様な消費者を、取り扱えるだけの少数のグループ、セグメントに分類してしまおう、という発想です。この時、当たり前のことですが、同じセグメントの消費者は同じと見なし、違うセグメントは違うと考えられることがポイントになります。

以上を踏まえて、様々なセグメンテーションの手法を見ていきましょう。

セグメンテーションの手法

尺度によるセグメンテーション

冒頭で述べたように、人間を分類するにはありとあらゆる基準、尺度が考えられますが、全てに意味があるわけではありません。

一般的に、マーケティングにおいて有用と考えられている尺度には以下のものがあります[1]

  1. 地理的変数:国、地域、空間など
  2. 人工統計的変数(デモグラフィック変数):性別、年齢、ライフステージ、職業、所得、学歴、社会階層、資産など
  3. 心理的変数:ライフスタイル、認知度、関与度、好みや購買動機など
  4. 購買行動変数:消費パターン、消費経験の有無、価格感度、プロモーションに対する反応パターンなど

これらのうち、地理的変数やデモグラフィック変数は明確にわかるもので扱いやすいですが、購買行動変数は何らかの計算を施した結果であること、心理的変数は本当の意味では観測できないことなので注意が必要です。

また、結局のところ人間は多様なのですから、こうした尺度によるセグメンテーションには際限がありません。何も考えずに尺度を増やしていくのでは、組み合わせの数だけ複雑になってしまい、多様な消費者を少数のセグメントに代表させるという元々の目的から外れたものになってしまいます。

ここでも、同じセグメントの消費者は同じと見なすことができるのか、違うセグメントは違うといえるのか、を問わなければなりません。解決には2つの方向性が考えられます。1つは、ある観点を決めてそこから見て違いの出る尺度だけを選択する。もう1つは、手元にある尺度全体から似たもの同士を見つけてグループにすることです。

クラスタ分析(クラスタリング)

セグメントのための観点がわからない、何とかあたりをつけたい。そのようなときにクラスタ分析(クラスタリング)を行うと、ひとまずセグメントを作ることはできます。

クラスタリングとは、バラバラなモノの集まりを集団にまとめあげるという意味ですが、既知の消費者に対し、既知の尺度を使ってクラスタリングすると、結果的にクラスタ≒セグメントが得られます。クラスタリング手法は、大きく2種類に分かれます。

1.階層的

階層的なクラスタリングとは、トーナメントのように少しずつ似たものを集めていくというアプローチを取ります。最終的にはたった1つにまで集まってしまうため、どこかで止めることが必要です。

[階層的クラスタリングのイメージ]

060_nishio_06_2

 画像引用:http://en.wikipedia.org/wiki/File:Hierarchical_clustering_simple_diagram.svg

 

2.非階層的

比階層的なクラスタリングでは、とりあえず何個のクラスタを作るか決めておきます。そこに向かって似たものを集め、違うものをばらけさせる、ことを繰り返していく内にクラスタが定まっていくというアプローチを取ります。

[非階層的クラスタリングのイメージ]

060_nishio_06_3 画像引用:http://www.mathworks.co.jp/jp/help/stats/kmeans.html

ここで、どちらの手法でも、結局何個のクラスタにするかの正解はなく、マーケッターが決めないといけないということに注意しなければなりません。

もう少し正確にいうと、クラスタ数を変えてクラスタリングを実行した後に統計的な指標を使って優劣を比較することはできますが、それをもってしても、クラスタリング手法は「分けるとしたらこうかな」という事を提案してくれるのみです。その妥当性(納得感)や有用性を判断するには、やはり何らかの観点が必要となります。

特に、実務において良く悩まされるのは、クラスタの「名付け」です。クラスタごとにどういう消費者が含まれているかを見て、その特徴を表わす端的な名前を付けられるかどうかは、妥当なクラスタリングの判断基準となります。

なお、クラスタリングはデータマイニングのツールでは有償/無償問わず大抵実装されており、比較的簡単に試してみることができます。

ハード or ソフト

セグメンテーションの「観点」を後回しにしたままですが、クラスタリングについてもう少し続けます。先ほど説明したクラスタリング手法は、データが必ずいずれかのクラスタに属することになります。これを「ハード」クラスタリングと呼ぶことがあります。これに対して「ソフト」クラスタリングというのは、データが複数のクラスタに属することを許す方法です。

ここで一時マーケティングから離れ、新聞記事を話題(トピック)別にクラスタリングする、という課題を想像してみます。

例えば、「政治」「スポーツ」というのは一見対極的なトピックのようですが、オリンピック招致についての記事ならば両方当てはまる可能性があります。また、その当てはまり度合いも考慮して、政治=0.6, スポーツ=0.4という風に記事を位置づけることもできるでしょう。

ここで「オリンピック」というトピックを足して対処することもできますが、この調子でトピックを増やしていくと際限がなくなってしまいます。このように、クラスタ数は増やしたくないが、どちらともつかないモノ達を上手く表現したいというところから、ソフトクラスタリングが必要となったのだろうと思われます。

マーケティングに立ち戻って考えると、ソフトクラスタリングは、消費者の多様性あるいは多面性をうまく表現できる可能性があります。弊社Societasも、ソフトクラスタリングによって消費者の価値観を分類したものです。

ソフトクラスタリングは比較的高度な手法で、統計的な自然言語処理のツール(上述したトピック分類を行うもの)やプログラミング言語のライブラリといった研究者レベルでの実装に留まっており、実務者向けのデータマイニングツールへの実装例はまだほとんど聞いたことがありません。

潜在クラス分析

ある種のソフトクラスタリングは、潜在クラス分析と呼ばれることがあります。セグメント、クラスタ、クラス、いろいろな呼び方があって混乱しますが、ニュアンスの差であって、何かを分類した結果であることは変わりません。

私の解釈では、セグメントは「全体を切り分けた部分」、クラスタは「まとまったモノの集まり」、クラスは「共通する性質に基づく分類」を指していると思います。ここでいう潜在クラスというのは、「消費者の特徴の違いは、彼ら/彼女らが所属する潜在的な分類(クラス)の違いによって説明できる」と仮定したときの分類のことです。

[潜在クラス分析の概念図]

060_nishio_06_4

潜在クラス分析はソフトクラスタリングなので、1人の消費者が複数のクラスに、ある度合い(確率)で所属しているという分析結果を返します。また、そこでよく用いられるアルゴリズムは非階層型のクラスタリングと似たところがあり、何個のクラスタを仮定するかは最終的にはマーケッタの判断にゆだねられます。クラスタの特徴を解釈して名前を付けるのが難しいのも同様です。

潜在クラス分析の分析対象となるのは消費者の行動、主にPOSデータなどの購買履歴です。消費者を性別・年代といった尺度ではなく、どのような消費行動を行うかという観点で分類してみようというアプローチです。マーケッターの関心もまさにこの消費行動にある訳ですから、理にかなっていると言えます。

バスケット分析(アソシエーション分析)に似ている気もしますが、こちらは商品推薦を主な目的にしており、潜在クラス分析より細かいパターンを(できるだけ多く)見つけようとしている手法だと思います。

[分析結果イメージ]
[1]表4-2から一部改変

顧客No ブランド別購入状況 クラス1
所属確率
クラス2
所属確率
A B C D
1 1 1 0 0 0.99 0.01
2 1 0 0 0 0.94 0.06
3 0 1 0 0 0.91 0.09
4 0 1 1 0 0.50 0.50
5 0 0 1 0 0.09 0.91
6 0 0 0 1 0.06 0.94
7 0 0 1 1 0.01 0.99

以上、様々な顧客セグメンテーション手法を見てきました。少し長くなりましたのでこれら手法を生かすための「観点」については別のエントリーとしたいと思います。

参考文献
[1]マーケティング・サイエンス入門[新版]:古川一郎,守口剛,阿部誠

※iNSIGHTBOXはサービスを終了いたしました。価値観での顧客セグメンテーション「Societas」は引き続きサービスを提供しております。

※記載されている内容は掲載当時のものであり、一部現状とは内容が異なる場合があります。ご了承ください。