テキストマイニングとは?活用方法やアウトプット例までご紹介!


テキストマイニングとは?活用方法やアウトプット例までご紹介!

テキストマイニングとは、SNSや口コミ、アンケート回答 など自由な形式で記述された文章を自然言語処理の技術により単語や文節に分割して、その出現頻度や相関関係、いつ発言されたものなのかといったことを分析し、有益な情報を探し出す技術のことです。

テキスト(text)はもちろん「文章」を意味しますが、マイニング(mining)とは「採掘」という意味で、膨大なテキストの山から価値ある情報を掘り当てるといった意味が込められています。

この記事では、実際にテキストマイニングどういったことが出来てどんな活用が出来るのかを解説していきます。

定量データで傾向を掴み、定性データで理由を知るには

現在、多くの先進企業で取り組まれているビッグデータ活用。
ビックデータには画像、映像、売上データ、SNSなど様々な種類が存在し、「数字の定量データ」と「文字の定性データ」のと大きく2種類に分類することが出来ます。

これまでマーケティングの現場では、定量データに焦点が当てられてきましたが、「定性データ」も重要なポイントになります。
例えば、あるコンビニチェーンの購買データを集計・分析することで、いつ、どこで、誰が、何を購入しているかが見えてきたり、「この商品を買う人は、あの商品を買いやすい」といったことをはっきりとした数字で捉えることができます。ところが、定量データをどんなに根気よく集計・分析してもある壁にぶつかってしまいます。それは「なぜその商品が売れているのか/売れていないのか」といった理由が見えてこないということです。

その壁を破るキーとなるのが、お客様の生の声。X(旧Twitter)やFacebookなどに代表されるSNSで発信された大量の文字情報(定性データ)や毎日コールセンターに寄せられる問い合わせやアンケートの自由回答欄、の中に、不満や改善要望、商品への感想、使用シーンの提案、商品にまつわるストーリーなど、「売れる/売れない」理由を可視化し、抽出することができる有用な情報がたくさん含まれています。

ところが、ここでまたもうひとつの壁に直面します。定性データの分析は多様な文章をひとつひとつ読んでいかないといけない、非常に手間と時間のかかる作業だということです。サンプル数の少ないアンケート調査などは、なんとか人の目で読むことができても、ソーシャルメディアの普及によって1日に数万件から数百万件の情報が手に入るビッグデータ時代の今、その情報量をすべて読むことは不可能ですよね。それを可能にするのが形態素解析・構文解析・意味解析で定性情報を整理・抽出し統計的に見える化する「テキストマイニング」という技術なのです。


有益な言葉を掘り当てる「テキストマイニング」

さて、企業にとって一番大事なのは「その分析が事業の何に役立つのか?」ということですよね。この分析をすることで、消費者が商品に対してどんなイメージを持っているのか、実際に使ってみてどんな感想を抱いているのかといったことがリアルタイムでわかるようになります。もう少し具体的にいうと、例えばある化粧品メーカーの新商品に対してSNSやお客様相談室に寄せられているお客様のご意見をテキストマイニングで分析すると、「肌」「香り」「効果」など、どんな単語が話題によく出ているかがわかります。さらに主語と述語の組み合わせで見ていくと「肌‐ヒリヒリする」とか「香り‐ダメ」といったネガティブな意見もあれば、「効果‐感じる」「肌‐しっとり」というポジティブな意見があるのかということがわかってきます。ネガティブな意見で一番多いのが「香り」だったとして、その先を辿っていくと「オイル系の香りが嫌い」とか「拭き取った後に残る香りがダメ」というように香りの何がだめなのかが見えてくるというわけです。

こうした消費者の生の声には、商品開発(改善)やプロモーション戦略、売り上げ向上のヒントがたくさん詰まっています。お問合わせ内容の履歴に加え、ソーシャルメディア というオープンな場から、他社製品への評価などを含む膨大な声を集めることができるビッグデータ時代の今、効果的な手法を使い、刻々と変化する消費者のニーズをいかにスピーディーに、いかに緻密に拾い上げていけるのかということが、多様化する社会と向き合う企業にとってますます重要になってきています。顧客体験の向上にテキストデータの分析が求められているのです。

テキストマイニングを始めるには、専用のツールを使用することをおすすめします。
無料で使えるものから機能豊富なものまで、様々なテキストマイニングサービスが提供されていますが、自社の目的にあったシステムを選択することをおすすめします。辞書が自由に設定できるか、機能は不足していないか、英語に対応しているかなど、要件に合わせて検討しましょう。


ライバル企業に差をつける!テキストマイニングの活用方法

ところで、ツイッターでは1日に1億以上ものつぶやきが投稿されているのをご存知でしたか?SNSは、まさにテキストデータの宝庫となっているのです。最近ではこうしたソーシャルメディアやお客様相談室に寄せられる問合せ内容を集約して「お客様の声」として活用する企業が増えてきています。ここでは、わかりやすくお伝えするために先進的企業として知られる大手食品メーカー の例をご紹介します。

このメーカーでは、毎日コールセンターに寄せられる数十万件の顧客の声とあわせて、ブログやツイッターなどから全商品と競合商品といった大量のビッグデータが自動的に収集・分析され、翌朝には各部署の社員がWEB上で、どの商品で何を言われていたのかというレポートを共有・活用できるようになっています。例えば、あるアルコール飲料 について、「夏祭り‐飲みたい」とか「風呂上がり‐すっきり」「さわやか」など、飲んだ後の感想や特徴、どういうシーンで、どういう気分で飲んでいるのかが言葉の相関図から見えてきます。それらをもとに季節感を演出するプロモーション戦略が顧客に狙い通りに伝わっているのかを判断したり、テレビCMの制作に活かしたり、パッケージデザインの変更や販促活動を計画するなど、さまざまな場面で役立てられています。

今、あらゆる業種でビッグデータの活用力が問われています。


テキストマイニングのアウトプット例

テキストマイニングによる分析を行うと、文章を分解し、わかりやすい形に図示することが可能です。
ここではそのうち代表的なものをいくつかご紹介します。


ランキング

文章内にあるキーワードの登場数を集計し、ランキング形式で上位意見を把握できます。構文解析により、単語のほか、2項間係り受けや3項間係り受けでの表示をすれば、関連テキストも把握できるためさらに深い分析が可能です。全体の傾向や特徴を掴む目的で使われます。


ワードクラウド

頻出単語を抽出し並べることで、上位意見を俯瞰する手法です。
発言頻度や内容に応じてフォントサイズ・色を変更することで、より簡単に要点をつかむことが可能です。


マッピング(単語マップ)

自然言語処理では、ある文字列とある文字列が同時に出現することを「共起」と呼びます。テキストマイニングを行い、単語を抽出した共起ネットワークを可視化することで話題の広がりやつながりを把握することが可能です。テキストをネットワーク分析することで、単語同士の意外な結びつきや際立った特徴の発見ができるかもしれません。