テキストマイニングとは?活用方法やアウトプット例までご紹介!


テキストマイニングとは?活用方法やアウトプット例までご紹介!

テキストマイニングとは、テキストの単語を分析して、有益な情報を抽出することです。
インターネットやSNSの普及により膨大なテキストデータを得られるようになった今、企業はそれらを有効に活用することで、マーケティングに活かすことができます。
この記事では、実際にテキストマイニングがどのようなことができるのか、また、活用の方法などについて解説していきます。

テキストマイニングとは


テキストマイニングとは、SNSや口コミ、アンケート回答など自由な形式で記述された文章を、自然言語処理の技術により単語や文節に分割して、その出現頻度や相関関係、いつ発言されたものなのかといったことを分析し、有益な情報を探し出す技術のことです。
テキスト(text)はもちろん「文章」を意味しますが、マイニング(mining)とは「採掘」という意味で、膨大なテキストの山から価値ある情報を掘り当てるといった意味が込められています。

定性データと定量データの違い

現在、多くの先進企業で取り組まれているビッグデータ活用。
ビックデータには画像、映像、売上データ、SNSなどさまざまな種類が存在し、それらは「数字の定量データ」と「文字の定性データ」に、大きく二分することができます。

傾向をつかむ「定量データ」と、理由を知る「定性データ」

売上高や消費者の性別・年齢など、数字で表すことができるデータを「定量データ」といいます。一方で、「なぜこの商品を選んだか」「どこが購入の決め手になったか」といった数字で表すことができない意見などを「定性データ」といいます。

これまでマーケティングの現場では、定量データに焦点が当てられてきましたが、「定性データ」も見逃してはならない重要なポイントになります。
たとえば、あるコンビニチェーンの場合、購買データを集計・分析することで、いつ、どこで、誰が、何を購入しているかが見えてきたり、「この商品を買う人は、あの商品を買いやすい」といったことをはっきりとした数字で捉えたりすることができます。ところが、こうした定量データをどんなに根気よく集計・分析しても、ある壁にぶつかってしまうでしょう。それは「なぜその商品が売れているのか/売れていないのか」といった理由が見えてこないからです。
 
その壁を破るキーとなるのが、お客様の生の声。X(旧Twitter)やFacebookなどに代表されるSNSで発信された大量の文字情報や、毎日コールセンターに寄せられる問い合わせ内容、アンケートの自由回答欄といった定性データの中には、不満や改善要望、商品への感想、使用シーンの提案、商品にまつわるストーリーなどが隠されているのです。こうした定性データを集めることで、「売れる/売れない」理由を可視化でき、ビジネスにおける有用な情報としてその後に多く活かすことができるのです。

テキストマイニングが重要視される理由


「テキストマイニング」とは、形態素解析・構文解析・意味解析で定性情報を整理・抽出し統計的に“見える化”する技術のことです。

前章にて、定性データがビジネスに活かすべき重要なデータであることがわかりましたが、数値化が容易な定量データに比べ、文字ベースの定性データは、抽出したり整理したりするのに膨大な手間がかかります。サンプル数の少ないアンケート調査などでは、一つひとつ人の手で読み解くことができても、1日に数万件から数百万件の情報が行き交うインターネットやSNS上のデータにすべて目を通すというのは、現実的ではありません。

こうした文字ベースの情報を抽出し、整理することを可能にするのが、「テキストマイニング」という技術なのです。

有益な言葉を掘り当てる「テキストマイニング」

さて、企業にとって一番大事なのは「その分析が事業の何に役立つのか?」ということですよね。この分析をすることで、消費者が商品に対してどんなイメージを持っているのか、実際に使ってみてどんな感想を抱いているのかといったことがリアルタイムでわかるようになります。もう少し具体的にいうと、例えばある化粧品メーカーの新商品に対してSNSやお客様相談室に寄せられているお客様のご意見をテキストマイニングで分析すると、「肌」「香り」「効果」など、どんな単語が話題によく出ているかがわかります。さらに主語と述語の組み合わせで見ていくと「肌‐ヒリヒリする」とか「香り‐ダメ」といったネガティブな意見もあれば、「効果‐感じる」「肌‐しっとり」というポジティブな意見があるのかということがわかってきます。ネガティブな意見で一番多いのが「香り」だったとして、その先を辿っていくと「オイル系の香りが嫌い」とか「拭き取った後に残る香りがダメ」というように香りの何がだめなのかが見えてくるというわけです。

こうした消費者の生の声には、商品開発(改善)やプロモーション戦略、売り上げ向上のヒントがたくさん詰まっています。お問合わせ内容の履歴に加え、ソーシャルメディア というオープンな場から、他社製品への評価などを含む膨大な声を集めることができるビッグデータ時代の今、効果的な手法を使い、刻々と変化する消費者のニーズをいかにスピーディーに、いかに緻密に拾い上げていけるのかということが、多様化する社会と向き合う企業にとってますます重要になってきています。顧客体験の向上にテキストデータの分析が求められているのです。

テキストマイニングを始めるには、専用のツールを使用することをおすすめします。
無料で使えるものから機能豊富なものまで、様々なテキストマイニングサービスが提供されていますが、自社の目的にあったシステムを選択することをおすすめします。辞書が自由に設定できるか、機能は不足していないか、英語に対応しているかなど、要件に合わせて検討しましょう。

13年連続テキストマイニングSaaS市場1位の分析ツール「見える化エンジン」はこちら

テキストマイニングの手法


テキストマイニングには、いくつかの方法がありますが、ここではテキストマイニングで利用される手法のうち、4つの例を見ていきます。

センチメント分析

センチメント分析とは、WebやSNS上のコメントから顧客や消費者の感情を3つに分析する手法です。特定のテーマに関するコメントを「肯定的」「中立的」「否定的」に整理し、分析します。たとえば「好き」「うれしい」などは「肯定的」、「嫌い」「不安」などは「否定的」、それ以外を「中立的」といった具合です。
自社の商品やサービスの分析などに利用されることが多く、テキストに対してポジティブ/ネガティブの判断を行うことから、「ポジネガ分析」「ポジネガ判定」などとも呼ばれます。

対応分析(コレスポンデンス分析)

対応分析とは、アンケートやSNS投稿などにおいて、特定のテーマで書かれた文章が、年齢や性別といった単位によってどのような特徴があるかを散布図などのクロス集計表にアウトプットし、分析する手法です。
ブランドイメージや自社の強み、競合他社との業界におけるポジショニングを可視化する際などに利用されます。

主成分分析

次元(指標)の異なるデータを要約し、データがもつ情報や特徴をわかりやすく可視化する分析手法です。差異や類似点を見つけ出す対応分析に対し、膨大なデータを圧縮して関係性を可視化したいときに利用します。膨大で複雑なデータが分かりやすく要約されますが、一部の主要でないデータが見落とされてしまう可能性もあります。

共起分析

ある単語に対して、ある単語が紐づいて現れることを、「共起」といいます。「共起分析」は、その関連する文字列を導き出す手法のこと。共起分析により、関連性のある単語を抽出できるため、消費者の感覚や意見をより具体的に把握することが可能になります。
たとえば、「夏」という単語に「日焼け止め」という単語が共起されるデータが抽出されたとします。この場合は、夏に紫外線が意識されていることが読み取れる、といったイメージです。

テキストマイニングを活用するために覚えておきたいこと


数値だけでは見えにくかった消費者の心理が紐解けるテキストマイニング。使いこなせれば万能のように見えるこの技術ですが、活用するためには以下のようなポイントを覚えておきましょう。

大量のデータが必要

テキストマイニングは基本的に文章中の単語を対象に分析を行いますが、その単語がどのような意味を指すかというデータがそろっていないと分析の精度が落ちてしまいます。データ数が少ない場合は、テキストマイニングを行わず、手作業で分析する方が良い場合もあります。

データの質を高める

テキストマイニングは、ただ行うだけでは有用な情報を得られない場合もあります。解析すべきデータが十分にそろっているか、目的に合ったデータであるかを確認しながら、データの質を高めることが重要です。テキストマイニングを何度も繰り返すうちに、表現のニュアンスや揺らぎ、誤字脱字などを学習し、より高い精度の結果を得られるよう、データのブラッシュアップをしていきましょう。

文脈を完全に理解できるわけではない

テキストマイニングでは、単語を認識し、分析していきますが、文章全体の意味を解析することはできません。たとえば「○○をおすすめしないわけがない」という文章は、人間が読めば肯定的な文章だとわかりますが、テキストマイニングツールは「おすすめしない」という単語を拾い上げ、ネガティブな意見だと判断してしまう場合もあるのです。こうした二重否定文のほか、ツールによっては、「これ」「それ」「あれ」といった代名詞の解釈も安定しない場合があることを理解しておきましょう。

ライバル企業に差をつける!テキストマイニングの活用方法



ところで、ツイッターでは1日に1億以上ものつぶやきが投稿されているのをご存知でしたか?SNSは、まさにテキストデータの宝庫となっているのです。最近ではこうしたソーシャルメディアやお客様相談室に寄せられる問合せ内容を集約して「お客様の声」として活用する企業が増えてきています。ここでは、わかりやすくお伝えするために先進的企業として知られる大手食品メーカー の例をご紹介します。

このメーカーでは、毎日コールセンターに寄せられる数十万件の顧客の声とあわせて、ブログやツイッターなどから全商品と競合商品といった大量のビッグデータが自動的に収集・分析され、翌朝には各部署の社員がWEB上で、どの商品で何を言われていたのかというレポートを共有・活用できるようになっています。例えば、あるアルコール飲料 について、「夏祭り‐飲みたい」とか「風呂上がり‐すっきり」「さわやか」など、飲んだ後の感想や特徴、どういうシーンで、どういう気分で飲んでいるのかが言葉の相関図から見えてきます。それらをもとに季節感を演出するプロモーション戦略が顧客に狙い通りに伝わっているのかを判断したり、テレビCMの制作に活かしたり、パッケージデザインの変更や販促活動を計画するなど、さまざまな場面で役立てられています。

今、あらゆる業種でビッグデータの活用力が問われています。

13年連続テキストマイニングSaaS市場1位の分析ツール「見える化エンジン」はこちら

テキストマイニングのアウトプット例


テキストマイニングによる分析を行うと、文章を分解し、わかりやすい形に図示することが可能です。
ここではそのうち代表的なものをいくつかご紹介します。

ランキング


文章内にあるキーワードの登場数を集計し、ランキング形式で上位意見を把握できます。構文解析により、単語のほか、2項間係り受けや3項間係り受けでの表示をすれば、関連テキストも把握できるためさらに深い分析が可能です。全体の傾向や特徴を掴む目的で使われます。

ワードクラウド


頻出単語を抽出し並べることで、上位意見を俯瞰する手法です。
発言頻度や内容に応じてフォントサイズ・色を変更することで、より簡単に要点をつかむことが可能です。

マッピング(単語マップ)


自然言語処理では、ある文字列とある文字列が同時に出現することを「共起」と呼びます。テキストマイニングを行い、単語を抽出した共起ネットワークを可視化することで話題の広がりやつながりを把握することが可能です。テキストをネットワーク分析することで、単語同士の意外な結びつきや際立った特徴の発見ができるかもしれません。

生成AIがテキストマイニングにもたらす新たな可能性


生成AIとは、「ジェネレーティブAI(Generative AI)」とも呼ばれるもので、人工知能の一種です。この生成AIをテキストマイニングに取り込むことで、以下のような可能性が期待できるようになるでしょう。

高度な文章の理解 

テキストマイニングでは、単語ごとにポジネガ判定をしていますが、生成AIを組み合わせることで、複数の単語からなる文章を判定できるようになります。たとえば「香り自体は好きですがコスパが悪すぎるので日常使いには厳しいと思います。」という文章は「ネガディブ」、「香り自体は好きですがコスパが悪すぎるので日常使いには厳しいと思います。デザインもかわいいので、贈り物にはいいかも。もしプレゼントしてもらえたらすごくうれしいです。豪華なプレゼントを贈りたい方にはオススメです!」という文章は「ポジティブ」といった、高度な長文の判定も可能になります。

感情分析の精度の向上

たとえばテレアポやWeb会議の録音データを解析する場合に、生成AIの技術を組み合わせることで、会話のニュアンスや感情の分析も可能になります。複数人での会話における発話者の認識はもちろん、それぞれの会話の速度や、声のトーン、沈黙や間の長さなどを根拠に、感情や雰囲気も読み解くことができるようになるでしょう。

多言語対応

生成AIによる翻訳機能を活用することで、多言語にわたる資料なども一括で翻訳し、分析することができるようになります。直訳ではなく、より各言語のネイティブ表現に寄せた意訳にも、一定の精度が見込めるようになるでしょう。

関連記事:生成AIをマーケティングで活用するために意識すべきこととは
関連記事:AIによるテキストマイニングの活用例とは?メリットやツールも解説

テキストマイニングの活用で、マーケティング効果を最大化


本記事では、テキストマイニングの意味や、テキストマイニングが重要視される理由、その手法やポイント、アウトプット例、生成AIがテキストマイニングにもたらす可能性などについて紹介しました。業務効率化や高品質なクリエイティブコンテンツの作成を可能にする生成AIですが、メリットと同時に注意点もあります。生成AIの特性を理解し、適切に導入・活用することで、マーケティングの効果が最大限に得られるでしょう。
 
見える化エンジン」は、テキストマイニングツール市場において長年シェアNo.1(※)を獲得しています。手厚いサポートと専門の分析コンサルタントによるコンサルティングは評価を得ています。貴社の状況に合わせた体制づくり支援や開発計画支援など、さまざまな支援メニューを用意していますので、興味のある方は、資料請求や無料デモ体験、お問い合わせなど気軽にご利用ください。
 
※富士キメラ総研調べ
 
13年連続テキストマイニングSaaS市場1位の分析ツール「見える化エンジン」はこちら