テキストマイニングをエクセルで行うための手順や関数を解説!


テキストマイニングをエクセルで行うための手順や関数を解説!

テキストマイニングとは、テキストを分析するための方法のひとつです。テキストマイニングは、特別なツールやスキルがなければ行えないわけではありません。普段よく使うエクセルでも、テキストマイニングを行えます。この記事では、テキストマイニングの概要や特徴、エクセルでのテキストマイニングについて紹介するため、参考にしてください。

テキストマイニングとは

テキストマイニングとは、自然言語処理などの手法を使ってテキストを分析する技術です。英語で「Text Mining」と表記します。Miningとは、日本語に訳すと「地下資源採掘」という意味になり、ITやAIなどの分野では、膨大な量のデータから有用な情報を発掘するといった意味があります。


具体的には、人が一般的に使用している非定型の文章を単語や文節に分解して、キーワードの出現傾向や出現頻度、時系列などの情報を分析するのがテキストマイニングです。テキストマイニング専用のツールもあり、利用している企業も多くなっています。


テキストマイニングの重要性

企業が収集・蓄積しているテキストデータのなかには、マーケティングに活用できる重要な情報が含まれています。データの解析や分析をすることで、貴重な情報を得られる可能性があります。


そのため、社内外から関連データを収集してテキストマイニングを行うことが重要です。これにより、商品やサービスの改善、自社のブランド力向上などに役立つ情報を発掘できます。また、数値として表せない定性データから、顧客のニーズを見つけることも可能です。


テキストマイニングを活用できる事例

テキストマイニングは、以下のようなテキストの解析に適しています。


・顧客アンケートの分析

・NPS®︎(Net Promotor Score)の分析

・製品やサービスレビューの分析

・コールセンターに寄せられた苦情分析

・口コミ分析

・社内業務の改善策策定への活用

・市場動向や需要の予測


このように、膨大な量になる自由回答形式のアンケートやレビュー、口コミ、社内業務の課題点などの洗い出しなど、さまざまな事例で活用されています。


テキストマイニングはエクセルでもできる

テキストマイニングは、専用のツールがなくても行えます。やり方さえ押さえれば、エクセルでもテキストマイニングできるため、チャレンジしてみるとよいでしょう。ただし、エクセルの場合、内容はシンプルなものに限定されます。また、関数なども覚えなければならず、ある程度知識やスキルが必要になります。


エクセルでテキストマイニングする4つの手順

エクセルを使って、気軽にテキストマイニングをしてみようと考えている方も多いのではないでしょうか。ここでは、エクセルでテキストマイニングをするための手順を解説します。


STEP1.データ収集

まずは、非構造化データを収集します。非構造化データとは、構造定義されていないデータのことです。たとえば、電子メールや見積書・発注書・契約書などのOffice文書、画像や動画、音声データなどが含まれています。


非構造化データは、データに規則性がないことが特徴で、表形式に変換することができません。しかし、テキストマイニングでは非構造化データの解析・分析が可能なため、必要なデータを収集しましょう。


STEP2.形態素解析をする

エクセルを用いる場合には、文章をそのまま分析できません。そのため、形態素解析を行って文章を単語に分解する必要があります。文章を単語に切り分ける方法としては、単語の区切りに空白を挿入する「分かち書き」などがあります。形態素解析エンジンを活用して、単語化することが一般的です。


形態素解析によって、単語の頻出度の計測が可能となります。また、表記ゆれの修正も行いましょう。表記ゆれとは、たとえば「サーバー」や「サーバ」などのように人によって表現が異なる単語です。表記ゆれの修正により、正確な分析に近づきます。


STEP3.集計する

文章を単語レベルに分解した後は、単語が使われている回数を集計しましょう。エクセルで集計する際は単語を指定して、COUNTIF関数を用いて頻出数を集計します。

 

ただし、単語の数やデータ量が多い、表記ゆれがあるといった場合は、エクセル関数での集計が難しくなるケースもあるでしょう。たとえば、レビューやアンケートなどは、人によって表現の方法が異なり、集計しにくい場合もあるようです。


エクセル関数での集計が難しい場合には、集計用ソフトを使用する方法もあります。エクセルと連動して利用できるソフトには無料のソフトも多く、気軽に利用できます。


STEP4.ワードクラウドを作成する

頻出数の集計ができたら、ワードクラウドを作成しましょう。ワードクラウドとは、単語の出現頻度を図で表したものです。単語の出現頻度の高さによって文字の大きさや色などを変えて表したもので、わかりやすく可視化できます。


ワードクラウドでは、単語の出現頻度が高ければ高いほど文字が大きくなる仕組みです。そのため、単語の頻出度をパッと見ただけで把握しやすくなるというメリットがあります。


テキストマイニングをする時に覚えておくべきエクセル関数

テキストマイニングでエクセルを利用する際には、覚えておきたいエクセル関数があります。「COUNTIF関数」「SUM関数」「INDEX関数」の3つです。以下では、それぞれのエクセル関数について解説します。


COUNTIF関数

COUNTIF関数は、「=CONUTIF(範囲,検索条件)」というように表します。キーワードなどの条件を設定することで、その個数を数えられる関数です。COUNTIF関数では、範囲と検索条件を指定しなければなりません。


集計した回答が複数ある場合には、範囲のセルに「$」をつけて範囲を固定しましょう。固定しないと、関数のセルをコピーして別セルにペーストした際に、ズレが生じます。たとえば、A1からA10までを範囲指定して単語を集計したいときには、「=COUNTIF($A$1:$A $10, "指定するワード")」という式になります。


SUM関数

SUM関数は、「=SUM(引数)」というように表します。SUM関数では、指定した範囲の個数を合計します。たとえば、COUNTIF関数がB列に入力されている場合には、「=SUM(B1:B10)」といった式になります。SUM関数は、COUNTIF関数で数えた個数を集計する際に使うケースが多いです。このように、エクセル関数を組み合わせて使うことで、より集計しやすくなります。


INDEX関数

INDEX関数は、「=INDEX(範囲,行番号,列番号,領域番号)」というように表します。指定した位置のセルの値を表示する関数で、単独で使用することはあまりありません。基本的には、SUM関数などと組み合わせて活用するケースが多いでしょう。


SUM関数と組み合わせて使用する際には、「=SUM(セル:INDEX(範囲,行番号,列番号,領域番号))」という式になります。これにより、指定したセルからINDEX関数で指定した範囲までの、合計の値を表示することが可能です。


エクセルでテキストマイニングをするメリット・デメリット

エクセルでのテキストマイニングを検討している場合には、メリットとデメリットの把握が必要不可欠です。ここでは、エクセルでテキストマイニングを行う際のメリット・デメリットを解説します。


メリット

テキストマイニングをエクセルで行うメリットは、コストがかからないことです。エクセルの場合には、専用ツールを導入する必要がありません。ほとんどの企業では、すでにエクセルを使っているため新たなツールを導入する必要がなく、費用をかけずに分析できます。そのため、予算の余裕がない場合にもよいでしょう。


デメリット

エクセルでテキストマイニングを行う場合には、関数を入力する手間がかかります。関数を覚える必要もあり、手間だけでなく知識やスキルも求められるでしょう。また、エクセルの場合には、実施できる範囲が限られていたり、精度が低かったりします。実施範囲や精度の高さを求める場合には、エクセルは不向きです。


テキストマイニングで効果的な分析を行う方法

テキストマイニングはエクセルでも可能ではありますが、精度の高い分析を行うなら専用ツールを導入した方が様々な用途で活用できます。個人で利用する場合には、エクセルや無料で利用できるツールでも問題はありません。しかし、ビジネスとして本格的な分析をしたい場合には、アンケートやSNS、外部サイトなどからデータを収集してすぐに分析できる、精度や機能性の高い有料サービスの利用がおすすめです。


まとめ

テキストマイニングとはテキストを分析する技術で、膨大な量のデータから有用な情報を発掘する際に使われます。エクセルでもテキストマイニングは可能ですが、工数削減や精度を求めるのなら専用のシステムを導入した方が効率的です。テキストマイニングツールであれば、SNSや外部サイトなどからデータを収集し、分析のアウトプットを出して定量化するのはもちろん、感情分析など情報を深掘りしてかつ見やすくすることに役立ちます。


テキストマイニングツールをお探しの場合は、弊社で提供しているテキストマイニングSaaS市場11年連続シェアNo.1のテキストマイニングツール『見える化エンジン』がおすすめです。累積顧客導入数1,600社以上で、手厚いサポートと専門の分析コンサルタントによるコンサルティングを提供しています。効果的なテキストマイニングを行いたい場合は、ぜひお問い合わせください。