ブログ

目的別データ分析手法11選! 分析手順や注意点も解説(Vol.108)

  • 公開日:

膨大なデータを上手に活用するには、適切なデータ分析が必要です。しかし、データを前にしてどのように分析すればよいか、悩んでいる人もいるのではないでしょうか。

本記事では、目的別に役立つデータ分析手法とともに、データ分析を効果的に行うための手順や注意点を解説します。これからデータ分析を行おうと考えている人は、ぜひ参考にしてください。

データ分析の概要

ビジネスイメージ グラフ チャート 経済

データ分析を行うには、全体の流れや押さえるべきポイントをしっかり把握することが重要です。データ分析手法を用いても、分析データのフォーマットが統一されていなかったり、異常値があると、期待する結果が得られません。ここでは、データ分析を行うにあたって知っておくべき基本について解説します。

データ分析の基本

データ分析は、企業がもつ膨大なデータに対して整理・加工を行った上で集計・分析し、新たな知見や意思決定に役立つ情報を得るためのプロセスです。この分析結果を、 戦略や施策を打ち出すための意思決定に役立てます。データ分析の例としては、以下が挙げられます。

  • 需要予測:過去の売上データから適切な在庫量を予測する
  • 広告効果の測定:Web広告やSNS広告の効果を測定し、費用対効果の高い広告戦略を立案する
  • トレンド分析:市場のトレンドや競合状況などを分析し、事業戦略に役立てる

このように、目的にあわせてデータ分析を行うことで効果的な戦略を打ち出すことが可能です。具体的には、過去の売上データを分析して同時期に売上が多い製品を抽出し、マーケティングに活用して売上アップを狙う、ということができます。

企業が扱うデータは膨大かつ多種多様であり、効果的に活用することで変化が激しいビジネスに柔軟に対応できるようになります。そのため、企業にとって効率的かつ効果的にデータ分析を行うことは非常に重要です。

データ分析の手順

データ分析を行うには、事前に分析の目的や解決したい課題を明確にしておくことが大切です。そのうえで、きちんとしたプロセスに沿って行うことで精度の高い分析結果を得ることができます。データ分析の全体の流れは以下のとおりです。

1. データの収集
2. データのクレンジング
3. データ分析
4. レポート作成

それぞれの作業のポイントを押さえてデータ分析を行わないと、期待する結果が得られなかったり、誤った結果を得たりします。特に「データの収集」「データのクレンジング」は分析結果を大きく左右するため、必ず行いましょう。

1. データの収集

目的に合ったデータを収集します。収集するデータの種類や量によって分析結果の質が左右されるため、適切なデータを集めることが大切です。データ収集の方法として、以下が挙げられます。

  • データベースからの抽出
  • CSVファイルなどファイルで管理されたデータからの抽出
  • アンケート調査
  • Webスクレイピング

データはデータベースのように構造化されたデータだけでなく、メールやSNSの投稿、画像や動画など、非構造なデータも対象です。これら複数の形式の情報から必要な情報を抽出する方法も決めておく必要があります。

2. データのクレンジング

データを収集したら、分析しやすい形に整理・加工を行います。クレンジングを行うことで、データ分析の精度を高められます。クレンジングの具体的な作業は以下です。

  • データ形式の統一
  • 重複データの削除
  • 異常値の除去
  • 欠損値の処理

データのクレンジングは対象データの種類や量が多いほど時間がかかり、根気がいる作業です。しかし、データの品質を向上させ、分析の精度を高める重要な作業でもあるため、丁寧に行いましょう。

3. データ分析

データのクレンジングが完了したら、データ分析の目的やデータの種類に基づいて、データ分析を行います。例えば目的であればパターン発見や予測、分類などがあり、その目的にあわせて回帰分析や主成分分析などのデータ分析手法を用います。データ分析により、データの中に潜むパターンや規則性、将来の予測などを発見できます。

4. レポート作成

データ分析が完了したら、結果をレポートにまとめて共有します。レポートでは、グラフや図表を活用し、専門知識がない人でもわかりやすいものにしましょう。レポートを作成する際に押さえるべきポイントとして以下が挙げられます。

  • データ分析の目的を記載する
  • 結論を簡潔に記載する
  • シンプルな構成にする
  • 次のアクションにつながる内容を盛り込む

特に重要なポイントは、次のアクションにつながる行動指針を示すことです。これがないとデータ分析そのものが目的となってしまいます。データ分析によって導き出された情報を基に「何をすべきか」を明確に示すようにしましょう。

データ分析のポイント

データ分析を成功させるためのポイントとして、以下が挙げられます。

  • 分析目的を明確にする
  • 仮説を立てる
  • 必要なデータを収集する

データ分析を成功させるには、分析目的を明確にし、仮説を立てて期待する結果をある程度想定します。これをすることで、分析に必要なデータの検討がつきます。

データ分析は企業がもつデータをすべて用いて分析する必要はありません。逆に不要なデータが含まれることで、データの傾向が見えにくくなり、期待する結果が得られないこともあります。

そのため、分析に必要なデータを特定したうえで収集することが重要です。分析する対象のデータの範囲を絞る、特定の地域のみに限定する、といった対応を行うことで、制度の高い分析結果を得られます。

目的別データ分析手法①パターン発見

散布図・分布図

具体的なデータ分析手法について解説します。まず最初に紹介するのはデータの組み合わせやパターン、類似性などを発見するための手法です。これにより人間が直感的に気づきにくいデータの傾向を見ることができ、ビジネスチャンスや問題解決に活かせます。

ここでは代表的な4つの分析手法について解説します。

アソシエーション分析

アソシエーション分析は、大量のデータから項目間の関連性や規則性を発見するためのデータ分析手法です。例えば、お店で商品ごとの関係性を見出し、「どの商品が一緒に購入されやすいか」といった傾向を明らかにします。

アソシエーション分析は、以下の3つの指標で評価されます。

  • 支持度:特定の組み合わせが発生する頻度
  • 信頼度:一方が発生したときもう一方も発生する確率
  • リフト:2つの項目間の関連性の強さ

これらの指標を評価し、有益な関係性を見つけ出すことができます。

アソシエーション分析の注意点として、偶然の一致や季節性の影響を受けやすいという傾向があります。また、あくまでデータ間の関係性を示したものであり、因果関係を証明するものではないことに注意が必要です。そのため分析結果は慎重に判断しましょう。

相関分析

相関分析は、2つの連続した数値においてどのような関係性があるのかを分析する手法です。例えば、気温とアイスクリームの売上の関係性を分析すると 、気温が上がればアイスクリームの売上も増加する、という傾向がわかります。

相関分析では指標として「相関係数」を用います。相関係数は2つのデータの関係性の強さと方向性を数値で表します。相関係数は-1から1の間の値で示され、1に近いほど正の相関が強く、-1に近いほど負の相関が強いということを示します 。例えば、気温が高いほどアイスクリームの売上が増える関係性については正の相関、逆に気温が高いとホットコーヒーなど温かい飲み物は売上が減るため、負の相関にあると言えます。

相関分析において注意すべき点として、外れ値に影響を受けやすいという点が挙げられます。極端な値があると相関係数に大きな影響を与えてしまいます。事前にクレンジングをして外れ値を除去しておきましょう。

また、相関関係と因果関係を混同しない点にも注意が必要です。例えば、アイスクリームの売上と熱中症患者数には正の相関がありますが、どちらも要因として気温があり、アイスクリームが熱中症の直接的な原因ではありません。このように、2つの変数間に強い相関があっても、それが必ずしも直接的な因果関係を意味するわけではないことを覚えておきましょう。

なお、相関分析と類似した解析手法として「クロス集計」があります。クロス集計は複数のデータをかけ合わせることで特徴を抽出する手法です。例えばアンケート調査で複数の回答内容をかけあわせ、回答者の属性や違いを見出します。クロス集計がカテゴリー間の関係性を分析するのに対し、相関分析は定量的なデータの関係性を分析する点が異なります。

因子分析

因子分析は、多数の変数から共通する潜在的な要因(因子)を抽出する分析手法です。例えば、顧客アンケートの回答データから、顧客満足度に影響を与える「サービスの品質」「価格」などの要因を分析できます。

因子分析では、「因子負荷量」という指標を用いて、各変数がどの因子と強く関連しているのかを評価します。因子負荷量は、-1から1の間の値をとり、絶対値が大きいほど、その変数が因子と強く関連していることを示します。

因子分析は、主に以下のステップで行われます。

 1. 相関行列の作成
 2. 因子の抽出(主因子法や最尤法など)
 3. 因子の回転(バリマックス回転やプロマックス回転など)
 4. 因子の解釈

因子分析の結果は、因子負荷量の値に基づいて解釈されます。例えば、ある因子に対して、複数の変数で高い因子負荷量が観測された場合、その因子はこれらの変数に共通する要因であると解釈できます。因子分析の注意点として、因子の解釈には分析者の主観が入りやすく、専門的な知識が必要であることです。

主成分分析

主成分分析(PCA)は、多数の変数から情報をできるだけ失わずに、より少ない変数(主成分)にまとめ、パターンを発見する手法です。例えば、商品の特徴を表す10個の変数から、2~3個の総合的な評価を表す少数の変数を抽出し、データの可視化や解釈をしやすくします。

多数の変数から少数の変数にまとめる点において因子分析と似ています。しかし、因子分析はデータの潜在的な要因や共通的な部分を抽出するのに対し、主成分分析は新しい変数にまとめるという点が異なります。

主成分分析は、データのノイズ除去や可視化に活用でき、画像認識や顔認識システムなどでも活用されています。

目的別データ分析手法②予測

ビジネスイメージ 折れ線グラフとパソコン

次に紹介するのは、過去のデータからデータパターンを読み取り、未来の動向を予測するためのデータ分析手法です。以下の点を意識しておきましょう。

  • 予測したい対象を具体的に決めておく
  • 短期予測、中期予測、長期予測など、予測する期間を決める
  • 予測結果をどう活用するか、目的を決めておく

ここでは、4つの手法を解説します。

線形回帰分析

線形回帰分析は、2つの数値データの関係性に着目し、未来の結果を予測する方法です。具体的には、1つ以上の説明変数(独立変数)と目的変数(従属変数)の間に存在する線形の関係を基に、未来の値を予測します。例えば、以下のような分析に用いられます。

  • 広告費と売上高の関係の関係性を分析
  • 過去の売上データから将来の売上を予測

線形回帰分析は、結果が直感的に理解しやすく初心者にもおすすめの手法ですが、非線形の関係性を持つデータには適用できないのが欠点です。

ロジスティック回帰分析

ロジスティック回帰分析は、目的変数が二値(「購入する / しない」「成功 / 失敗」「合格 / 不合格」など) である場合に、結果を0から1の間の確率で予測する手法です。例えば、顧客が商品を購入するかしないか、生徒が試験に合格するかしないか、などの予測に利用できます。

計算効率がよく、結果が確率 で表現されることからわかりやすいため 、多くの分野で採用されています。データが非線形の関係を持つ場合は、他の分析手法を行うとよいでしょう。

時系列分析

時系列分析は、時間とともに変化するデータを分析し、未来を予測する手法です。この手法では長期的な傾向や周期性、不規則な変動などの構成要素に分解し、データを予測します。実際の用途として、季節性やトレンド、株価の変動や気温の変化などを予測する際に用いられます。時間に依存関係をもつデータに対して、高い予測精度を発揮します。

グレイモデル

グレイモデルは、確実性の低いデータや、限られたデータを用いても予測を行うことができる手法です。主に短期予測・中期予測に適しており、例えば経済成長や環境汚染、エネルギー消費量の予測などに用いられます。

計算が比較的簡単で非線形データにも対応できるものの、長期予測や強い変動を持つデータでは精度が落ちるというデメリットもあります。そのため、他の手法と組み合わせて利用するのがおすすめです。

目的別データ分析手法③分類

分布図

最後に紹介するのは、分類に役立つデータ分析手法です。大量データを特性やカテゴリーに基づいて分類することで、意味のあるパターンや傾向を見出し、意思決定に活用できます。
適切な結果を得るためには、以下のポイントを押さえておきましょう。

  • 分類基準を明確にする
  • 分類数を決めておく
  • 分類結果をどう活用するか、目的を明確にしておく

ここでは代表的な手法を3つ解説します。

決定木分析

決定木分析は、一連の質問に基づき段階的にデータを分類する手法で、ツリー構造で表現します。例えば「年収は600万円以上あるか?」「半年以内に購入履歴はあるか?」などの質問で振り分け、データを分類していきます。これにより、重要度の高い分類やリスク要因などの特定に活用できます。

決定木の構造は以下のようになっています。

  • ルートノード:最初の分岐
  • 分岐ノード:中間の分岐
  • リーフノード:分類結果

分析過程含め直感的で理解しやすく説明しやすいため、初心者にもおすすめです。ただし、データが複雑だったり、質問によってはツリー構造が複雑になったりすると、わかりにくくなるので注意が必要です。

クラスター分析

クラスター分析は、似た特徴をもつデータをクラスターと呼ばれる複数のグループに分類する手法です。例えば、顧客の購買履歴に基づき、顧客を「価格重視」「トレンド重視」などのグループに分類するほか、生物学的な分類などにも適用できます。これにより、通常気づかなかった隠れたパターンや傾向の発見に役立ちます。

この分析ではデータを いずれか 1つのグループに分類することで結果を得られますが、複数のグループに含まれてしまう場合は適用できません。そのため、分類するグループ数や結果の解釈について専門的な知識が求められる場合もあります。

ABC分析

ABC分析は、パレートの法則(80:20の法則)に基づいてデータを重要度別にA、B、Cの3つのグループに分類する手法です。例えば、以下のようなイメージです。

  • グループA:売上全体の80%を占める商品
  • グループB:次の15%を占める用品
  • グループC:残りの5%を占める商品

このように分類することで、売上において重要度の高い商品とそうでない商品に分類し、在庫管理や売上分析に役立てることができます。

ABC分析は直感的でわかりやすく、リソースの効率的な配分も可能にします。ポイントとして、基準となる指標をどれにするかが重要です。また、対象データの期間が短すぎると、分析結果が季節性やトレンドの影響を受けやすくなります。複数期間のデータを用いて分析を実施し、変化も捉えるようにするとよいでしょう。

データ分析の注意点

スーツのビジネスマンのビックリマーク

データ分析は、大量のデータをただ闇雲に分析するのでは意味がありません。きちんと筋道をたてて適切なデータ分析を行い、新たな知見や意思決定に役立つ情報を得ることが目的です。ここではデータ分析を行う上で注意すべき点を解説します。

データ分析を目的にしない

データ分析の目的を見失わないようにしましょう。データ分析の目的は新たな知見や意思決定に役立つ情報を得ることです。データ分析を行うためには多くのデータを収集し整形・加工する必要があり、またさまざまな分析を行うため、それだけで多くの労力が必要です。

そのため、繰り返しデータ分析を続けると、データ分析そのものが目的となり、導き出された情報が意味をなさない場合があります。そのようなことにならないよう、データ分析を行う前には必ず求めている情報・目的を明確にしておきましょう。

データ分析ツールを活用する

膨大なデータをさまざまな視点から分析するのは非常に時間がかかります。そのため、効率的に行うためにデータ分析ツールを活用しましょう。データ分析ツールの例としては、以下のものがあります。

BI(ビジネスインテリジェンス)ツール

データの収集や加工、レポーティングなど、データ分析に役立つ機能を備えています。代表的なツールとして「Microsoft Power BI」「Tableau」などがあります。

▼弊社では、お客様支援サービスとしてPower BIを用いた内製化・データ分析ソリューションをご提供しています。詳細を確認されたい方は、こちらも合わせてご確認ください。
・電通総研のPower BI内製化・データ分析ソリューション
https://crm.dentsusoken.com/power_bi/

データ統合ツール

多数のデータソースから必要なデータを収集し加工するにはデータ統合ツールやETLツールがあると便利です。社内やクラウド上にあるデータを一元化するだけでなく、構造化・非構造化含めクレンジングを効率よくできると、データ分析結果の精度の大幅な向上も期待できます。

▼弊社では、サイロ化したデータを統合、一元化する「データ統合(CDP)ソリューション」をご提供しています。詳細を確認されたい方は、こちらも合わせてご確認ください。
・電通総研のデータ統合(CDP)ソリューション
https://crm.dentsusoken.com/data-integration/

ツールによっては無料で利用できるものもあり、それぞれのツールの特徴、違いを確認しておくとよいでしょう。ツールを用いてデータの加工や分析を効率よく行えることは、データ分析作業において非常に大きなメリットです。工数がかかる作業に応じて適切なツールを選択しましょう。

目的にあわせてデータ分析手法を活用しよう

企業がもつ膨大なデータは、目的にあわせてデータ分析手法を活用することで、ビジネスや経営戦略に役立つ情報や、意思決定に役立つ情報を得ることができます。データ分析は、以下の手順で行います。
1. データの収集
2. データのクレンジング
3. データ分析
4. レポーティング

本記事では、データ分析手法において主に「パターン発見」「予測」「分類」について解説しました。他にも多数の分析手法があり、適切に使用することで効果的な情報が得られます。ただし、分析結果はデータのばらつきや量によって変わってきます。そのため、複数の分析手法を組み合わせて行うとよいでしょう。

また、分析対象のデータの種類や量が多いほど、データ分析の前段階であるデータの収集やクレンジングに時間がかかります。その場合はBIツールやデータ統合を支援するソリューションなどを活用し、効率的に行うことをおすすめします。

当サイトでは、サービスの導入事例や顧客接点DXソリューションに関するダウンロード資料を多数ご用意しております。ぜひダウンロードいただき、資料をご活用ください。

関連記事

最新記事

全社的なDX推進や顧客接点の最適化、エンゲージメントの強化など
お困りごとやお悩みがございましたら、お気軽にお問い合わせください。

データ統合ソリューション(DataCloud)はデータがサイロ化されているという課題を解決します。 点在するデータの整理、データの統合、そしてデータ駆動マーケティングまでのシステム構築・運用のサポートまで一環して行い、課題に対して的確なソリューションを提案します。
資料ダウンロードはこちら