コンタクトセンターの音声認識の有効活用　事例と導入効果を一挙にご紹介（Vol.25）｜ブログ

コンタクトセンターの音声認識の有効活用　事例と導入効果を一挙にご紹介（Vol.25）

コンタクトセンタ－/コールセンター

公開日：2023年03月27日（月）
最終更新日：2025年02月04日（火）

昨今では、電話主体のコールセンターから、電話だけではなくメールやSNS、チャットなどを利用したマルチチャネルに対応したコンタクトセンターが主流になりつつあります。本記事では、さまざまなチャネルの中から電話におけるお客様との会話の「音声」にスポットを当てて、コンタクトセンターにおける「音声データ」、音声認識の有効活用についてご説明します。

電話音声の見える(データ)化
音声認識とは
コンタクトセンターにおける音声認識の活用
まとめ

電話音声の見える(データ)化

電話の会話の「音声」は、コンタクトセンターと呼ばれるようになった昨今でもとても重要なチャネルであることは疑う余地はありません。しかしながら、「音声」というのはそもそも目に見えないため、データという観点では人間にとってもコンピュータシステムにとっても大変扱いづらいものなのです。

例えば、お客様とオペレーターが30分間お話ししたとします。通話が終了すると、オペレーターは通話中に取ったメモを見ながら、あるいは録音した音声を聞きながら、応対履歴を作成します。(慣れたオペレーターは、話しながら入力していくこともあるかもしれません。)
メモはお客様と話しをしながら取るので、この方法では時には内容が不十分になったり、重要な項目の書き漏れがあったりの問題が発生します。
また、録音音声を聞いて応対履歴を作ろうとすると、当然聞くだけで通話時間とほぼ同じ30分かかるわけです。ましてや、音声を一時停止して詳細を確認しながら全文テキスト化しますから、熟練の人でも音声の5倍以上の時間(30分の音声だと2.5時間以上)がかかる作業になると言われています。音声からの文字起こしには多くの工数がかかり、これでは、オペレーターの現場での顧客応対業務に支障が出る可能性があります。

このように、人間がパッと見てわかる「テキスト」やシステムが扱える「データ」にする（＝見える化）には、膨大な時間と手間がかかるわけです。そのような悩ましい事態をサポートし解決してくれるソリューションが「音声認識」なのです。

音声認識とは

音声認識とは、人間が発話した音声をコンピュータが認識して、即時に自動でテキスト化してくれるシステムのことです。
身近なところで言えば、スマートスピーカー(「Amazon Echo」や「Google Home」など)や音声アシスタント(iPhoneやiPadに搭載されている「Siri」やGoogle検索で使う「Google Assistant」など)が有名です。昨今では、AI技術を搭載し、より高精度の認識が可能になったことから、一気に普及してきました。

音声認識の活用分野としては、コンタクトセンターをはじめ、議会や会議などの議事録作成、番組や講演などの字幕作成の自動化があります。また作業現場などでのデータ入力、KIOSK端末、IoT、ロボットなどがあり、挙げたらキリがないほどさまざま業種・業務で活用されています。

クラウド化・効率化を考える第一歩目にピッタリ
コンタクトセンターソリューション基本ガイドブック

コンタクトセンターにおける音声認識の活用

コンタクトセンターにおいては、さまざまな業務で音声認識が活用できます。主な活用事例と導入効果をご紹介します。音声データをテキスト化することはシステムで活用ができるデジタル化することが目的です。

通話のテキスト化

お客様の話した電話音声とオペレーターのマイク越しの音声がそれぞれリアルタイムにテキスト化されます。音声の特徴により話者が誰かを識別する機能もありますので、混在することはありません。もちろん、録音された音声をあとでテキスト化することも可能です。

テキスト化のメリット

オペレーターは通話終了後に時間をかけて応対記録を作成する必要がなくなります。
管理者は、従来のモニタリングでは音声を聞く必要があったため同時に複数のオペレーターの管理は不可能でした。しかしテキスト化されれば、同時に複数のオペレーターのモニタリングして状況の把握が可能になります。
テキスト化されたデータを使用して、例えば、問い合わせが多い商品や頻出ワードの抽出、クレーム内容のチェックと分析、オペレーターの応対品質やトークスキルの向上など、教育・学習の目的までさまざまな活用が可能になります。自然言語処理を搭載した高精度なテキストマイニングツールを使用し精緻に分析するケースも期待できます。

キーワードの抽出 (キーワードスポッティング)

お客様の話した音声の中にあらかじめ登録したキーワードなどが含まれていた場合や、オペレーターが不適切なワードを発してしまった場合など、即座にそのワードを検知、抽出することができます。
例えば、「たわし」という言葉をキーワード登録しておいたとします。お客様が”たわしについての聞きたい”とおっしゃった場合、「たわし」という単語を検出し、自動的にオペレーターの画面に「たわし」の情報を表示するといったことも可能になります。

昨今では、AI技術を使い全文テキスト化されたデータを解析し、データベース化されたFAQの一覧などから適切な情報をオペレーター画面に表示することも可能となっています。AIを活用することでシステムのチューニングも容易にできるようになります。

IVR

IVRとは「Interactive Voice Response」の略で、自動音声応答装置やシステムのことです。

IVRについての詳しい説明はこちら
IVR（自動音声応答装置）とは？コールセンターでの役割や効果を解説（Vol.18）

一般的なコンタクトセンターでは、実際のオペレーターが行っていた応対業務の一部を置き換えたり、お客様の用件を適切なオペレーターに振り分けたりするためなどに使用されています。

一般的なIVRでは、流れてきた音声ガイダンスに従ってプッシュボタンでメニュー番号を選択入力します。すると、その番号に従ってさらに音声ガイダンスが流れ、またプッシュボタンでメニュー番号を入力する、といった流れになります。(階層はコンタクトセンターによって異なります。)

お客様は自分の用件とは全く関係ない音声ガイダンスを長々と聞かなくてはならなかったり、自分の用件はどれに当てはまるかわからなかったりする時など、お客様によっては不満やストレスを感じるケースも存在しています。延いては顧客満足度の低下に繋がってしまうことも考えられます。

昨今ではそのような顧客満足度低下を回避するため、お客様には自由に用件を話してもらい、それを音声認識でテキスト化するケースがあります。さらにAI技術で意味を解析、適切な回答を音声で案内するといった従来のIVRの枠を飛び越えた、いわゆるバーチャルオペレーターと呼ばれるような環境も実現することが可能です。

感情解析

お客様の話している声から、怒りや喜びといった感情を検出することも可能です。オペレーターはお客様の感情に配慮した応対ができるようになり、またクレームやトラブルを未然に防ぐことも可能になるかもしれません。

音声ボットや声紋認証

ほかにも、パソコン上のチャットボットに対し音声で入力する「音声ボット」があります。また「声紋認証」による本人確認、オペレーターの発話データや発話特性(トーンやイントネーション、テンポなど)を分析し「応対品質向上」に繋げたり、声で操作や電話をかける「ボイスコントロール(ダイヤル)」など、さまざまな場面で音声認識を活用することが期待できます。

コンタクトセンターのクラウド化の課題解決に
Amazon Connect機能と新テクノロジーがわかるガイドブック

まとめ

このように、近未来のコンタクトセンターは、「音声」の有効活用 = 音声認識（音声データのテキスト化） が重要なキーになると考えられ、多くの企業から注目されています。

音声認識によって、お客様の「音声」、さらに進んでオペレーターの「音声」も積極的かつ効果的に活用できます。そして、お客様の満足度向上、稼働率向上による人材不足の解決、業務効率化、マーケティングデータへの反映・活用など、大きなメリットを生み出すことができるのです。

電通総研では、音声認識を活用したコンタクトセンターなど豊富なコンタクトセンター構築のノウハウを有しておりますので、自社のコンタクトセンターの再構築や改善をお考えの際は是非ご相談ください。

当サイトでは、顧客接点DXソリューションに関するダウンロード資料を多数ご用意しております。ぜひダウンロードいただき、資料をご活用ください。

ブログ