ChatGPTなどの生成AIの登場により、4度目のAIブームが到来したといわれています。
文章や画像、音楽、動画などのコンテンツづくりなどもAIが担うことができるようになり、私たちの働き方やビジネスの世界が大きく変わりつつあります。
今回のAIブームは、過去の一過性のものとは異なり、インターネットやスマートフォンと同じように私たちの生活に不可欠な存在として定着するでしょう。
ビジネスにおけるAI活用も一層進み、AIを活用する企業とそうでない企業の競争力の差は、ますます広がっていきます。
本連載ではAI活用が当たり前になる社会においてこれまで価値を見出されてこなかった「音声」の可能性について紐解いていきます。
AIの活用はますます加速しています。サービスを提供する企業が増え、AI活用による成果の競争も激化していきます。
AI活用の3大分野
AIを十分に活用するためには、学習に必要なデータが欠かせません。
企業が保有するデータは主に「画像」「テキスト」「音声」の3つに分類されます。
ビジネスの現場では、「画像」「テキスト」は資料やメールなどでデータとしてきれいに整形された状態で残っており、既にビッグデータとして蓄積されています。
しかし、「音声」については録音する機器と機会が少なく、音声のデータ化は画像・テキストのデータ化に比べて遅れています。
商談や会議などビジネスにおける会話には、意思決定や議論の過程における重要な情報が含まれているため、これまで記録に残りにくかった音声をデータ化し、蓄積していくことで、AI活用において新たな競争力が生まれます。
録音ファイルと音声データは似て非なるもの
「企業がAIを活用していくためには、AIに学習させるための企業独自のデータが重要」というお話しをすると、「コールセンターのやりとりを全て録音してあるので、この録音ファイルを使って自動顧客対応AIを作れないか?」といった質問を受けることがあります。
しかし、ただ単に録音ファイルを溜めるだけでは、AI活用にはつながりません。商談や会議の録音ファイルを最初から最後まで視聴するのは時間がかかります。聞き返したい通話があっても、その録音ファイルを探す手間がかかるのであれば探そうと思いません。
これは音声データの活用が進まない理由の一つです。手間や時間がかかることは誰もやろうとしないのです。
また、ただ単に録音された状態ではAIによる学習も分析も期待できません。「AIは万能」と思っている人も多いのですが、AIが分析できるようにするためには、未処理の録音ファイル(非構造化データ)を音声データ(構造化データ)に変える必要があります。
録音ファイルを魚に置き換えると分かりやすいでしょう。
海に網を張ると魚がかかります。その魚を調理したり食べたりするためには、骨や身や内臓を分けて使いやすい状態にします。この加工処理によって、ようやく魚は食材として使えるようになります。この食材が音声データです。
良質な音声データを蓄積し、データドリブン経営を推進
音声データの活用は、録音した音声をそのまま扱うのではなく、上述したようにAIが使える構造化データに整える「データクレンジング」を行う必要があります。
まず、音声認識エンジンにより会話をテキストデータに変換します。さらに話し方や感情を解析し、会話内容に応じた「タグ」を付けます。
これにより、「誰が、いつ、どの業界の、どの担当者と、何をどのように話して、その結果どうだったのか」といった情報が付与され、AIが検索・分析可能な構造化データに変換できます。
AIがいかに進化しようとも、質の高いデータがなければ、その性能を最大限に引き出すことはできません。これまで記録として残されてこなかった会話や商談、雑談などの非デジタル情報をデータ化し、必要なときにいつでも分析できる仕組みを整えれば、企業のデータドリブン経営を推進できます。
データドリブン経営とは、マーケティング、営業、カスタマーサポート、採用、育成などのあらゆる企業活動を、データに基づいて意思決定する経営スタイルです。
このような体制を整えれば、企業の意思決定スピードが向上し、データを通じて市場や顧客、競合の動向を可視化できるため、変化する外部環境への適応力が増し、サステナブルな経営が可能となります。また、顧客の課題を深く理解することで、新たな商品やサービスの開発にもつながります。
良質な音声データを大量に貯め、それらを分析した結果から生まれたナレッジやノウハウは、データドリブン経営の実現を下支えとなるのです。