コンタクトセンターの未来を拓く!Gen-AXが自律型AIオペレーター「X-Ghost」の基盤技術で2件の特許を取得
生成AIや自律型AIの技術は、私たちの生活やビジネスに大きな変革をもたらしています。特に、お客様からの問い合わせ対応を行う「コンタクトセンター」の分野では、AIオペレーターの導入が進み、その進化が注目されています。そんな中、生成AI・自律型AIを活用したSaaSプロダクトの開発を手がけるGen-AX株式会社は、自社の自律型AIオペレーター「X-Ghost(クロスゴースト)」の社会実装を支える基盤技術において、2件の特許を取得したことを発表しました。
これらの特許技術は、AIオペレーターが人間のようにスムーズかつ正確に対話し、さらに自律的に業務を遂行するための重要な土台となります。AIが社会のインフラとして広く活用される未来において、今回の特許取得は、日本の“おもてなし”を支えるAIエージェント技術の確立に向けた大きな一歩と言えるでしょう。
自律型AIオペレーター「X-Ghost」とは?
Gen-AXが開発する「X-Ghost」は、コンタクトセンターにおけるAIオペレーターです。一般的なAIオペレーターは、決められたシナリオに沿って応答することが多いですが、「X-Ghost」は「自律型」という点が特徴です。これは、AI自身が状況を判断し、まるで人間のように柔軟に会話を進め、必要な業務を完遂する能力を持っていることを意味します。
しかし、このような高度なAIオペレーターを実際のビジネス現場で安定して稼働させるには、いくつかの技術的な課題がありました。特に、お客様との「音声対話」においては、高いリアルタイム性と信頼性が求められます。例えば、AIがお客様の言葉を間違って聞き取ったり、応答が遅れたり、会話が途中で途切れてしまったりすると、お客様の満足度が低下し、業務に大きな支障が出てしまいます。Gen-AXは、これらの課題を解決するために独自の技術開発を進め、今回の特許取得に至りました。
AIオペレーターの課題を解決する2つの特許技術
今回の特許取得は、従来の音声対話モデル(Speech-to-Speechモデル)をそのまま適用するだけでは解決できなかった、日本語特有の課題や通信環境の問題に対応するためのものです。Gen-AXが独自に開発したこれらの技術は、AIオペレーターの実用性を飛躍的に高める可能性を秘めています。
特許技術①:日本語の読み誤りを自律的に制御し、スムーズな対話を実現する技術
AIが日本語を読み上げる際、特に数字や漢字の読み間違いは、お客様との誤解を招く致命的な問題となりかねません。例えば、「12,000円」を「じゅうにまんえん」と誤って読み上げてしまうと、金額に関する重大な間違いにつながります。従来のSpeech-to-Speechモデルでは、このような誤読が発生するケースがありました。
Gen-AXは、この問題に対し、AIモデルが音声を生成する際に同時に作られる「テキスト情報」に注目しました。詳しく検証した結果、音声に読み間違いがあっても、同時に生成されるテキストには正しい情報が含まれていることが多いという発見がありました。
そこで開発されたのが、音声とテキストの内容が一致しているかをリアルタイムで判定する独自技術です。もし内容に不一致が検知された場合、AIはそれを認識し、そのフィードバックを基に、より正確な応答を再生成します。この仕組みにより、AIオペレーターは日本語の読み誤りを自律的に修正できるようになり、お客様との間で違和感のない、自然で正確な音声対話が実現します。

特許技術②:音声対話における応答遅延・通信切断を回避する技術
コンタクトセンターのAIオペレーターは、24時間365日、途切れることなくお客様に対応し続ける必要があります。しかし、インターネット回線の混雑やサーバーの負荷状況によっては、応答が遅れたり、最悪の場合、会話が途中で切断されてしまうことがあります。これは、継続的な対話が求められるAIオペレーターにとって、お客様の体験を大きく損なう重大な課題です。
この課題に対し、Gen-AXは、複数のSpeech-to-Speechモデルを並行して動かす「冗長構成」という画期的な仕組みを考案しました。これは、例えるなら、メインのAIオペレーター(主系モデル)の他に、いつでも切り替えられる予備のAIオペレーター(従系モデル)を用意しておくようなものです。
通常時はメインのAIオペレーターが応答しますが、もし遅延や障害が発生した場合、システムは瞬時に予備のAIオペレーターに切り替わります。ここで重要なのは、切り替え先のAIオペレーターが、それまでの会話の内容をきちんと把握しているかどうかです。もし会話の文脈が引き継がれなければ、お客様は同じ話を繰り返すことになり、不満を感じてしまいます。
そこでGen-AXは、メインのAIオペレーターが保持している会話の履歴を、予備のAIオペレーターにも常に共有する方法を開発しました。この技術により、たとえAIオペレーターが切り替わったとしても、会話の流れが途切れることなく、お客様は自然な対話を続けることができます。これにより、安定した高品質なサービス提供が可能となるのです。

これらの技術がAIオペレーターの社会実装にもたらす価値
今回Gen-AXが取得した2つの特許技術は、単に個別の機能を改善するだけでなく、「X-Ghost」がコンタクトセンターという社会インフラの現場で、実際に業務を完遂できるAIエージェントとして機能するための基盤となります。
お客様と対話するAIオペレーターにとって、「正確に聞き取れる」「途中で止まらない」という信頼性は非常に重要です。これらの技術は、まさにその信頼性を実現するために考案・設計されました。AIがお客様の言葉を正確に理解し、誤りなく情報を伝え、そしてどんな状況でも途切れることなく対話を続けられることで、AIオペレーターは「会話ができる存在」から、お客様対応を「業務として任せられる存在」へと進化します。
Gen-AXのCTOである木田祐介氏は、「コンタクトセンターという24時間365日運用の現場では、わずかな読み間違いや一瞬の通信断が、ユーザー体験や業務品質に大きな影響を与えます。そうした課題に真正面から向き合い、技術で解決することが、私たちエンジニアリングチームの役割だと考えています」とコメントしています。
今後の展望:日本の“おもてなし”をAIで実現
Gen-AXは、今回の特許取得をゴールとするのではなく、技術を通じて社会に価値を届け続けることを目指しています。今後もAIエージェントが実社会で安心して活用されるための技術開発を継続していく方針です。
特に、音声対話、状況判断、そして自律的な業務遂行といった要素を統合し、コンタクトセンター領域において、日本のきめ細やかな“おもてなし”を実現するプロダクトの構築を進めていくとのことです。人とAIが協調し、より良いサービスを提供できる社会の実現に向け、Gen-AXのAIエージェント技術の進化に期待が集まります。
Gen-AX株式会社について
Gen-AX株式会社は、生成AI・自律型AIを活用したSaaSプロダクトの開発・提供と、企業のAX(AIトランスフォーメーション)を支援するコンサルティングサービスを提供しています。ソフトバンク株式会社が100%株主であり、AI技術の社会実装を強力に推進しています。
-
公式サイト: https://www.gen-ax.co.jp/
-
公式note: https://note.com/gen_ax

