難聴者支援から生まれた革新!AI音声認識システム「TeamLog」が複数人会話・騒音・多言語翻訳の壁を破る

難聴者の願いから誕生!AI音声認識システム「TeamLog」がコミュニケーションの未来を拓く

現代社会において、テクノロジーは私たちの生活を大きく変え、さまざまな障壁を取り除きつつあります。特にAI(人工知能)の進化は目覚ましく、音声認識技術もその一つです。しかし、これまでの音声認識システムには、騒がしい場所での利用や複数人の会話の正確な文字起こし、さらには異なる言語が入り混じる状況での対応など、多くの課題がありました。

こうした課題に真正面から向き合い、特に難聴者の「聞こえ」の壁を打ち破るために開発されたのが、リアルタイムAI音声認識システム「TeamLog」です。株式会社聴覚研究所が2026年4月13日に正式リリースしたこのシステムは、従来の音声認識の常識を覆す画期的な機能で、コミュニケーションの未来を大きく変える可能性を秘めています。

「TeamLog」とは?難聴者の願いから生まれた革新的な音声認識システム

「TeamLog」は、単なる文字起こしツールではありません。その開発の背景には、深い歴史と難聴者への強い思いがあります。株式会社聴覚研究所は、「岐阜県難聴児を持つ親の会」を前身とし、1993年に設立されました。難聴の子どもを持つ親たちが、我が子の発達や聞こえ、補聴器の研究などに取り組んできたことが、この研究所のルーツとなっています。

AI音声認識の研究を始めたきっかけは、新型コロナウイルスの感染拡大でした。マスクの着用が日常となったことで、難聴者の多くが深刻なコミュニケーション不全に陥りました。相手の口の形を読み取って聞き取りを補助している難聴者にとって、マスクで口元が隠れることは、会話の理解を極めて困難にする大問題だったのです。「会話がまったく聞き取れない」「買い物をするのも大変」「マスクを外してほしいとは言えない」といった切実な声が多数寄せられました。こうした状況を何とかしたいという思いから、声を文字に変換できる音声認識の研究が始まりました。

今までの音声認識が抱えていた深刻な課題

音声認識の研究を進める中で、その難しさが浮き彫りになりました。一般的な音声認識システムには誤認識がつきものですが、難聴者は自分の耳で誤認識を確認することができません。そのため、少しでも間違いがあると、会話の内容が全く分からなくなってしまうという問題がありました。

また、多くの文字起こしツールはスマートフォンなどの内蔵マイクを使用しているため、難聴者が特に困ることが多い「周囲が騒がしい環境」や「話す人が多い場面」では、他の音の影響を受けて音声認識がうまく機能しないことが多くありました。工事現場のような騒音下や、カフェや居酒屋のような賑やかな場所では、ほとんど役に立たないという実情があったのです。

「TeamLog」の3つの特徴:特許申請中の独自技術が実現する高精度

「TeamLog」は、これらの従来の課題を解決するために、特許申請中の独自の機構を搭載しています。複数の指向性マイクを使用することで、これまでの音声認識システムでは難しかった状況でも、高い精度で文字起こしを実現します。

1. 最大9名の同時文字起こし

スマートフォンアプリの文字起こし画面

「TeamLog」は、複数のマイクを効果的に使用することで、最大9名までの同時文字起こしに対応しています。これにより、複数の人が同時に発言したり、会話が割り込んだりするような状況でも、すべての発言を漏らさず文字に変換することが可能です。さらに、マイクに名前を登録することで、「誰が何を話したか」が一目でわかるようなデザインが採用されており、会議の議事録作成などにも非常に役立ちます。

2. 高い認識率と専門用語への対応

高精度の音声認識エンジンを採用しているため、一般的な会話はもちろんのこと、専門的な内容の会話でも高い認識率を誇ります。さらに、ユーザーが自由に単語辞書を作成できる機能があるため、特定の業界の専門用語や固有名詞、人名なども正確に文字起こしできます。医療や金融といった専門性の高い分野向けに特化した専用エンジンも搭載されており、専門性の高い会議やセミナーでも、非常に高い精度での文字起こしが期待できます。

3. 80dBを超える騒音環境下でも精度低下なし

複数マイクでの対談風景

従来の音声認識システムが苦手としていた騒音環境下での利用も、「TeamLog」は克服しました。強い指向性を持つマイクを採用することで、周囲の騒音や他の人の声の影響を極限まで抑えることに成功しています。これにより、80dB(デシベル)を超えるような騒がしい工事現場や、隣で大きな声で話す人がいるカフェや居酒屋のような場所でも、文字起こしの精度がほとんど低下しないという驚異的な性能を発揮します。これは、難聴者が日常的に直面する多くの困難を解消する画期的な進歩と言えるでしょう。

難聴者支援から広がる活用シーン:教育現場からビジネスまで

「TeamLog」は、難聴者の情報保障を目的として開発されましたが、その高い性能と多機能性から、難聴者支援にとどまらず、非常に幅広い分野での活用が期待されています。

日本語未習得の外国人児童への修学支援

翻訳テストのiPhone画面

近年、日本国内では日本語を習得していない外国籍の児童が急増しており、彼らの修学支援が大きな課題となっています。教室という、先生の声や他の児童の声、物音など、さまざまな音が入り混じる環境では、既存の文字起こしツールでは認識精度が低くなりがちでした。しかし、「TeamLog」であれば、そのような環境でも高い精度で文字起こしが可能です。

さらに、「TeamLog」は様々な国の言語にリアルタイムで翻訳する機能の開発・検証を進めています。これにより、日本語が分からない外国人児童でも、先生や友達の言葉をリアルタイムで自分の母国語に翻訳して理解できるようになり、安心して学習に取り組めるようになります。これは、教育現場における「言葉の壁」をなくし、よりインクルーシブな学習環境を実現するための強力なツールとなるでしょう。

議事録作成や同時通訳としてのビジネス活用

会議議事録のアプリ画面とCSV出力

「TeamLog」は、難聴者だけでなく、より多くの人々にとって便利なツールとなるよう、議事録作成や同時通訳の機能も充実させています。難聴者のみに特化したツールでは、導入のハードルが高くなる可能性があるため、企業や組織にとってもメリットのあるサービスを目指して開発されました。

現在の日本では、障害者差別解消法の改正により「合理的配慮の義務化」が進み、障害者の要望が企業や組織に受け入れられやすくなっています。しかし、音声認識システムの導入にはコストやセキュリティの課題が伴うこともあります。「TeamLog」は、企業や組織が抱えるこれらの課題を解決するため、高いセキュリティ性と利便性を両立させています。会議の議事録作成を効率化したり、国際的なビジネスシーンでの同時通訳をサポートしたりすることで、企業全体の生産性向上にも貢献します。

「TeamLog」の便利な機能一覧:セキュリティと利便性を両立

「TeamLog」は、ユーザーが安心して、そして便利に利用できるよう、多岐にわたる機能を備えています。

  • 認識結果はすべてローカル保存でセキュリティ性を確保: 音声データや文字起こし結果が外部サーバーに送信されないため、機密性の高い情報を含む会議などでも安心して利用できます。

  • 議事録としても利用可能なcsvやpdfで出力: 文字起こしされたデータは、CSV形式やPDF形式で出力できるため、議事録として簡単に整理・共有できます。

  • 記録や通信を行わないオフライン認識機能(開発予定): インターネット接続がない環境でも利用できるよう、オフライン認識機能が現在開発されています。これにより、場所を選ばずに「TeamLog」を活用できるようになります。

  • 複数の言語を同時に認識、翻訳する同時通訳機能: 多言語が混在する会話をリアルタイムで認識し、同時に翻訳することで、国際的なコミュニケーションを円滑にします。

  • リアルタイム修正で文字起こし精度100%の実現: 文字起こしの内容をリアルタイムで修正できる機能により、最終的な文字起こし精度を限りなく100%に近づけることが可能です。

  • 共有機能で他端末にもリアルタイム表示: 会議の参加者間で文字起こし結果をリアルタイムで共有できます。

  • 共有先端末で好きな言語に翻訳: 共有された文字起こし結果を、各参加者が自分の好きな言語に翻訳して表示できるため、国際会議などでの理解を深めます。

これらの機能により、「TeamLog」は難聴者だけでなく、ビジネスパーソン、教育関係者、そして多言語環境で生活する人々まで、幅広い層にとって非常に有用なシステムとなることを目指しています。

料金プランと今後の展望

「TeamLog」は、利用者のニーズに合わせて複数の料金プランを提供しています。

  • 法人向けプラン

    • 初期費用:なし

    • 基本料金:10,000円/月 + 音声認識エンジン利用料(従量)

  • 個人向けプラン

    • 初期費用:なし

    • 基本料金:1,000円/月 + 音声認識エンジン利用料(従量)

  • サポートプラン

    • 障害者手帳を持つ難聴者や難聴者支援を行う団体向けに、初期費用なしで個人・法人プランの料金が一定額割引されます。

※現在はiOS版のみが提供されており、Android版およびPC版は現在開発中です。
※音声認識エンジン利用料(従量)は、3時間利用で平均100円程度とされています。
※別途マイクなどの購入が必要ですが、汎用品が使用可能です。

今後の展望

「TeamLog」は、正式リリース前から多くの反響を呼び、難聴者が所属する就労施設や学校での試用テストが現在も実施されています。今後は、前述した日本語未習得の外国籍児童への修学支援への注力や、付属の編集ソフトを活用したリアルタイム修正システムの構築などが進められる予定です。さらなる精度向上、機能改善、そして幅広い分野への適応を目指し、開発が続けられています。

まとめ

株式会社聴覚研究所が提供するリアルタイムAI音声認識システム「TeamLog」は、難聴者の深い願いから生まれ、従来の音声認識システムが抱えていた「騒音」「複数人会話」「多言語」といった課題を、特許申請中の独自技術で解決しました。最大9名の同時文字起こし、80dB超の騒音下での高精度認識、そして多言語同時翻訳への対応は、まさに革新と呼べるでしょう。

難聴者の情報保障から始まり、日本語未習得の外国人児童の学習支援、そしてビジネスシーンでの議事録作成や国際会議での同時通訳まで、その活用範囲は広がり続けています。セキュリティと利便性を両立した多機能な「TeamLog」は、これからの社会におけるコミュニケーションのあり方を根本から変え、誰もが情報にアクセスし、円滑な対話ができるユニバーサルな社会の実現に大きく貢献することが期待されます。

「TeamLog」の詳細については、以下の公式サイトおよび商品ページをご覧ください。

タイトルとURLをコピーしました