KRAFTONがAIモデルブランド『Raon』を発表!最先端AI技術がオープンソースで世界へ

近年、私たちの生活のあらゆる場面で「AI(人工知能)」という言葉を耳にするようになりました。スマートフォンでの音声アシスタント、オンラインショッピングのおすすめ機能、そしてゲームの中のキャラクターの動きまで、AIは私たちの知らないうちに、より便利で豊かな体験を提供してくれています。そんなAI技術の最先端を走り、数々の人気ゲームを開発してきたKRAFTONが、新たな一歩を踏み出しました。
2026年4月9日、KRAFTONは、AIモデルブランド『Raon』(ラオン)を発表しました。この『Raon』ブランドのもと、音声対応大規模言語モデル(LLM)、リアルタイム音声対話モデル、テキスト読み上げモデル(TTS)、そしてビジョンエンコーダ(画像特徴抽出モデル)という、合計4種類の最先端AIモデルが、グローバルプラットフォーム「Hugging Face」を通じてオープンソースとして公開されています。
この記事では、AI初心者の方にも分かりやすい言葉で、KRAFTONが発表した『Raon』ブランドと、その画期的なAIモデルについて詳しくご紹介します。
『Raon』とは?KRAFTONのAIへの哲学を体現
『Raon』というブランド名は、韓国語で「楽しさ」を意味する言葉に由来しています。さらに、KRAFTONの社名の一部も取り入れられており、AI技術を通じて「ゲームの本質的な楽しさを創出したい」という、KRAFTONの深い哲学が込められています。
KRAFTONは、これまでもデータ収集からモデルの学習、そして性能評価に至るまで、ファウンデーションモデル(基盤モデル)の開発に必要な全工程を自社で遂行できる高い技術力を持っています。その技術力を背景に、今回「Raon-Speech」「Raon-SpeechChat」「Raon-OpenTTS」「Raon-VisionEncoder」という4つのモデルを公開しました。KRAFTONは、『Raon』を軸に、今後もグローバルでのAI技術競争力をさらに強化していく方針です。
『Raon』が公開する4つのAIモデルを徹底解説
今回公開された4つのAIモデルは、それぞれ異なる分野で最先端の技術を誇ります。それぞれのモデルがどのような機能を持っているのか、具体的に見ていきましょう。

1. 音声対応大規模言語モデル「Raon-Speech」
「Raon-Speech」は、従来のテキスト(文字)を中心に処理する大規模言語モデル(LLM)をさらに進化させ、音声の理解と生成を可能にしたモデルです。
想像してみてください。私たちが話す言葉をAIが正確に理解し、それに対して自然な音声で返答してくれるような世界です。このモデルは、私たちが普段使っているような「話し言葉」を認識し、その意味を解釈するだけでなく、人間が話すような自然な音声を生成する能力を持っています。
このモデルは、90億パラメータという大規模な構造を持っています。パラメータとは、AIが学習を通じて調整する「知識の量」のようなもので、数が多いほど複雑な情報を処理し、より賢くなる傾向があります。特筆すべきは、100億(10B)未満の公開されている音声言語モデルの中で、英語と韓国語の両方において「グローバル最高水準の性能」を達成している点です。これは、音声認識、音声合成、音声ベースの質問応答など、7つの主要なタスクと40ものベンチマーク(性能を測るための基準)を総合的に評価し、その平均順位で世界トップクラスの結果を出したことを意味します。
「Raon-Speech」は、例えば、AIがニュースを読み上げたり、音声で質問に答えたり、あるいは私たちの話す言葉をリアルタイムでテキストに変換したりする際に活用されることが期待されます。これにより、より直感的で自然な人とのコミュニケーションが可能になるでしょう。
2. リアルタイム音声対話モデル「Raon-SpeechChat」
「Raon-SpeechChat」は、「Raon-Speech」の技術をさらに発展させ、ユーザーとAIが会話中に自然に割り込みながら対話できる、画期的なリアルタイム双方向通信(Full-duplex)技術を採用した音声言語モデルです。
通常の音声アシスタントでは、私たちが話し終わるまでAIは黙って待っています。しかし、人間同士の会話では、相手の言葉の途中で相づちを打ったり、質問を挟んだりすることがよくありますよね。「Raon-SpeechChat」は、まさにそのような人間らしい自然な会話のやり取りをAIで実現します。
このモデルは、韓国で発表された初のリアルタイム双方向音声モデルであり、双方向通信モデルの評価ベンチマーク3種において、相づち、割り込み処理、応答遅延時間など13の主要なタスクの平均順位ベースで、グローバル最上位圏の性能を示しています。これにより、AIとの会話がよりスムーズで、ストレスフリーな体験へと進化するでしょう。例えば、ゲーム内のキャラクターが私たちの質問に即座に反応し、まるで人間と話しているかのような感覚で対話できるようになるかもしれません。
3. 高品質テキスト読み上げモデル「Raon-OpenTTS」
「Raon-OpenTTS」は、テキスト(文字)を自然な音声に変換する「テキスト読み上げ(Text-to-Speech: TTS)」モデルです。このモデルの大きな特徴は、公開されている音声データのみを用いて学習されている点です。
一般的に、高品質なTTSモデルを開発するには、大量の音声データが必要です。しかし、中には活用が難しいデータも存在します。「Raon-OpenTTS」では、KRAFTONが自らそうしたデータを収集・精製し、その学習データ全体もあわせて公開しています。これにより、世界中の誰もが同じ環境でモデルを再現して学習できるようになり、TTS技術の発展に大きく貢献することが期待されます。
このモデルは、人によるブラインド評価(誰が作った音声か分からない状態で評価すること)において、非公開データを用いたグローバルな研究向けTTSモデルと比較しても、最上位レベルの性能を達成しています。つまり、非常に自然で聞き取りやすい音声を生成できるということです。オーディオブックの読み上げ、視覚障がい者向けの読み上げサービス、あるいはゲームキャラクターのセリフ生成など、幅広い分野での活用が考えられます。
4. 画像特徴抽出モデル「Raon-VisionEncoder」
「Raon-VisionEncoder」は、AIが画像を理解可能な情報(特徴)へと変換するためのモデルです。私たちは写真やイラストを見て、そこに何が写っているのかをすぐに判断できますが、AIにとっては、画像は単なる数字の羅列に過ぎません。このモデルは、その数字の羅列から「これは犬だ」「これは山だ」といった意味のある情報を抽出する役割を担います。
このモデルは、言語モデルと組み合わせることで、視覚情報を処理し、画像の内容について質問に答えたり、画像を説明する文章を生成したりすることが可能になります。例えば、「この画像には何が写っていますか?」とAIに尋ねると、「犬と猫が楽しそうに遊んでいます」といった回答が得られるようになるかもしれません。
「Raon-VisionEncoder」の最も注目すべき点は、公開データのみを活用し、既存の事前学習済みモデルを一切使わず、ゼロから独自に学習させたことです。これは、非常に技術的な挑戦であり、その結果、一部の視覚認識タスクでは、Googleの代表的なビジョンエンコーダモデル「SigLIP2」を上回る結果を記録し、その他のタスクでもSigLIP2比で90%以上の高い性能を示しています。この独自の技術は、KRAFTONの「独自AIファウンデーションモデル」プロジェクトにも活用される予定です。
KRAFTONのAI戦略と今後の展望
今回の『Raon』モデルシリーズの公開は、KRAFTONがAI技術力を着実に蓄積していく上で非常に重要な節目となります。
KRAFTONのCAIO(最高AI責任者)は、「大規模な学習データと中核モデルをオープンソースとして共有することで、研究者や開発者が自由に活用できる環境を整え、マルチモーダル技術(複数の種類の情報を同時に扱う技術)の発展と韓国のAIエコシステムの成長に貢献できることを期待しています」とコメントしています。
KRAFTONは、ファウンデーションモデルの設計からAIエージェント、そして新しいゲーム体験を実現するCPC(Co-Playable Character)技術のゲームへの適用まで、AI技術全般にわたる開発力を持っています。AIエージェントとは、私たちに代わって様々なタスクを実行したり、コミュニケーションを取ったりするAIのことです。
同社は、すでに2025年には個人向けAIアシスタント「KIRA」を披露し、2026年3月にはAIエージェントの性能を高める「Terminus-KIRA」技術をオープンソースとして公開しています。これらの技術は、ゲーム内でより賢く、より人間らしい動きをするキャラクターや、プレイヤーの行動に合わせて変化するゲーム体験を生み出す基盤となります。
KRAFTONは、CPCのようなAIベースのインタラクティブコンテンツを通じて、新たなゲーム体験の拡張にも積極的に取り組んでいます。今後もAIモデルおよびAIエージェント技術の高度化を進め、技術革新をリードしていく予定です。

KRAFTONは、2007年に設立されて以来、「PUBG STUDIOS」や「Striking Distance Studios」など、多数のクリエイティブスタジオを擁し、『PUBG: BATTLEGROUNDS』をはじめとする様々な人気ゲームを開発・パブリッシングしてきました。 「Pioneer the Undiscovered」(未開拓分野の開拓者)というスローガンのもと、ファン中心の思考とグローバルな視点を持ち、新たなジャンルや技術領域を開拓し続けています。
今回の『Raon』ブランド発表は、KRAFTONがAI技術をゲーム開発だけでなく、より広い分野で活用し、AI産業全体の発展に貢献しようとする強い意志の表れと言えるでしょう。KRAFTONのさらなる詳細については、以下の公式サイトをご覧ください。
オープンソースがもたらすAIエコシステムへの貢献
今回、KRAFTONがこれらの最先端AIモデルをオープンソースとして公開したことは、AI業界全体にとって非常に大きな意味を持ちます。
オープンソースとは、ソフトウェアやプログラムの設計図(ソースコード)を一般に公開し、誰でも自由に使用、修正、再配布できる形式のことです。これにより、世界中の研究者や開発者がKRAFTONの高度なAIモデルを自由に利用し、さらに改良を加えたり、新しいアイデアを試したりすることが可能になります。
これは、AI技術の発展を加速させる上で非常に重要なことです。多くの人々が協力し、知識を共有することで、個々の企業だけでは到達できないような、より革新的なAIが生まれる可能性が高まります。特に、Hugging Faceのようなグローバルプラットフォームでの公開は、世界中のAIコミュニティとの連携を強化し、マルチモーダルAI技術(音声、画像、テキストなど複数の情報を統合的に処理するAI)の発展に大きく貢献するでしょう。また、このような取り組みは、韓国のAIエコシステム(AI関連の産業や研究が発展する環境)の成長にも寄与すると期待されています。
まとめ
KRAFTONが発表したAIモデルブランド『Raon』は、音声認識、リアルタイム対話、テキスト読み上げ、そして画像認識といった、多岐にわたる最先端のAI技術をオープンソースとして世界に提供する画期的な取り組みです。
特に、「Raon-Speech」のグローバル最高水準の性能、「Raon-SpeechChat」の人間らしい双方向対話、「Raon-OpenTTS」の高品質な音声生成、そして「Raon-VisionEncoder」のゼロからの独自学習と高い性能は、AI技術の可能性を大きく広げるものです。これらのモデルがオープンソースとして公開されたことで、世界中の開発者や研究者が自由に利用し、さらに新しい価値を創造していくことが期待されます。
KRAFTONは、ゲーム開発で培った技術力を基盤に、AIエージェントや新たなゲーム体験の創出にも力を入れています。今回の『Raon』ブランドの発表は、KRAFTONがAI分野の技術革新をリードし、私たちの未来をより豊かにしていくという強い決意を示しています。今後のKRAFTONのAI技術の進化と、それがもたらす新しい体験に、ぜひ注目していきましょう。

