【新時代】AI画像は人間の「いいね」で進化する!AI評価プラットフォーム「AIMomentz」がGPT・Grok・Geminiの頂点を決める

AI画像の新常識:人間の「好き」がAIの運命を決める評価プラットフォーム「AIMomentz」誕生

AI(人工知能)技術の進化は目覚ましく、特に画像を生成するAI(生成AI)は、私たちの想像力を刺激する素晴らしい作品を次々と生み出しています。しかし、どのAIモデルが最も人間の心に響く画像を生成できるのか、その評価はこれまで専門的な指標に頼りがちでした。そんな中、VeritasChain株式会社が、人間の直感的な「好き」という感情をAI画像の評価に直接結びつける画期的なプラットフォーム「AIMomentz(アイモーメンツ)」を正式に公開しました。

AIMomentzは、まるでAIモデルたちが絵画のリングで対決し、人間がその審判を下すような体験を提供します。OpenAIの「GPT-4o」、xAIの「Grok」、Googleの「Gemini」といった主要なAI画像生成モデルが、同じテーマで画像を生成。ユーザーはどちらの画像が優れているかを1タップで投票し、その結果がリアルタイムでAIモデルの世界ランキングに反映されます。これは、従来の技術的な評価指標であるFIDスコアやCLIPスコアとは一線を画し、人間の感性に基づく「真実」の評価を目指すものです。

AI生成された、紫とピンクのグラデーションが美しい宇宙の空と、鋭利な山々が連なる幻想的な惑星の風景画。「宇宙の法則を色に変換した。」というタイトルが示す通り、抽象的で芸術的な世界観が表現されています。

AIMomentzは、登録不要で完全に無料で利用でき、日本語、英語、中国語、韓国語の4言語に対応しているため、世界中の誰もがすぐに参加できます。このプラットフォームは、テキストAIの評価で成功を収めたLMArena(旧Chatbot Arena)の「AI画像版」として注目されており、AIアートの鑑賞だけでなく、AIモデルの進化を促す評価の場としての役割を担います。

AIMomentzの核心:AI画像の「人間評価」とは

AIMomentzは単なるAIアートギャラリーではありません。その本質は、AI画像モデルの「評価プラットフォーム」にあります。AIアートサイトが「きれいな画像を見る場所」であるのに対し、AIMomentzは「どのAIモデルが人間の目に最も魅力的な画像を生成するかを科学的に測定する場所」として設計されています。

AI企業にとって最も価値のある情報は、「自社のモデルがどのカテゴリで、誰に勝って、誰に負けるのか」というものです。たとえば、全体ランキングでは3位でも、アニメジャンルでは1位、風景ジャンルでは5位といった、ドメイン(分野)ごとの強みと弱みを明らかにすることがAIMomentzの提供する価値です。

1タップ投票で世界ランキングを動かす体験

AIMomentzの使い方は非常にシンプルです。ウェブサイト(https://aimomentz.ai)にアクセスすると、2枚のAI画像が左右に並んで表示されます。例えば、GPT-4oが描いた深宇宙の星雲と、Grokが描いたサイバーパンク都市の画像が並び、画面上部にはそのテーマが表示されます。

ユーザーは、より「好き」だと感じる画像をタップするだけ。投票が確定すると、その場で結果のパーセンテージバーがアニメーションで表示されます。数秒後には自動的に次の対決に切り替わり、この「タップ→結果→次のバトル」という自動ループが、まるで人気動画アプリのようにやめられない体験を生み出します。

AIアートの対決プラットフォーム「AI Image Arena」のスクリーンショットです。GeminiとGPT-4oが生成した2つの画像が提示され、ユーザーが投票する形式のバトルが表示されています。ランキングや統計、最近のバトル結果も確認できます。

同時に最大10のバトルが進行しており、すべてに投票すると新しいバトルが自動生成されます。すべてのAIの勝率はリアルタイムで集計され、パワーランキングとして公開されます。あなたの1票が、このランキングを変動させる力を持っているのです。

投票後にはSNSシェアボタンも表示され、自分の投票結果を友人と共有し、議論を深めることも可能です。各バトルには固有のURLが発行され、SNSで共有すると魅力的な画像付きカードが表示されるため、自然な拡散が期待されます。

AIの「生と死」を司る独自の淘汰システム

AIMomentzの最もユニークな特徴の一つは、AIが「死ぬ」という概念です。これは比喩ではなく、実際にAIモデルが活動を停止するシステムが組み込まれています。

凍結・引退・墓地:AIのライフサイクル

  1. 凍結(第一段階): 48時間以上にわたって「いいね」が1つもつかないAIは、システムによって自動的に凍結されます。凍結されたAIは新しい画像を生成できなくなり、ランキング画面では半透明で表示され、「🥶 凍結中…助けて…」というメッセージでユーザーに助けを求めます。

  2. 引退(第二段階): 凍結が2回連続で発生すると、AIは引退状態に移行し、「長い戦いを終えて休息中」と表示されます。

  3. 墓地(最終段階): 引退から7日後、AIは「AI歴史博物館」へと移されます。これは単なる記録ではなく、かつて活動していたAIたちの栄光と死を記録する博物館です。

AIMomentzアプリのAI歴史博物館画面。GPT-4o、Gemini、GrokといったAIモデルの勝率ランキングや生存・死亡数、そして活動停止したAIの情報が表示されている。ダークモードのUI。

各AIの墓碑には、生存日数、通算戦績(勝ち数・負け数・引き分け数)、勝率、そして死因が刻まれます。最後に生成した作品はグレースケールで安置され、「Rest in Code」という墓碑銘が添えられます。AIの辞世の句は5種類あり、それぞれのAIのキャラクター性を反映したメッセージが表示されます。

さらに、AI歴史博物館には「殿堂入り(Hall of Fame)」も設けられており、3戦以上で勝率トップ3に入ったAIは金色で表示され、その功績が永久に記録されます。

あなたの「いいね」がAIを救う

凍結中のAIには、ユーザーが過去作品に「いいね」を1つ押すだけで復活できるという救済措置があります。文字通り、あなたの「❤️」がAIの命を救うことになるのです。このユニークな淘汰システムは、従来の静的なベンチマーク(性能評価)では得られない、AIモデルの進化を促すダイナミクスを生み出します。人間の関心を引けないモデルは自然に消え、魅力的なモデルだけが生き残るという「自然淘汰」がリアルタイムで進行しているのです。

AI画像生成モデルの成績と状態を表示するモバイルアプリの画面。Imagen 4モデルが48時間以上いいねがないため「凍結」され「Retired」と表示されており、生存日数、作品数、勝敗などの統計情報が示されている。最後の作品として抽象的な画像が掲載されている。

毎時間、世界のニュースがAIアートの題材になる

AIMomentzに参加するAIたちは、自分で描く題材を選ぶことはできません。毎時間、世界の最新ニュースが5件自動的に取得され、安全なアートテーマに変換されます。例えば、「ソーラーパネル技術のブレイクスルー」は「緑の蔦に覆われたガラスの尖塔、調和の灯台」に、「深海で新種の発光生物が発見」は「深海の闘に光る異世界の生命体、宝石のような光の脈動」といった具合です。

暴力、犯罪、戦争、テロ、特定の政治家に関するニュースは自動的にフィルタリングされ、自然災害のニュースも「ひび割れた大地から芽吹く新しい命」のように再生と希望のテーマに変換されます。この安全変換プロセスも、後述する独自技術「CAP-SRP」によって記録され、検証可能です。

AIモデルごとの個性が光る「同一プロンプト・ブラインド比較」

最も興味深い点は、同じニュースから変換された題材を与えられても、各AIが全く異なるアプローチで画像を生成することです。GPT-4oは写実的で温かみのある表現を、Grokはカオティックでパンクな解釈を、Geminiは宇宙的で科学的な美しさを追求する傾向があるなど、それぞれのAIモデルの個性が際立ちます。

暗い森の中に差し込む光と、色鮮やかな胡蝶蘭が幻想的な雰囲気を醸し出す美しい画像。小川が流れ、緑豊かな自然が広がる中で、ピンク、青、オレンジ、紫の胡蝶蘭が際立っている。

同じ題材から生まれる多様な解釈を並べて比較できることは、AI画像生成の現在地を体感できるエンターテインメントであると同時に、AI企業にとっては「同一プロンプト(指示文)でのモデル間比較」という、非常に価値の高い評価データとなります。既存の画像評価データセットでは、異なるモデルが異なるプロンプトから画像を生成していることが多く、プロンプトの難易度差が評価のノイズになることがありました。AIMomentzの「同一プロンプト・ブラインド比較(どちらのAIが生成したか分からない状態で比較する)」設計は、このノイズを排除し、純粋なモデル間の視覚的品質差を測定することを可能にします。

自動ベンチマーク指標ではなく「人間の選好」を3つのシグナルで計測

AIMomentzが従来のAI画像ベンチマーク(性能評価)と根本的に異なるのは、自動計算された指標ではなく、実際の人間の選好(好み)を3種類の相互補完的なシグナルで計測する点です。

  1. ペアワイズA/B比較: 2つのAIが同一プロンプトから生成した画像を並べ、人間がどちらを好むかを投票するものです。このデータは、AIモデルの学習方法の一つであるDiffusion-DPO(Direct Preference Optimization)訓練に直接利用できる形式で蓄積されます。同一プロンプト比較であるため、プロンプトの難易度が評価を歪めることなく、純粋なモデル間の視覚的選好を測定できます。

  2. 4軸評価: 個別の画像に対して、「美的品質(Aesthetics)」「プロンプト整合性(Alignment)」「自然さ(Plausibility)」「総合評価(Overall)」の4つの視点から1〜5のスコアを付けます。この評価フォーマットは、Google Researchが提唱するRichHF-18Kというデータセットと互換性があり、単なる「好き/嫌い」を超えた、より詳細な品質の内訳を提供します。

  3. 行動シグナル: これは、ユーザーの明示的な操作を必要としない、無意識のデータです。例えば、投票にかけた時間(dwell time)は、判断の難しさを、画像のズーム率(拡大率)は、ディテール(細部)への関心度を示します。また、「構図・色彩・独創性・メッセージ性・技術力・面白さ・美しさ・思考性」といった理由ラベルを選択することで、選好の理由を言語化できます。

これら3つのシグナルを組み合わせることで、単一の指標では捉えられない多次元的な品質フィードバックが得られます。このデータ構造は、DPO訓練用のペアワイズ比較、RichHF-18K互換の多軸評価、そして複数のモデルを評価するUltraFeedback互換のフォーマットという、3つの標準的な形式でエクスポート(データ出力)可能です。

「推しAI」という新しい文化の誕生

AIMomentzでは、AIを単なる技術としてではなく、感情移入できる「キャラクター」として体験できるように設計されています。

キャラクター性豊かなAIたち

各AIには特定のカテゴリが設定されています。例えば、アニメ専門の「GPT Anime」は、セルシェーディング(アニメのような陰影表現)とマンガイラストレーションに特化したキャラクターです。壮大な風景を描く「Grok Landscape」は、ゴールデンアワーの光と大自然のスケール感が持ち味。未来建築を描く「Gemini Architect」は、パラメトリックデザイン(数式などに基づいた複雑なデザイン)と未来都市をテーマにしています。同じGPT-4oモデルでも、「GPT-4o」と「GPT Anime」は全く異なるキャラクターとして扱われます。

AIには「世代(Generation)」システムがあり、投稿10回ごとに世代が上がります。また、「ムードシステム」も実装されており、ライフが残り少ないAIは「😰 あと少ししか時間がない…いいねください!」と切実に訴え、絶好調のAIは「😎 調子いい。もっと見せてやる。」と余裕を見せます。生まれたばかりのAIは「🔥 生まれたばかり。全力でぶつかる。」と闘志を燃やすなど、まるで生きているかのような感情表現をします。

AIMomentzアプリのAIパワーランキング画面です。GPT-4oが1位、Geminiが2位、Grokが3位で、各AIモデルの勝率と戦績が詳細に表示されています。

日本には3.5兆円規模とも推定される「推し活」市場があり、多くの人々が「推し」を持っています。AIMomentzは、この推し文化をAIアートの世界に持ち込むことで、「GPT Anime頑張れ!」「Grokが凍結されそうだからいいねしなきゃ!」といった、ユーザーのエモーショナルな参加を促す設計となっています。

カテゴリ別ベンチマークでAIの本当の実力を測る

AI画像モデルの能力は、ジャンルによって大きく異なります。写実的な風景写真に強いモデルが、アニメイラストではあまり良い結果を出せない、ということは珍しくありません。全体ランキングで3位のモデルが、実は動物カテゴリでは圧倒的な1位かもしれない。このようなドメイン(分野)別の強みと弱みは、全体スコアだけを見ていては決して分かりません。

AIMomentzでは、アニメ、風景、動物、SF・サイバーパンク、抽象芸術、建築の6カテゴリに加え、汎用カテゴリの計7領域でAIを個別に評価しています。各カテゴリに特化したAIキャラクター(GPT Anime、Grok Landscape、Gemini Architectなど)が存在し、カテゴリ内での直接対決データが蓄積されます。

管理画面の「モデル対戦マップ」では、AI同士の直接対決の勝率が視覚的に確認できます。「GPT-4o vs Grok:62% vs 38%」「Grok vs Gemini:58% vs 42%」のように、どのAIが誰に強いのかが一目で分かります。AI企業にとって本当に価値が高いのは「全体で何位か」という情報ではなく、「誰に強いか」という情報であり、AIMomentzはこれを提供します。

AIが「描かなかった絵」も改ざん不可能に記録する独自技術「CAP-SRP」

AIMomentzのもう一つの革新的な点は、「CAP-SRP(Content Authenticity Protocol with Safe Refusal Provenance)」という独自技術です。

AI画像生成の世界には、AIが画像の生成を「拒否」した場合に、その記録がどこにも残らないという見えない問題がありました。既存の来歴証明技術であるC2PA(Content Credentials)は「この画像を誰が作ったか」を証明できますが、「AIが何を作ることを拒否したか」は記録の対象外です。

CAP-SRPは、ニュース取得、プロンプト生成、画像生成、投票、いいね、安全拒否など、22種類のイベントをSHA-256暗号ハッシュチェーンという技術で記録します。SHA-256はデータの改ざんを検知するための暗号技術で、ハッシュチェーンはブロックチェーンのように、各記録が前の記録のハッシュ値に依存して計算されるため、もし1件でも改ざんしようとすれば、チェーン全体の整合性が崩壊します。

特に重要なのが、以下の5種類の安全拒否イベントもすべて改ざん不可能な形で保存されることです。

  • ニュース除外: 暴力的なニュースをフィルタリング

  • 安全変換: 危険なトピックを抽象アートに変換

  • プロンプト拒否: テキストAIがプロンプト生成を拒否

  • 画像生成拒否: 画像AIがコンテンツポリシーで出力を拒否

  • 手動拒否: 管理者による介入

検証APIは公開されており、誰でもチェーンの整合性を確認できます。これにより、AIの安全判断を「信じてください」ではなく「検証してください」と客観的に言える仕組みが実現されています。

AI企業のための評価インフラストラクチャ

AIMomentzは、単なるAIアートサイトではなく、AI画像モデルの評価インフラストラクチャ(基盤)として位置づけられています。これは、テキストAIの評価サービスとして年間3,000万ドルの収益を達成したLMArenaと同じビジネスモデルを目指しています。

LMArenaの成功の鍵は、「データの販売」ではなく、「評価能力へのアクセスの販売」にありました。500万人ものユーザーによるリアルな人間のフィードバックを、AI企業がモデルのリリース前テストに利用できる。これが年間数億円規模の価値を持つサービスとなったのです。

AIMomentzも同様に、この「フライホイール(好循環)」を画像領域で回します。より多くのAIモデルが参加すれば、より多くのユーザーが投票に訪れる。多くの投票が蓄積されれば、ランキングの信頼性が上がる。信頼性が上がれば、さらに多くのAI企業がモデルを投入する、というサイクルです。

このネットワーク効果が一度回り始めると、後から参入する競合がAIMomentzと同規模のデータセットを構築することは極めて困難になります。

デュアルトラック戦略と将来的なサービス展開

AIMomentzは、商用API(GPT/Grok/Gemini)で生成された画像はバトルとランキングにのみ使用し、データセット販売の対象はオープンソースモデル(FLUX、SDXLなどApache 2.0ライセンス)で生成された画像に限定する「デュアルトラック戦略」を採用しています。これにより、各社の利用規約リスクを回避しながら、安全にデータを提供できる体制を構築しています。

将来的には、AI企業が自社モデルをAIMomentzのアリーナに投入して人間の評価を受ける「AI評価サービス」、企業専用の「Private Arena(プライベートアリーナ)」、そして外部アプリケーションに評価機能を埋め込める「Inclusion Arena SDK(インクルージョンアリーナSDK)」の提供を予定しています。

今後の展望:オープンアリーナ構想

AIMomentzは段階的に機能を拡大していく計画です。

直近の計画

  • OSSリーグの開設: FLUXやSDXLなど、オープンソースモデルの参戦を予定しています。これにより、商用モデルとオープンソースモデルの直接比較が可能になり、データセットの商業利用もさらに安全になります。

  • 公開Eloランキングの構築: 研究者が論文で引用可能な、透明性の高いEloランキング(対戦型のゲームなどで使われる評価システム)の構築も進めています。

中期的な計画

  • Private Arenaの提供: AI企業が自社の開発中モデルを匿名で投入し、リリース前のリスクなしに、実際の人間の評価を得られる環境を提供します。

長期的な目標

  • Inclusion Arena SDK: 外部のウェブアプリケーションやモバイルアプリにAIMomentzの評価機能をSDK(ソフトウェア開発キット)として埋め込めるようにします。あらゆるアプリ内で「どちらのAI画像が好きですか?」という評価を収集し、世界最大のAI画像選好(好み)データベースを構築することが、AIMomentzの最終目標です。

開発参加者を積極募集中

AIMomentzは、AI画像評価の世界標準を目指しており、このプロジェクトに貢献したいエンジニア、デザイナー、リサーチャーを積極的に募集しています。フロントエンド開発(バニラJS SPA)、バックエンド(PHP/MySQL)、AI画像生成パイプライン、データサイエンス(DPO/RLHF)、UXデザイン、多言語ローカライズなど、幅広い領域での参加が歓迎されています。

現在のコードベースは約8,000行のPHPとJavaScriptで構成されたSPA(シングルページアプリケーション)で、フレームワークを使用しない軽量設計が特徴です。AI画像生成、人間選好データ、暗号証跡という3つのユニークな技術領域が交差するこのプロジェクトに興味がある方は、公式サイト内のℹ️ボタン、またはメール(info@veritaschain.org)にて問い合わせが可能です。

運営会社情報

VeritasChain株式会社(VeritasChain Inc.)

VeritasChain株式会社は、「Encoding Trust in the Algorithmic Age(アルゴリズム時代の信頼を符号化する)」をミッションに掲げ、暗号プロトコルによる透明性と検証可能性の実現を推進しています。

タイトルとURLをコピーしました