Moonshot AI、「Kimi K2.5」をオープンソース公開 ビジュアルエージェントでSOTA達成
Moonshot AIは、ビジュアルエージェントインテリジェンスモデル「Kimi K2.5」をオープンソースで公開した。主要エージェントベンチマークで世界最高性能を記録し、ビジョンおよびコーディングタスクでオープンソース首位を獲得。「Code with Taste」やAgent Swarmベータ版などの新機能を搭載している。
Moonshot AIは、ビジュアルエージェントインテリジェンスモデル「Kimi K2.5」をオープンソースで公開した。このモデルは、エージェントベンチマークで世界最高性能(SOTA)を達成しており、フルHLEセットで50.2%、BrowseCompで74.9%を記録した。
モデルは、ビジョンおよびコーディング評価でもオープンソースSOTAを更新。MMMU Proで78.5%、VideoMMUUで86.6%、SWE-bench Verifiedで76.8%を獲得し、マルチモーダル理解とソフトウェアエンジニアリング能力でリーダー的地位を確立した。
「Kimi K2.5」は新機能「Code with Taste」を導入。チャット、画像、動画を審美的なウェブサイトに変換し、表現豊かなモーションを実現する。
さらに、Agent Swarmベータ版により、自己主導型エージェントをスケーラブルに並列稼働可能。最大100のサブエージェント、1,500回のツール呼び出しをサポートし、単一エージェント比4.5倍の高速性能を発揮する。
「Kimi K2.5」はkimi.comでチャットおよびエージェントモードで利用可能。高ティアユーザー向けにAgent Swarmベータを提供。プロダクション向けコーディングではKimi Codeとの併用が推奨される。APIはplatform.moonshot.ai、技術ブログおよびオープンウェイト・コードはHugging Faceのmoonshotai/Kimi-K2.5で公開されている。
今回の公開は、エージェントワークフロー、ビジョン処理、コード生成におけるオープンソースAIツールを進化させる。
重要ポイント
- HLE full set:50.2%
- BrowseComp:74.9%
- MMMU Pro:78.5%
- VideoMMMU:86.6%
- SWE-bench Verified:76.8%
- Agent Swarm:最大100サブエージェント
- Agent Swarm:1,500ツールコール
- Agent Swarm:シングルエージェント比4.5倍高速
