@Kimi_Moonshot·製品·2026年1月30日

Kimi K2.5がOSWorldリーダーボードで首位、先進的なComputer Use能力を発揮

Moonshot AIのKimi K2.5モデルがOSWorldリーダーボードで1位を獲得し、優れたComputer Use能力を示した。これにより開発者は、人間に近い方法でコンピュータインターフェースとやり取りするAIエージェントを作成できる。

Moonshot AIのKimi K2.5がOSWorldリーダーボードで首位を達成した。これはAIエージェントのパフォーマンスにおける重要なマイルストーンである。OSWorldは、OSのナビゲーション、コマンドの実行、複雑なインタラクションを自律的に行うなど、実世界のコンピュータタスク処理能力を評価するためのベンチマークである。

この成果を支える最大の特徴はKimi K2.5のComputer Use能力である。これによりモデルはスクリーンショットを解釈し、マウスとキーボード入力をシミュレートし、人間の動作に近い方法でソフトウェアインターフェースを操作できる。開発者は、ファイル管理からアプリケーション利用に至る複雑なワークフローを、事前定義されたAPIに依存することなく扱う強力なエージェントを構築可能となった。

[OSWorldリーダーボードを確認](os-world.github.io)すると、Kimi K2.5がランキング首位に立っている。この成果はMoonshot AIのエージェント型AI技術の進展を強調している。モデルを支えるプラットフォームKimi.aiは、ビジョン、推論、アクションを統合したマルチモーダルAIのフロントランナーとしての地位を確立した。

OSWorldは多様なシナリオにわたる500以上のタスクでモデルをテストし、現実的な条件下での知覚と意思決定を要求する。Kimi K2.5の首位スコアは、非構造化環境への対応力の高さを示しており、汎用AIアシスタントへの重要な一歩である。

Moonshot AIはKimiシリーズの反復を続けている。K2.5は最新の進化形である。モデルのオープン統合は、生産性ツールから自動テストに至るエージェントアプリケーションのエコシステムの成長を支えている。

重要ポイント

Kimi K2.5がOSWorldリーダーボードで1位
人間らしいコンピュータインタラクションのためのComputer Use能力を備える

トピック

AI agentsOSWorld benchmarkMoonshot AIKimi K2.5computer useagentic AI

Original Post

Loading post...