Imbue、コードとテキスト向けほぼ汎用最適化ツールEvolverをオープンソース化 ARC-AGI-2でSOTA95%達成
Imbueは、コードとテキスト向けのほぼ汎用最適化ツールEvolverをオープンソース化しました。ベンチマークでARC-AGI-2において最先端の95%を達成し、最良のオープンソースモデルの性能を3倍に向上させ、GPT-5.2レベルに到達しました。
Imbueは、コードとテキスト向けのほぼ汎用最適化ツールであるEvolverのオープンソース化を発表しました。ベンチマークテストにおいて、Evolverは先週公開された難易度の高いAIベンチマークARC-AGI-2で95%の最先端性能を記録しました。また、最良のオープンソースモデルの性能を3倍向上させ、GPT-5.2に匹敵する能力を実現しました。
Evolverは、Imbueのオープンソースエージェント型コード検証ツールVetを強化するために開発されました。他のシステムでは、自動プロンプト最適化ツールとして活用され、プロンプトを反復的に改善してより良い結果を得ています。Evolverの仕組みやARC-AGIにおける記録的性能の詳細は、会社の専用資料で提供されています。
ImbueはEvolverを、オープンエージェントを推進する一連のプロジェクトの重要な一部と位置づけています。同社は、オープンエージェントがクローズドプラットフォームに対抗し、AI主導の未来で人類が自由に生きるために不可欠だと強調しています。Evolverのソースコードは公開されており、開発者や研究者がこの技術を統合・活用できるようになりました。
重要ポイント
- Evolver: コードとテキスト向けほぼ汎用最適化ツール
- ARC-AGI-2でSOTA 95%
- 最良オープンソースモデルの性能3倍
- GPT-5.2レベル性能
- オープンソースエージェント型コード検証ツールVetの強化
- 自動プロンプト最適化ツールとして使用
トピック
AI optimizationopen sourceARC-AGIagentic AIcode verification
Original Post
Loading post...
