Moonshot AI、Kimi K2.5 APIを公開 ターボ並み速度で入力価格50%低減
Moonshot AIはKimi K2.5 APIを公開し、デフォルトで60-100 tok/sのターボ並み速度を提供。K2 Turbo比で入力価格を50%低減し、長文脈最適化によりキャッシュヒット価格も削減。多ターン作業の効率向上と高いワンショット成功率により運用コストを低減する。
人気のKimi大規模言語モデルを開発するMoonshot AIは、プロフェッショナルな性能と大幅に手頃な価格を両立したKimi K2.5 APIを公開した。
このAPIは、遅延とコストの長年のジレンマに対応する。標準設定で60-100トークン毎秒(tok/s)のターボ並みの推論速度を実現し、追加設定なしで高速応答を保証する。入力価格はK2 Turbo比で50%低減し、AnthropicのClaude 4.5 Sonnetの20%相当となり、エンタープライズ向けAIを低コスト化する。
K2.5は特に長文脈アプリケーションに最適化されている。キャッシュヒットの価格を大幅に削減し、多ターンエージェント作業や長距離推論タスクの費用を抑制する。これにより、従来予算を圧迫していた複雑な長時間対話をコスト効果的に実現する。
速度と価格以外に、K2.5は品質向上をコスト削減策として強調する。前モデル比でワンショット成功率を高め、再試行や修正作業を最小化する。この信頼性向上により、総運用コストを低減し、開発者や企業によるAI展開のスケーリングを効率化する。
競争の激しい大規模言語モデル市場で、Kimiシリーズは性能と価格のバランスで支持を集めている。K2.5 APIはこれを基盤に、長時間セッションでの一貫した性能を求める本番環境アプリケーション開発者をターゲットとする。
重要ポイント
- デフォルトで60~100トークン/秒のターボ級速度である
- 入力価格はK2 Turbo比で50%低い
- 入力価格はClaude 4.5 Sonnetコストの20%である
- キャッシュヒット時の価格を低減した
- 高いワンショット成功率によりリトライを削減する
トピック
Moonshot AIKimi K2.5AI APILLM pricinglong contextagent workflowsinference speed
Original Post
Loading post...
