Kimi K2.7 vs GLM-5.2:Fable 5消失の翌日、中国から来たコーディングAI
「Fable 5が止まった翌朝、Hugging Feedが騒がしかった。KimiとGLMが同時に出てきた」。こんな投稿がXのタイムラインに複数流れたのは6月13日の朝だった。
6月12日午後5時21分(米東部時間)、Anthropicは米商務省から輸出規制指令を受けてClaude Fable 5とMythos 5を全顧客に対して停止した(Anthropic公式声明)。わずか24時間以内に、Moonshot AIはKimi K2.7-Codeを、Z.ai(旧Zhipu AI)はGLM-5.2をHugging Faceで公開した。偶然の一致かもしれない。ただ、タイミングは誰の目にも象徴的に映った。
- Claude Fable 5 / Mythos 5の利用停止でコーディングAIの代替を探している開発者
- オープンソースモデルをローカルまたはAPIで使いたいエンジニア
- AIツールのトークンコスト削減を検討しているエンジニアリングマネージャー
Kimi K2.7-Code:推論トークンを30%削減した1兆パラメータモデル
Moonshot AIがKimi K2.7-Codeをリリースしたのは6月12日、Fable 5停止と同日だ(MarkTechPost, 2026年6月12日)。総パラメータ数は1兆(MoE構造で実際に動くのは32B、384エキスパート)。コンテキストウィンドウは256K。ライセンスはModified MITで商用利用可能だ。
K2.7の最大の売りは効率性だ。前世代K2.6と比べて推論トークンの消費量を約30%削減した。同社独自ベンチマークでは、Kimi Code Bench v2で+21.8%(62.0 vs 50.9)、Program Benchで+11.0%、MLS Bench Liteで+31.5%の改善を示している(codersera.com)。
開発者コミュニティの評価は「リポジトリ全体を把握させてバグを修正・機能追加させる長時間エージェントタスク」でK2.7が優位という意見が多い。APIは入力$0.95/Mトークンから利用できる。
懸念点: 公開されているベンチマークはすべてMoonshot社独自のものだ。SWE-bench VerifiedやLiveCodeBenchといった公的第三者評価での検証はまだない(flowtivity.ai)。自社ベンチマークのみで「最高」を主張するパターンはDeepSeekを含む中国AIモデル全般で見られる傾向でもある。
GLM-5.2:GPT-5.5を1/6のコストで超えるという主張
Z.aiがGLM-5.2を公開したのは6月13日。前世代GLM-5.1の200Kから1Mトークンへのコンテキスト拡張(5倍)と、MITライセンスでの完全オープンウェイト公開が主な特徴だ(VentureBeat, 2026年6月)。
アーキテクチャ上の工夫として「IndexShare」を導入している。4層ごとに1つの軽量インデクサーを共有することで、1Mコンテキスト時のFLOPs(浮動小数点演算数)を2.9倍削減するという設計だ。
AIコーディングIDE Clineの初期テストでは「GLM-5.2はTerminal-Benchで初めて80%を超えたオープンウェイトモデル」と報告されており、Humanity’s Last Exam(ツール使用)では54.7点でGPT-5.5(52.2)を上回り、Claude Opus 4.8(57.9)に迫っている(aitoolly.com, 2026年6月14日)。APIはOpenRouter経由で入力$1.40/Mトークン、出力$4.40/Mトークンで利用できる(OpenRouter GLM-5.2)。
懸念点: GLM-5.2は発表時に公式ベンチマーク表を一切公開しなかった。「GLM-5.2がGPT-5.5を超えた」という主張の一部は第三者検証前のものだ。BridgeMind AIはX上で「3つのリアルなビルドでGLM-5.2をテストした」と投稿したが(X, @bridgemindai, 2026年6月15日)、独立した大規模評価はまだない。
どちらを選ぶか:用途別の使い分け
Medium連載でAIモデルを比較するMehul Guptaは「GLM-5.2が出た。Kimi K2.7はもう用なし」と書いたが(Medium, 2026年6月14日)、評価は単純ではない。
実際の開発タスクごとに優位性が分かれる:
| ユースケース | 推奨モデル |
|---|---|
| リポジトリ全体の把握・長時間バグ修正 | Kimi K2.7-Code |
| 100万トークン超の大規模コードベース一括読み込み | GLM-5.2 |
| ゼロからのアプリ生成(単発タスク) | GLM-5.2 |
| エージェント型ワークフローのトークンコスト削減 | Kimi K2.7-Code |
| ローカル実行(セルフホスト) | GLM-5.2(MIT) |
「一からアプリを作る生成タスクはGLM-5.2が強く、既存コードの理解と修正を繰り返すエージェントタスクはKimiの方がトークン効率が良い」という評価がコミュニティの現時点のコンセンサスだ(theplanettools.ai, 2026年6月)。
「中国AIの台頭」という文脈が持つ意味
Fable 5の停止理由として米政府が挙げたのは「中国系グループがMythos 5へのアクセスを取得した可能性」だった(Semafor, 2026年6月13日)。皮肉なことに、その規制の直後に中国企業2社が大型オープンソースモデルを投入した。
Kimi K2.7とGLM-5.2がどれだけ優秀であっても、日本企業や個人開発者がこれらを業務に採用する際には別の問いが生じる。Z.aiはZhipu AIの国際ブランドであり、Moonshot AIも中国資本の企業だ。中国のデータ安全法や国家情報法の対象になり得る点は、DeepSeekの普及時と同様の問いを提起する。
AIツールのコスト管理で課題を抱える企業にとっては(Uberが年間AI予算を4ヶ月で使い切った事例を参照)、GPT-5.5の1/6のコストは魅力的だ。ただし「安さ」と「データ主権」のトレードオフを組織として明確にしてから採用判断をするべきだ。
| Kimi K2.7-Code | GLM-5.2 | |
|---|---|---|
| 発表 | 2026年6月12日 | 2026年6月13日 |
| 総パラメータ | 1兆(MoE) | 744B(MoE) |
| 実行パラメータ | 32B | 40B |
| コンテキスト | 256K | 1M |
| ライセンス | Modified MIT | MIT |
| API入力価格 | $0.95/Mトークン | $1.40/Mトークン |
| 開発元 | Moonshot AI(中国) | Z.ai / Zhipu AI(中国) |
コーディングAIの選び方に悩む方は、エージェント型AIのコスト構造をまとめたガイドも参考に。また、DeepSeek V4-Proの値下げ競争と合わせて読むと、2026年のAIプライシング構造が見えてくる。
関連記事
- Claude Fable 5公開: SWE-Bench 80.3%の実力とガードレール論争
- JassyがBessentに電話した日|Amazon-Anthropic利益相反がFable 5を止めた構造
- DeepSeek V4-Pro 75%永久値下げ|GPT-5.5の34倍安いAIは使えるか
本記事の情報は2026年6月17日時点のものです。両モデルのベンチマーク数値は今後の独立評価で更新される可能性があります。APIの価格・提供条件は各社のウェブサイトでご確認ください。