MAI-Thinking-1はいつからどこで使えますか？

MAI-Thinking-1はMicrosoft Foundryのプライベートプレビューとして2026年6月2日から提供されています。一般向けの提供時期は未発表です。MAI-Code-1-FlashはGitHub Copilot Free・Pro・Pro+・Maxユーザー向けに段階的なロールアウトが始まっています。

MAI-Thinking-1はClaude Sonnet 4.6より本当に優れていますか？

Microsoftが実施した独立した盲目評価（Surge社経由）では、人間の評価者がMAI-Thinking-1をClaude Sonnet 4.6より優れていると評価しました。ただし、評価条件や用途によって結果は異なります。SWE-Bench ProではClaude Opus 4.6と同水準のスコアを記録しています。

「OpenAIデータなし」とはどういう意味ですか？

MAI-Thinking-1はOpenAIのモデルからの知識蒸留（ディスティレーション）を使わず、商用ライセンス済みの独自データのみでゼロから訓練されました。これによりMicrosoftはOpenAIへのライセンス依存なく、独立してモデルの改良・展開が可能になりました。

MAI-Code-1-FlashとClaude Haiku 4.5の違いは何ですか？

SWE-Bench Proでは51.2%対35.2%でMAI-Code-1-Flashが16ポイント上回っています。またMAI-Code-1-Flashは同等の問題を解くのに最大60%少ないトークンを消費します。価格面でもClaude Haiku 4.5より安価に設定されています。

AI News 2026年6月4日 17分で読める

MAI-Thinking-1完全ガイド｜OpenAI依存を脱却したMicrosoftのAI戦略と開発者への影響

#Microsoft #MAI-Thinking-1 #MAI-Code-1-Flash #GitHub Copilot #OpenAI #Claude #AI開発ツール #Microsoft Build 2026

この記事はこんな人におすすめ

GitHub CopilotやCursor等のAIコーディングツールを日常的に使う開発者
Microsoftの自社AIモデル戦略とOpenAIとの関係に関心があるエンジニア・PM
Claude、GPT等の主要モデルの性能比較を追っているAI研究者・ビジネスパーソン

「MicrosoftがいくつかのMAIモデルを出した。MAI-Code-1-FlashはClaude Haiku 4.5と似た位置づけで、価格はHaikuより安い。MAI-Thinking-1はClaude Sonnet 4.6に近い」。2026年6月2日、開発者のWes Bosはこう書いた（X, 2026年6月2日）。

Microsoft Build 2026の基調講演で、MicrosoftのCEOサティア・ナデラは宣言した。「フロンティアモデルを消費する時代から、フロンティアに完全参加する時代へ」。7つのMAIモデルを一気に投入し、MicrosoftはAI業界の力学を塗り替えようとしている。

中でも注目を集めたのが「MAI-Thinking-1」と「MAI-Code-1-Flash」だ。OpenAIからのデータ蒸留を一切使わず、商用ライセンス済みのクリーンなデータのみでゼロから訓練された。独立した盲目評価ではMAI-Thinking-1がClaude Sonnet 4.6を上回り、MAI-Code-1-FlashはClaude Haiku 4.5をすべての主要コーディングベンチマークで超えた（Microsoft AI公式, 2026年6月2日）。

しかし発表タイミングには複雑な事情がある。MAIモデル公表の前日、6月1日にGitHub Copilotはトークン課金制に完全移行し、開発者コミュニティに衝撃が走っていた。

MicrosoftのOpenAI依存、何が問題だったのか

MicrosoftはOpenAIに約130億ドルを投資し、Azure経由でOpenAIモデルを独占提供する契約を結んでいる。GitHub CopilotはGPT-4シリーズで動作してきた。この構造は「AIの波に乗る」という観点では機能したが、2025年以降、ひずみが顕在化してきた。

コスト面での問題は深刻だ。OpenAIへのAPI依存が続く限り、Microsoftはトークン単位でOpenAIに費用を支払い続けなければならない。自社クラウドで動かすには、OpenAIのライセンス条件に縛られる。モデルの改良スピードもOpenAIのリリース計画に依存する。

技術的な独立性も問われた。Anthropic、Google DeepMind、Metaはいずれも独自のフロンティアモデルを持つ。「AIのOSを握る」というMicrosoftの戦略目標のためには、モデル開発の内製化が不可欠だった。

マイクロソフトAI部門（MAI）のトップを務めるムスタファ・スレイマンはX上でこう述べた。「本日、7つの世界水準のMAIモデルを発表できることを光栄に思う。これらはAIの新時代を体現するものだ。常にあなたが主導権を持てるよう設計されている」（Mustafa Suleyman, X, 2026年6月2日）。

MAI-Thinking-1：Claudeを超えたと主張する推論モデルの実態

MAI-Thinking-1は350億のアクティブパラメーターを持つスパースなMixture of Experts（MoE）アーキテクチャを採用している。総パラメーター数は約1兆と推定される。コンテキストウィンドウは256Kトークン（Microsoft AI, MAI-Thinking-1モデルページ）。

訓練データはすべて商用ライセンス済みで、OpenAIモデルからの蒸留は使用していない。また合成データも使わない、という点でも独自路線を取った。「ゼロから自力で登る」というコンセプトを「ヒルクライミングマシン」と表現している（Microsoft AI公式ブログ, 2026年6月2日）。

ベンチマーク上の成績は以下の通りだ。

AIME 2025：97.0%（数学オリンピックレベルの難問）
AIME 2026：94.5%
SWE-Bench Pro：Claude Opus 4.6と同水準
盲目評価：Surge社の人間評価者がClaude Sonnet 4.6よりMAI-Thinking-1を優先選択

この盲目評価の結果は注目に値する。評価者はどちらのモデルが生成したかを知らない状態で、シングルターンおよびマルチターンの各タスクにおいてMAI-Thinking-1の回答を優先した（Microsoft AI公式発表）。評価はMicrosoft傘下の評価機関Surge社が実施したもので、独立した第三者機関による検証ではない点は押さえておくべきだ。

研究者コミュニティからは109ページに及ぶ技術レポートへの称賛が相次いだ。「このスケールのモデルとしては最も透明性の高い技術レポートの一つ。LLM訓練の現代的教科書として使えるレベル」（@nrehiew_, X, 2026年6月2日）。開発者の@eliebakouch も「WOW、新しいMAI Thinking 1モデルには109ページの詳細な技術レポートが付いている。これは素晴らしい」と述べた（X, 2026年6月2日）。

ただし、注意点もある。モデルは発表時点でプライベートプレビューのみ。「試せないのが残念」というのが多くの開発者の第一声だった（@altryne, X, 2026年6月2日）。ベンチマークと実使用感の差を自分で確かめることは、まだできない状況だ。

MAI-Code-1-Flash：GitHub Copilotに入る5Bの小型モデル

MAI-Code-1-FlashはMAI-Thinking-1の中間訓練チェックポイントを起点に開発された50億パラメーターの小型コーディングモデルだ。GitHub Copilotのワークフロー向けに特化して設計されており、訓練データは実際の開発者インタラクションのパターンを忠実に再現したものが使われた（Microsoft AI, MAI-Code-1-Flashモデルページ）。

コーディング性能の比較は明快だ。

ベンチマーク	MAI-Code-1-Flash	Claude Haiku 4.5
SWE-Bench Pro	51.2%	35.2%
SWE-Bench Multilingual	上回る	—
Terminal Bench 2	上回る	—
トークン効率	最大60%削減	基準

GitHub Copilot担当のBurke Holland氏はX上で「SWE-Bench Proで51.2%。今すぐCopilot Free・Pro・Pro+・Maxユーザーへのロールアウトを開始」と発表した（Burke Holland, X, 2026年6月2日）。

価格面ではWes Bosが指摘した通り「Claude Haiku 4.5より安価、Cursor Composer 2.5より高価」という位置づけになっている。インライン補完の遅延を最小化するため、小型化されたアーキテクチャは理にかなっている。

Copilotのトークン課金問題との微妙な関係

MAI-Code-1-Flashの発表は絶妙なタイミングで行われた。6月1日、GitHub CopilotはトークンベースのAIクレジット課金に完全移行した。その翌日、Build 2026が開幕してMAIモデルが発表された。

Copilotのトークン課金移行は開発者コミュニティを揺るがした。公式コミュニティスレッドは904ダウンボート対22アップボート、435コメントという歴史的な拒絶反応を示した。Redditのあるユーザーは「月29ドルだったのが750ドルになる」と試算し、別のユーザーは「月50ドルが3,000ドルになりかねない」と書いた（gHacks Tech News, 2026年6月2日）。

「MAI-Code-1-Flashはトークン効率が60%高い」という数字は、この文脈で再評価すべき情報だ。トークン課金時代に、同じ問題を解くために消費するトークンが少なければ、単純に請求額が下がる。Copilotの料金上昇への回答として、MAI-Code-1-Flashを位置づけることができる。

ただし、トークン課金を導入したのもMicrosoftだ。「コスト削減モデルを出す前に、課金を上げた」という批判は避けられない。TechCrunchは「Copilotの黄金時代の終わり」と表現し、乗り換え先としてClaude ProやDeepSeek V4 Proを挙げた（TechCrunch, 2026年5月30日）。

日本の開発者への実際の影響

GitHub Copilotを使う日本の開発者にとって、MAIモデルの登場は次の変化をもたらす。

即時に確認できる変化: MAI-Code-1-FlashはGitHub Copilot Free・Pro・Pro+・Maxのモデルピッカーに段階的に追加されつつある。自動ピッカーにも組み込まれるため、設定を変えなくてもMAI-Code-1-Flashが使われる場面が出てくる。性能はClaude Haiku 4.5を上回ると公式は主張している。

当面変わらない点: MAI-Thinking-1はプライベートプレビューのため、一般開発者がすぐ試せるわけではない。Azure AI Foundry経由で企業向けに順次開放される見通しだ。

乗り換えを検討するなら: トークン課金で費用が急増した開発者は、Claude Code（Anthropicのツールのトークン課金と性質が異なる）やCursor等の代替も選択肢に入る。Uberが2026年分のAI予算を4ヶ月で使い切った問題は、ツールの選定だけでは解決しない構造的な問題でもある。

MAIモデルの「OpenAI依存脱却」が日本のGitHub Copilotユーザーにとって直接的なコスト削減になるかどうかは、今後数週間のロールアウト状況次第だ。SWE-Bench Proの数字は明快だが、日本語コード補完や実際の開発フローでの評価は、ユーザー自身が検証する必要がある。

MAI-Thinking-1 vs MAI-Code-1-Flash スペック比較

項目	MAI-Thinking-1	MAI-Code-1-Flash
パラメーター	35Bアクティブ（~1T総）	5B
アーキテクチャ	Sparse MoE	通常型
コンテキスト	256K	—
AIME 2025	97.0%	—
SWE-Bench Pro	Claude Opus 4.6並み	51.2%（Haiku 4.5比+16pt）
用途	推論・複雑タスク	コード補完・Copilot
提供先	Azure Foundry（プレビュー）	GitHub Copilot（展開中）
OpenAI蒸留	なし	なし

GitHub CopilotのAI費用が増えた開発者へ

MAI-Code-1-Flashの登場でCopilotの実コストがどう変わるか、まだ見えない部分も多い。Claude Codeの予算管理や、企業のAI費用構造を整理した記事も参考にしてほしい。

Uber AI予算崩壊の全貌を読む

本記事に記載された性能比較・ベンチマーク数値はMicrosoft公式発表（2026年6月2日）および各出典に基づく。MAI-Thinking-1はプライベートプレビュー段階であり、提供条件や仕様は予告なく変更される場合がある。