メインコンテンツへスキップ
AI News 14分で読める

Google Project Mariner 終了|AIウェブエージェントが失敗した4つの理由【2026年5月】

「フォーム入力を頼んだら3分待たされ、最後にCAPTCHAで詰まった」。Project Marinerを試したユーザーが残したレビューだ(Slashdot, 2025)。「スクリーンショットを撮って、ボタンの位置を推定して、クリック。この繰り返しが遅すぎる。2025年のAIではなく2015年のRPAの劣化版だ」という指摘もあった。

それでも当時、Google AIの目玉実験として注目を集めたProject Mariner。2026年5月4日、Googleはその幕を静かに閉じた。プレスリリースも公式ブログ投稿もなし。ランディングページのサービス終了告知だけが残された。

この記事はこんな人におすすめ
  • AIエージェントの最新動向を追いかけているエンジニアやプロダクトマネージャー
  • ブラウザ自動化ツールの選定を検討している開発者・IT担当者
  • Google・OpenAI・Anthropicのエージェント戦略の違いを理解したい方

Project Marinerとは何だったのか

Project Marinerは、Google DeepMindが2024年12月に発表した実験的なAIウェブエージェントだ。正式な一般向けロールアウトは2025年のGoogle I/O(5月20〜21日)で、米国のGoogle AI Ultraサブスクライバー(月額249.99ドル)向けに限定提供された。

動作の仕組みはシンプルに見えた。ユーザーがChromeブラウザを開いたまま「Expediaで東京—ソウル往復の最安値を探して予約して」と指示する。するとMarinerがChromeの画面をスクリーンショットで読み取り、ボタンの位置を認識し、クリックや入力を代行する。Google DeepMindはこれを「Observe(観察)・Plan(計画)・Act(実行)」ループと呼んだ。Gemini 2.0によるマルチモーダル理解、「Teach & Repeat」(ユーザーが手順を教えると次回以降は自動化)といった機能も備えていた(Google DeepMind)。

構想は野心的だった。「人間がブラウザでやることをすべてAIが代行する」。その夢を17ヶ月かけて追ったのがProject Marinerだ。

なぜ失敗したのか:4つの構造的欠陥

欠陥1:速度の壁

最大の問題はパフォーマンスだった。DataCampが実施した実地テストでは、1回のカーソル移動に平均約5秒の遅延が発生。「フォームに10項目入力するだけで8分かかった」というレポートが残っている(DataCamp, 2026)。人間なら30秒の作業だ。

根本原因はアーキテクチャにある。スクリーンショットを撮る、Geminiに画像を送る、指示を受け取る、次のアクションを実行する——この4ステップを毎回繰り返す視覚処理型の設計は、計算コストが高く、並列化も難しい。

欠陥2:ボット対策の壁

現代のWebはボットを想定して設計されている。CloudflareのTurnstile、GoogleのreCAPTCHAは、人間らしくない操作パターンを検出してブロックする。MarinerはChromeの実ブラウザを操作しているにもかかわらず、その機械的な動き方がボット判定される事例が頻発した。

AIAgentDirectoryのレビュー(2025年)では「人気のeコマースサイトの半数以上でブロックされた」という報告が複数あった(AIAgentDirectory)。ショッピング代行という主力ユースケースでこれが起きては、実用性は極めて限定的だ。

欠陥3:意思決定ロジックの貧困

「東京—成田で安い便を探して」と指示した場合、Marinerは検索結果に表示された順番に1社ずつ確認し、最初に条件を満たした選択肢を選んだ。価格比較や複数軸の評価を並行して行う、人間が自然にやるような意思決定が苦手だった(DataCamp)。

エージェントが「与えられた選択肢の中から最初に条件を満たすものを選ぶ」という線形戦略しか取れないのは、スクリーンショットを一枚ずつ処理するアーキテクチャの必然的な帰結だ。

欠陥4:普及しないまま終わった

17ヶ月の実験期間を通じて、Project Marinerは米国のAI Ultraサブスクライバー(月額249.99ドル)に限定提供された状態で終わった。価格ハードルが高いだけでなく、米国外では一切利用できなかった。Wiredは2026年3月の報道で「Googleがすでにプロジェクトマリナーのチームから人員を他部署へ異動させ始めている」と伝えており(出典: Android Authority)、終了はその2ヶ月後に実行された。

Googleの対処:Gemini AgentとChrome Auto Browse

Project Marinerは終わったが、技術は生き残っている。Googleは2つのルートで吸収した。

Gemini Agentは、Geminiアシスタントの「タスク自動化レイヤー」だ。メールのアーカイブ、ホテルの予約、カレンダーの調整といった繰り返しタスクを担う。Project Marinerとの最大の違いは、GoogleのサービスAPIと直接統合している点だ。Gmailのメールをアーカイブするのに「Gmailのスクリーンショットを撮って、ボタン位置を推定して」という手順は不要で、GmailのAPIを直接叩く。速い、安い、確実だ(AndroidHeadlines)。

Chrome Auto Browseは2026年初頭にChromeへロールアウトされた機能で、ブラウザレベルでのWebフロー自動化を提供する。こちらは引き続き視覚処理を使うが、Marinerのような独立した拡張機能ではなく、Chromeのネイティブ機能として動作する設計だ。現時点でAI Pro/Ultraプランの米国ユーザー向けの提供となっている(TechCrunch, 2026)。

AIエージェント業界の転換点

Project Marinerの失敗は、業界全体の方向転換を象徴している。Startup Fortuneはこの動きを「ブラウザの混乱からワークフロー統合へのピボット」と表現した(Startup Fortune)。

視覚ベースのブラウザエージェントには根本的な制約がある。

アプローチ速度対ボット対策コスト汎用性
スクリーンショット型(旧Mariner)遅い弱い高い高い
API連携型(Gemini Agent)速い問題なし低い限定的
コードエージェント型(Claude Code, Codex)速い問題なし非常に高い

現在の主流は、コードやAPIを直接操作するエージェントだ。OpenAI Codex、Claude Code、Google Julesといったコーディングエージェントは、「画面を見る」のではなく「コードを書いて実行する」アプローチを取る。これらは速く、確実で、複雑な多段階タスクに強い。

競合比較:Operator、Computer Use、そしてMariner

Project Mariner終了の文脈で、残存する競合ツールとの違いも整理しておきたい。

OpenAI Operatorは、OpenAIのサーバー上で動く専用ブラウザウィンドウを通じてタスクを実行する。視覚処理という点ではMarinerに近いが、Googleのエコシステム内ではなくWeb全体を対象にできる点が異なる。ChatGPT Proプラン(月額200ドル)が必要だ(Digital Trends)。

Anthropic Computer Use(Claude経由)は、APIレベルでPCのスクリーンを制御できる。Operatorがブラウザ限定なのに対し、ネイティブアプリも操作できる汎用性の高さがある。コーディングタスクでの性能も評価されている(WorkOS)。

MarinerはこれらよりもGoogleのエコシステムに特化し、Geminiのマルチモーダル能力を活かした設計だったが、「Googleサービス以外のWebを自動化する」という目標と「スクリーンショット処理の遅さ」の矛盾を最後まで解消できなかった。

Google I/O 2026とAIエージェントの今後

Google I/O 2026は2026年5月19〜20日に開催予定。Gemini 4の発表、Aluminum OS(Android/ChromeOS統合)、Android XRグラスのプレビューが見込まれている。Project Marinerの後継となるGemini Agentの機能拡張発表も注目ポイントだ。詳細はGoogle I/O 2026 プレビュー記事を参照。

AIエージェントの実力比較が気になるなら、Claude CodeとCodexの徹底比較も参照してほしい。コードエージェント時代の選び方を整理している。

詳しく見る

関連記事


本記事の情報は2026年5月18日時点のものです。サービス内容・料金・提供地域は予告なく変更される場合があります。

Share