ガバメントAI「源内」とは|OSS公開と国産LLM7選・18万人実証を解説【2026年版】
「2か月かかっていた分析作業が、AIを使って約3日に短縮された」。農林水産省が米の生産意向アンケート約8,000件(約30項目)をガバメントAI「源内」で分析した際の実績だ(出典:内閣官房・デジタル庁資料 2026年2月)。
一方で、静岡県湖西市のDX推進担当・岸大樹氏はnoteにこう記している。「源内そのものより、現場業務フローに合わせる『翻訳作業』のほうがよほど大変だった」(出典:note)。
政府が推進するAI活用の現場は、期待と現実のギャップに揺れている。2026年5月、全府省庁39機関・約18万人の政府職員を対象にした大規模実証が始まった。同年4月にはOSS化も果たし、民間企業や自治体も源内のコードを使えるようになった。
この記事では、源内の全容を技術・政策・活用の3軸で解剖する。
- ガバメントAI「源内」の実態と国産LLM7選の現実を知りたい行政・IT担当者
- 源内のOSSを活用した自治体向けサービス展開を検討している企業のエンジニア・PM
- 「AI主権」「国産LLM」という文脈が日本のビジネスにどう影響するか気になる方
源内の全容。何が作られたのか
源内(GENAI)は、デジタル庁が内製開発した政府職員専用の生成AI利用環境だ。正式名称は「Government AI」で、江戸時代の発明家・平賀源内から命名されている。
ChatGPTやClaudeと異なるのは、行政実務に特化したAIアプリが20種類以上最初から搭載されている点だ。汎用チャット(Chat)、文章生成、翻訳、画像生成、図形生成といった一般用途に加え、次のような行政専用アプリが揃う。
- 法令調査AI「Lawsy」: e-Gov法令APIと連携し、関連法令をRAG(大量文書を参照しながら回答を生成する技術)で横断検索
- 国会答弁検索AI: テーマ別に過去の答弁を横断検索し、答弁案作成を支援
- 公用文チェッカー: 公用文作成要領に準拠した文体・用字・用語の確認
- 会議録自動作成: Teamsの会議録を自動生成
これらは単なるラッパーではなく、行政データや省庁固有データと接続したRAGシステムとして設計されている。省庁・チーム単位でアクセス管理でき、機密性2情報(非公開の行政情報)にも対応する。
技術スタックはReact+TypeScriptのフロントエンド、AWS CDK(AWSのインフラ自動構築ツール)でデプロイするクラウドネイティブ構成、バックエンドにPythonを採用。ベースはAWSの公式OSSプロジェクト「Generative AI Use Cases(GenU)」だが、日本の行政要件向けに大幅に改修されており、現在はGenUとは独立して開発が続く(出典:GitHub - digital-go-jp/genai-web)。開発予算は令和7年度補正予算44億円(ガバメントAI整備事業)。
2026年4月OSS公開・5月から18万人実証
源内の歴史を時系列で整理する。
| 時期 | 出来事 |
|---|---|
| 2025年5月 | 源内運用開始(一部省庁での試験利用) |
| 2026年1月末 | 国産LLM公募締め切り(15件応募) |
| 2026年3月6日 | 国産LLM7モデル選定発表、国土交通省への展開開始 |
| 2026年4月24日 | GitHubでOSS公開(MITライセンス) |
| 2026年5月 | 全府省庁39機関・約18万人への大規模実証開始 |
| 2026年8月頃 | 源内内での国産LLM7モデル試用開始予定 |
| 2027年1月頃 | 実証評価結果の公表予定 |
| 2027年4月 | 優秀モデルの有償正式調達検討開始 |
OSS公開の意図についてinnovatopia.jpは「特定クラウド事業者に依存しない行政AI設計思想の実装」と評した(出典:innovatopia.jp)。
公開リポジトリは2つ。UIを担うdigital-go-jp/genai-webと、行政アプリ群のdigital-go-jp/genai-ai-apiだ。MITライセンスのため商用利用も可能だが、コードの一部(AWS Lambda・CDK関連)はAmazon Software License(ASL)が適用される点は注意が必要だ(出典:デジタル庁公式)。
タイムラインの出典:デジタル庁「今後のガバメントAI 源内の展開」(PDF、2026年3月)。2027年以降の予定はデジタル庁発表時点のものであり、変更される可能性がある。
選定された国産LLM7モデルの実力
2026年3月6日、デジタル庁は15件の応募から7モデルを選定した。選定基準は「機密性2情報を扱えること」「ガバメントクラウド上で推論できること」「日本語性能」の3軸だ。
| モデル | 開発元 | アプローチ | 特徴 |
|---|---|---|---|
| tsuzumi 2 | NTTデータ | スクラッチ開発 | 1GPU動作・軽量・低コスト |
| Llama-3.1-ELYZA-JP-70B | KDDI/ELYZA | Llamaベース日本語強化 | 70Bパラメータ・高性能 |
| Sarashina2 mini | ソフトバンク | スクラッチ開発 | 軽量・エッジ向け |
| cotomi v3 | NEC | スクラッチ開発 | 企業向け特化 |
| Takane 32B | 富士通 | ベースモデル改良 | 32Bパラメータ |
| PLaMo 2.0 Prime | Preferred Networks | スクラッチ開発 | 高精度・基礎研究重視 |
| CC Gov-LLM | カスタマークラウド | 行政特化ファインチューニング | 行政用語・法令対応 |
日本語性能の実態はどうか。Nejumi Leaderboard(2025年12月時点)ではGPT-5.2が国産モデルを約0.13ポイント上回るが、日本語特化ベンチマークでは国産モデルが健闘している。ELYZAは日本語MT-BenchでGPT-4・Claude 3 Sonnetを上回るスコアを記録(出典:AI Career Japan)。
特筆すべきはtsuzumi 2の軽量性だ。通常、高性能LLMは数十〜数百GPUを要するが、tsuzumi 2は1GPUで動作する。オンプレミス導入のコストを大幅に下げられ、地方自治体や中小企業にとって現実的な選択肢になりうる(出典:フィデックス株式会社)。
一方でPLaMo 2.0 PrimeはNTT tsuzumiと同じくゼロからのスクラッチ開発だ。「GPT依存からの脱却」を明確に打ち出し、日本発のAI主権確立を目標に据える(出典:note/Cursorvers)。
実証で明らかになった課題と懸念点
「2か月が3日に」という国土交通省の成果は本物だ。しかし、源内をめぐる課題も着実に浮かび上がっている。
技術的ハードル
源内のOSSを自前でデプロイするには相応の技術力が必要だ。AWSアカウントの契約・CDK(インフラ自動構築ツール)の設定・SAML認証(シングルサインオン規格)の設定が必要で、担当エンジニアがいない小規模自治体には高いハードルだ。デジタル庁はPRを受け付けず、致命的バグのみIssue受付という「閉じたOSS」運用を採る点も、外部エンジニアによる改善提案が入りにくい構造を生む。
「翻訳問題」
湖西市の岸氏が指摘した「翻訳作業」の重さは本質的な問題だ。中央省庁向けに最適化されたシステムを地方自治体の業務フローに合わせる工数は、ツールそのものの導入コストより大きくなりやすい。innovatopia.jpの分析によれば、この翻訳作業を担うベンダー主導のSIビジネスが自治体AI市場で台頭しつつある(出典:innovatopia.jp)。
ハルシネーションと情報セキュリティ
実証報告ではハルシネーション(誤情報生成)と処理可能な文章量の限界が課題として明記されている。行政判断にLLM出力をどこまで使うか、責任の所在をどう定めるかは整備途上だ。
構造問題は解消されるのか
経済学者・野口悠紀雄氏は現代ビジネスでこう批評した。「国会答弁の作業が過酷になる原因は答弁を書く作業そのものではなく、質問通告の遅れや部局間調整に伴う長時間の”待ち”にある。AIという道具を導入しても、制度と運用が改まらなければ問題の本質は解決しない」(出典:現代ビジネス)。
実際、デジタル庁の利用実績データによれば、2025年5〜7月の3か月で登録者1,200人中950人(約8割)が利用した一方、5回未満の利用者が170人いる一方、100回以上活用した職員も150人以上存在した。積極利用者と低利用者の格差は、ツールではなく組織文化の問題を映している。ソースコード公開による脆弱性のリスクも否定できず、セキュリティ専門家の監査コストは別途かかる。
本記事の情報は2026年5月28日時点のものです。源内の機能・対応モデル・スケジュールは変更される場合があります。導入を検討される際は、デジタル庁の公式情報を必ずご確認ください。
自治体・企業はどう活用するか
源内のOSSは今すぐGitHubから入手できる。しかし「ダウンロードして即活用」は幻想だ。現実的な3つのアプローチを整理する。
1. ベンダー経由での導入(小規模自治体・中小企業向け) 源内OSSをベースにしたSI各社のカスタマイズサービスを利用する。技術負担がなく、デジタル庁の標準仕様に準拠した環境を短期間で構築できる。コスト感は2026年現在、月数十万円のSaaS型から数百万円のオンプレミス構築まで幅がある(価格は事業者・仕様・契約条件によって異なり、今後変更される場合があります。最新料金は各事業者にご確認ください)。
2. エンジニア内製での自己デプロイ(技術力のある組織向け)
genai-webとgenai-ai-apiをクローンし、AWS上に自前でデプロイする。法令調査AIのテンプレート(Google Cloud版、AWS版、Azure版)が公開されているので、RAGシステムの開発ベースとして活用できる。ChatGPT/Claudeではなく国産LLMを組み込みたい場合の出発点にもなる。
3. 国産LLMのAPI活用(AIサービス開発者向け) 選定された7モデルのうちいくつかは外部APIも提供している。行政・法令・医療など日本語コーパスが重要な領域では、汎用の海外モデルより国産モデルが優れる場面がある。2027年4月からは政府が有償正式調達を検討する予定であり、国産LLMの市場が育つ可能性がある(デジタル庁の予定であり、変更される場合があります)。
源内のGitHubリポジトリを確認する
UIコード(genai-web)とAIアプリ(genai-ai-api)の2リポジトリが公開中。MITライセンスで商用利用も可能。
海外政府AIとの比較
日本の源内は世界の政府AIの中でどう位置づけられるか。
| 国 | システム | 特徴 |
|---|---|---|
| 日本 | 源内(GENAI) | 行政特化アプリ20種以上・国産LLM7種・OSS |
| 米国 | USAi(GSA) | GPT-4o・Gemini・Claudeなど6種・20機関以上に展開済み |
| 英国 | i.AI ツール群 | Redbox(文書要約RAG)・Consult(意見分析)等をOSSで公開 |
米国はChatGPT・ClaudeといったAI大手をそのまま使う方針であり、国産モデルへのこだわりはない。英国は個別用途のOSSツールを積み上げる実用主義だ。日本の源内は「国産LLMの育成・社会実装の起点」という政策目標を持つ点で独自色が強い(出典:デジタル庁公式)。
これはビジネスチャンスでもある。2027年4月に政府が国産LLMを有償調達し始めれば、選定7モデルは実証データを持つ「政府認定AI」として民間市場でも競争力を持つ可能性がある(デジタル庁の予定であり変更される場合があります)。
関連記事
- Claude Code Routines完全ガイド|ノートPC閉じても動く自動化
- バイブコーディング入門|AIに”雰囲気”で指示する開発手法の光と影
- 富士通がAnthropicのClaudeを国内重要インフラに展開
本記事に掲載した情報は公開資料・報道・GitHubリポジトリをもとに執筆しています。源内のスケジュール・機能・対応モデルは2026年5月28日時点のものであり、今後変更される可能性があります。導入・活用を検討する際はデジタル庁の公式発表を必ず参照してください。本記事の情報をもとにした判断・行動・損害について、当メディアは一切の責任を負いません。