「無償試用」から「政府調達」へ——この転換が示す本質的な意味
新しいシステムを導入するとき、最初は「とりあえず試してみる」段階があり、その後に本格的な契約へ移行するのは珍しくない。ただ、政府のAI活用においてこの移行が起きるとき、それは単なる契約形態の変更ではない。「試験的な取り組み」という免責が外れ、国民の税金を使った正式な調達として説明責任が問われる段階に入ることを意味する。デジタル庁が進めるAIアシスタント「源内」向けの国産LLM(大規模言語モデル)再公募は、まさにその転換点にある。
源内向けLLM再公募の内容——調達条件と評価基準の変化
デジタル庁は、行政業務支援AIアシスタント「源内」に活用する国産LLMについて、2027年度向けの再公募を実施する。初回の公募は無償での試用提供を前提とした募集だったが、今回の公募では政府調達、すなわち有償での契約に移行する。
また、評価に使うテスト問題数が大きく変わる。初回公募では50問だった評価テストが、今回は300問へと6倍に拡張される。評価の精度と厳密さを高める狙いがある。LLMとは、大量のテキストデータを学習して文章を生成・理解する人工知能の基盤技術で、ChatGPTなどに代表されるシステムの核心部分にあたる。
国産LLM調達を目指す企業と、行政DXの担当者にとって何が変わるのか
直接的な影響を受けるのは、国産LLMを開発・提供している企業だ。無償試用という前提がなくなり、有償の政府調達として正式に評価される以上、品質・信頼性・サポート体制において民間商用サービスとして通用する水準が求められる。評価テストが300問に増えることは、より多角的な性能検証にさらされることを意味し、特定の得意分野だけで高評価を取ることが難しくなる。
行政側、つまりデジタル庁や将来的に「源内」を活用する各府省の担当者にとっては、調達コストが発生する代わりに、ベンダーに対して継続的な品質維持や契約上の責任を求められる立場になる。試用段階では「うまくいかなくても仕方ない」という余地があったが、有償調達後はその余地が大幅に狭まる。
「源内」の国産LLM路線は日本の行政AI戦略でどう位置づけられるか
「源内」が国産LLMを採用しようとしている背景には、データの取り扱いや安全保障上の観点から、海外製LLMへの依存を減らしたいという政策的な意図がある。日本語処理の精度、行政特有の用語・文書形式への対応、そして情報管理の観点で、国産モデルへの期待は高い。
ただし、有償調達への移行は日本の行政システム調達の文脈では重要な節目だ。予算計上・契約手続き・調達の透明性確保といった行政固有のプロセスが本格的に動き始めることになり、LLMの技術品質だけでなく、ベンダーとしての調達対応能力も問われることになる。
300問評価と有償調達、現時点で見えていないリスク
再公募の詳細な仕様や、評価300問の具体的な内容・分野構成については、現時点では明らかになっていない部分が多い。評価基準の設計次第で、どのタイプの国産LLMが優位になるかは大きく変わりうる。
また、有償化によって調達金額の規模感や契約期間がどう設定されるかも、応募企業の参入判断に直結する。初回の無償試用公募に応じた企業が次回も応募するとは限らず、競争環境がどう変化するかも不透明だ。行政向けAI調達として本格稼働する前に、これらの条件が具体的に示されるタイミングを確認する必要がある。
「試用」が終わった今、問われるのは調達設計の妥当性だ
無償試用から有償調達への移行は、一見すると「本格化」を示すポジティブなシグナルに見える。だが、重要なのはその移行が適切な評価設計と透明な調達プロセスを伴っているかどうかだ。評価テストを50問から300問に増やすこと自体は評価精度の向上につながりうるが、その300問が行政実務の実態を反映しているかどうかは別の話になる。
国産LLMの育成という政策目標と、税金を使う調達として最善の選択をするという責任は、時に緊張関係を生む。「源内」のLLM調達を見る際の軸は、国産かどうかという属性ではなく、調達の設計が説明可能な合理性を持っているかどうかに置くべきだろう。
本記事は公開情報をもとに、NEWGATA編集部で確認のうえ掲載しています。
参照元
- ITmedia AI+ — デジタル庁、AI「源内」向け国産LLM再公募 有償の政府調達へ 評価テストは50問→300問に(2026-05-29)

コメント