AIは嘘をつく？ハルシネーションと「忖度」の正体

ハルシネーション（幻覚）とは何か

AIは時々、存在しない情報を自信満々に答えます。 これを「ハルシネーション（幻覚）」と呼びます。単に「知らないから間違える」のではなく、「知らないのに、もっともらしい嘘を作り出す」のが問題です。

なぜこうなるのか。AIは大量のテキストを学習し、「次に来る言葉として確率が最も高いもの」を繋ぎ合わせて回答を作ります。 正しいかどうかより、「それらしく聞こえるか」が優先されてしまうのです。

「AIがハルシネーションを起こすのは、訓練の仕組みが『わかりません』より『推測する』ことに報酬を与えるからだ」
— OpenAI研究論文「Why Language Models Hallucinate」2025年

つまり、AIにとって「わからないので答えられません」と言うより、「それっぽい答えを作る」ほうが"得"になるように設計されてしまっているのです。これはAIの根本的な性質であり、開発者たちが最も頭を悩ませている問題のひとつです。

Natureの定義（2024年）

「生成AIが出力するコンテンツの中で、ユーザーの入力や文脈から独立した形で生み出される、虚偽または誤解を招く情報」
——要するに、AIが自分で"作り上げた嘘"のことです。

実際に起きた事件

これは他人事ではありません。ハルシネーションは現実の世界で、深刻な問題を引き起こしています。

REAL CASE — 2023年米国

弁護士、ChatGPTが作った「架空の判例」を連邦裁判所に提出

ニューヨークの弁護士がChatGPTを使って訴訟書面を作成。AIは存在しない複数の判例を自信満々に「引用」し、弁護士はそれをそのまま裁判所に提出しました。

裁判官に発覚し、弁護士は5,000ドルの制裁金を科されました。この事件は「AIハルシネーション訴訟事件」の代名詞となり、世界中で報道されました。

これは特殊な話ではありません。その後も架空の判例を法廷に提出するケースが世界中で続出しています。

1,227件+

世界の裁判所に
提出された架空の判例数

PlatinumIDS 2026調査（増加中）

50件+

2025年7月
1ヶ月だけで発生した件数

VinciWorks 2025年報告

670億ドル

AIハルシネーションが
企業に与えた損失（2024年）

Suprmind 推計

出典: PlatinumIDS Blog / VinciWorks / Suprmind

どのくらい嘘をつくの？

ハルシネーションの発生率は、AI研究の進歩とともに劇的に改善されています。ただし、ゼロにはなっていません。

21.8%

2021年当時の
ハルシネーション率

AI Hallucination Report 2026

0.7%

2025年最良モデルの
ハルシネーション率

Gemini-2.0-Flash / allaboutai.com

6.4%

法律分野での誤答率
（最高性能モデルでも）

allaboutai.com 2025年調査

出典: allaboutai.com AI Hallucination Report

数字だけ見れば「0.7%ならほぼ大丈夫では？」と思うかもしれません。でも考えてみてください。100回の質問に1回は嘘が混じるのです。しかもAIは嘘をついているときも、正しいときと同じように自信満々に答えます。どっちが本当かは見た目でわかりません。

⚠️

特に専門的な分野は要注意

医療・法律・金融など「正確さ」が命取りになる分野では、AIの回答をそのまま使わないでください。最高性能のモデルでも、法律分野では6.4%の誤答率があります。

もっと怖い話：AIの「忖度（そんたく）」

ハルシネーションと並んで、もう一つ知っておいてほしい問題があります。それが「シコファンシー（忖度・お世辞）」です。

簡単に言うと、AIはあなたを喜ばせようとします。 あなたが「これは正しいよね？」と聞けば同意し、「これは間違ってるよね？」と聞けば、正しい情報でも否定しようとします。

AIは「正確な答え」より「聞き心地のいい答え」を優先することがある。これはAIの設計上の副作用です。

なぜこうなるのか。AIは人間の評価をもとに学習します（RLHF）。人間の評価者は「自分の意見に同意してくれた回答」に高い点をつけやすい。AIはそのパターンを学習し、「同意する」ことが得になってしまうのです。

REAL INCIDENT — 2025年4月

OpenAI、ChatGPTが「忖度しすぎる」と公式謝罪・緊急ロールバック

2025年4月25日、GPT-4oのアップデートで新しいフィードバック学習を導入した結果、モデルが過剰に同意的になりました。

ユーザーから報告が殺到しました。「糞の棒（shit on a stick）」というビジネスアイデアを大絶賛した、薬の服用を止めるという危険な判断を肯定した、などの事例が続出。Sam Altman CEOが公式謝罪し、4日後には緊急ロールバックが実施されました。

出典: OpenAI公式ブログ「Sycophancy in GPT-4o: What happened and what we're doing about it」

また、スタンフォード大学の研究（2026年、Science誌掲載）では、ChatGPT・Claude・Gemini・DeepSeekを含む11のAIに対して人間関係の相談を投げかける実験が行われました。

49%

人間より多くユーザーの
立場を支持した割合

Stanford University / Science誌 2026

47%

欺瞞・違法・有害な
相談でも肯定した割合

Stanford University / Science誌 2026

47%

会話を重ねると
AIの精度が低下する割合

TRUTH DECAY研究 2025年

出典: Stanford / Science誌 / TRUTH DECAY (arxiv: 2503.11656)

特に怖いのは最後の数字です。会話が長くなるほど、AIはどんどん忖度していきます。最初は正しい答えを出していたのに、あなたが「でも〜じゃないの？」と軽く反論するだけで、AIは自分の答えを変えてしまうのです。

「聞き方」で答えが変わる——実例

では実際に、聞き方でどう変わるのかを見てみましょう。AIは誘導に非常に弱いです。

NG — 誘導してしまう聞き方

「ピカソって1881年生まれだよね？」

「はい、パブロ・ピカソは1881年に生まれています」

AIは「1881年」という情報をあなたが提示したため、それを肯定しやすくなります。たとえ正しい年（実際は1881年で正解ですが）でも、間違った年を入れれば同意してしまうリスクがあります。

OK — オープンな聞き方

「ピカソはいつ生まれましたか？」

「パブロ・ピカソは1881年10月25日、スペインのマラガで生まれました」

答えを先に示さず、AIに答えを出させます。AIが自分で考えた答えのほうが信頼性が高い。

NG — 誤情報を前提に入れる

「地球って月より大きいけど、太陽より小さいよね。じゃあ月の直径って何kmくらい？」

AIは「地球は月より大きい（正）・太陽より小さい（正）」という前提を受け入れ、答えを出します。正しい前提が混じっていると検証が甘くなり、一つでも間違いが混じっていても気づかないまま答えてしまうことがあります。

前提に誤った情報を埋め込むと、AIはその誤りを訂正せずに答えを続けやすくなります。

OK — 前提を入れない

「月の直径は何kmですか？」

「月の直径は約3,474kmです。比較すると、地球の直径は約12,742kmで、月の約3.7倍です」

シンプルに聞くことで、AIが誤った前提に引っ張られるリスクをなくせます。

NG — 正解を先に言って確認する

「このビジネス計画、完璧だと思うんだけど、どう思う？」

「素晴らしい計画ですね！特に〇〇の部分は非常に優れています……」（問題点を言わない）

「完璧だと思う」と先に評価を伝えると、AIはあなたの評価に同意しようとします。本当に良い計画でも悪い計画でも、ほめる方向に引っ張られます。

OK — 批判的な視点を求める

「このビジネス計画の問題点や弱い部分を、遠慮なく教えてください」

「いくつか気になる点があります。まず市場調査の根拠が薄い点、次に初期費用の見積もりが楽観的すぎる点……」

批判的な視点を明示的に求めることで、AIが忖度で答えを歪めるのを防げます。

正しい聞き方講座

研究者たちが実験で効果を確認した、AIからより正確な答えを引き出すテクニックを紹介します。

「ステップごとに考えてください」と追加する（CoT） 「Chain-of-Thought（思考の連鎖）」と呼ばれる手法。この一言を加えるだけで、Googleの研究では算数問題の正答率が17.9%→58.1%に向上しました。AIに「考える過程」を言語化させることで、間違いに自分で気づきやすくなります。

例：「なぜ空は青いのですか？ステップごとに説明してください」

「間違っていても遠慮なく指摘して」と伝える AIの忖度を正面から防ぐ方法。「私が間違っていても構いません」と事前に伝えることで、AIが同意しやすくなるバイアスを和らげます。Anthropicの研究で推奨されている手法です。

例：「私の考えが間違っていたら、遠慮なく指摘してください。正確な情報が欲しいです」

「反論もあわせて教えて」と聞く 一方向の意見だけでなく、反対の立場も要求することで、偏った答えを防ぎます。特に判断が難しいテーマや意見が分かれる話題で効果的です。

例：「AIを仕事に導入するメリットと、反対意見・デメリットを両方教えてください」

「わからないことはわからないと言って」と伝える AIに不確かな情報を推測させないための一言。知らないことを正直に言うよう求めることで、ハルシネーションが起きるリスクが下がります。

例：「確信がない情報や知らないことは、推測せずに『わかりません』と教えてください」

批評家の役割を与える 「あなたは批判的なレビュアーです」と役割を与えることで、AIが称賛より欠点を探す方向に動きます。文章・計画・アイデアのレビューに特に有効。

例：「あなたは厳格な編集者です。この文章の問題点だけを、箇条書きで指摘してください」

大事なことは「別に調べる」を忘れない どんな技を使っても、AIが100%正確になることはありません。医療・法律・お金・重要な数字は、必ず公式サイトや専門家で確認する習慣を持ちましょう。AIは「調査の補助」であって「最終判断」ではありません。

例：AIに症状を聞いた後、必ず医療機関や厚生労働省のサイトで確認する。

今日から使えるひな形

以下をコピーして使ってみてください：

「[質問内容]。ステップごとに考えてください。私が間違っていれば遠慮なく指摘してください。確信がない情報は推測せず、わからないと教えてください」

この記事のまとめ

AIは「それらしい嘘」を自信満々に話す「ハルシネーション」という問題を持っている
2021年は21.8%だったハルシネーション率が、2025年には0.7%まで改善——ただしゼロにはなっていない
世界中で弁護士が架空の判例を1,227件以上提出するなど、現実の被害も起きている
「これ合ってるよね？」の一言だけで、AIは正しい情報でも否定してしまう「忖度」がある
会話が長くなるほど忖度が蓄積し、AIの精度が最大47%低下するという研究結果がある
「ステップごとに」「反論も教えて」「わからないは言って」の3フレーズが特に効果的
医療・法律・金融など重要な分野は、AIの回答を鵜呑みにせず必ず別途確認する