AI生成テキスト検出ツールが文学名作を機械生成と誤認する問題

AI生成テキスト検出ツールが、聖書や名作文学を機械生成と判定する失敗が続出しています。この現象は、優れた人間の文章がAIの特徴と一致するためです。技術の限界が教育や出版に影響を与えています。（約40語）

なぜ名作文学がAI生成と誤検知されるのか？

検出ツールは大規模文学作品を機械生成と判定します。『百年の孤独』は100% AI生成と出ます。

創世記はZeroGPTで88.2%のAI確率。米国憲法は96.21%です。

Harry PotterやBohemian Rhapsodyの歌詞も同様。結果は一貫します。

主な指標はperplexity（perplexity）とburstiness（burstiness）です。これらで動作します。

優れた文章は低perplexityを持ちます。ガルシア・マルケスの精密な語彙が原因です。

ChatGPTやClaudeは高品質人間テキストで訓練されます。流暢で低perplexityの出力が生まれます。

良い人間文章とAI文章の区別が困難です。検出アルゴリズムの限界が露呈します。

ネイティブは問題なし。20%で全ツール一致の誤り。

語彙制限が低perplexityを生み、ペナルティを受けます。2024年、オーストラリア大学で6,000人がTurnitinで疑われました。

GPTZero CEOのEdward Tianが指摘。意図的に閾値を調整し、偽陽性を増やします。

AI漏れを防ぐためです。人間テキストの誤判定が問題化します。

Hachetteが『Shy Girl』出版をキャンセル。Pangramで78% AI生成判定。

著者は否定。ツールの影響力が契約破棄を生みます。