AIによるWebサイト生成、新規公開の35%に? スタンフォード大など調査 「不自然に明るい文章」の拡散

1 minutes reading View : 2
Avatar photo
Mika Nakamura
IT - 11 May 2026

本連載「Innovative Tech」は、2019年にスタートし、世界中の多様な分野から最先端の研究論文を独自の視点で厳選・解説する。執筆は研究論文メディア「Seamless」を主宰し、日々多くの論文に目を通す山下氏が担当。イラストや漫画は同メディア所属のアーティスト・おね氏が手掛けている。

英インペリアル・カレッジ・ロンドン、米国の非営利団体Internet Archive、米スタンフォード大学の研究者らが発表した論文「The Impact of AI-Generated Text on the Internet」は、インターネット上のAI生成テキストの割合とその影響を明らかにした。

2022年のChatGPT登場以降、インターネット上にはAIが作成した文章があふれ、情報の質低下を危惧する声が高まっている。これまで実際にどの程度のWebサイトがAIによって書かれているかは明確ではなかった。

研究チームは2022年8月から25年5月にかけて公開されたWebサイトを調査。その結果、新しく公開されたサイトの約35%がAIによって生成されたか、AIの支援を受けて執筆された可能性が浮上した。

調査では、インターネット上のAIコンテンツの割合を把握するため、過去のWebページを保存するInternet Archiveの「Wayback Machine」を活用した。

具体的には、2022年8月から25年5月に公開されたWebサイトの中から、特定のドメインに偏りが出ないよう毎月約1万件のURLを無作為に抽出。ページ内のテキストを抽出し、高性能なAIテキスト検出器で解析した。

事前に4種類の検出ツールをテストし、長文や短文、異なるAIモデル(GPT、Claude、Geminiなど)、さまざまな言語に対しても安定して高い精度を出せる「Pangram v3」というツールを厳選して採用した。

このツールで膨大な文章を「完全にAIが生成」「AIの支援を受けて人間が書いた」「完全に人間が書いた」の3つに分類。新しく公開されたサイトの約35%がAIによって生成、あるいはAIの支援を受けて執筆されたものと確認された。

研究チームは、人々の意識調査と実際のデータ分析の両面からAIの普及がネット空間に与える影響を検証した。アンケート調査では、大多数の人が「AIのせいで間違った情報が増えた」「個人の独特な文体が失われ、どれも似たような文章になった」と懸念していることが示された。

しかし、Web上の膨大なテキストデータを実際に解析すると、人々のイメージとは異なる事実が浮かび上がった。一般の人々が懸念していた事実の正確性の低下や文体の画一化については、インターネット全体という広い視点で見ると、目立って悪化している証拠は見つからなかった。

一方で、実際のデータからは明確に進行している2つの大きな変化が裏付けられた。1つ目は、文章が表す意味や意見が似通ってくる「意味的多様性の縮小」。AIが生成したWebサイト群は、人間が書いたサイト群と比較して、内容の類似性が33%も高かった。AIは極端な意見を避け、平均的で無難な回答を出力することもあり、ネット上の多様な視点や独自のアイデアが狭まっている可能性を示している。

第2に、不自然なほど明るい文章が増加する「ポジティビティ・シフト」。AI生成が関与したサイトのポジティブな感情スコアは、人間が書いたサイトに比べて2倍以上(107%増)も高かった。これはAIが人間に嫌われないように過剰に明るく、当たり障りなく振る舞う性質に由来し、オンラインの文章が人工的に健全すぎるものへと変化していることが実証された。

つまり、現在のインターネットで実際に起きている危機とは、分かりやすいウソやデマが爆発的に増えていることではなく、AI特有の「当たり障りのない、不自然に明るい文章」がネット上に増加していることが示唆された。

編集部注:この記事はAIを使用して作成されており、ITmedia NEWSの記事を元に、内容を変更せずにリライトしたものです。
Share Copied