ワードサラダ
ワードサラダ(Word salad)、言葉のサラダとは、文法は正しいが、意味が支離滅裂である文章のこと。
目次
精神医学にて
「精神病#症状」も参照
精神医学では思考障害の一つに分類され、認知症、統合失調症、頭部損傷患者などにみられる。
コンピューティングにて
検索エンジンの検索結果やウェブログ、迷惑メールに多く見られる。 統合失調症の患者にみられる言語障害(Word salad、言葉のサラダ)に似ていることから、この名がつけられた。
検索エンジンやメールのスパムフィルタを回避して、閲覧者を特定のウェブサイトに誘導することを目的としている。 誘導先のサイトは、アドセンスやアフィリエイト収益のみを目的としたサイトや、アダルト・違法サイト、閲覧者をウイルスに感染させることを目的としたサイトが多い。
過去に著名人や企業が保有しており、所有権が失効したドメインを悪用したケースも存在する。
ワードサラダは多くの場合、検索エンジンの検索結果やRSSなどのウェブ上に存在する文章を元に、形態素解析・構文解析を使用して自動生成される。 このため、例えば「昨年は山に登ってみたので、今年は海に行きました。」と「今年は水着でプールを泳いだので、来年は海で泳いでみます。」の2文から、「今年は山に泳いだので、来年はプールを行きました。」のような支離滅裂の文章ができる。 近年の技術では、コンピュータが文章の意味情報を完全に理解することができない[1]ため、自然文とワードサラダを判別することは難しかった。このため、ワードサラダを使った文章はスパムフィルタをすりぬけてしまった。特に、Yahoo! が独自の検索エンジンを使っている時代には、Yahoo! に限ってワードサラダのサイトがたくさん検出された。(Google の検索エンジンでは排除されることが多かったが。)
Googleの技術では、数年前から、ワードサラダを区別することが可能になってきており、今ではワードサラダのサイトの多くは排除されるようになった。そのため、ワードサラダのサイトはあまり存在しなくなった。[2]
脚注
カテゴリ: