ワードサラダ

ワードサラダ(Word salad)、言葉のサラダとは、文法は正しいが、意味が支離滅裂である文章のこと。

 

目次

  

 

精神医学にて

精神病#症状」も参照

精神医学では思考障害の一つに分類され、認知症統合失調症頭部損傷患者などにみられる。

コンピューティングにて

検索エンジンの検索結果やウェブログ迷惑メールに多く見られる。 統合失調症患者にみられる言語障害(Word salad、言葉のサラダ)に似ていることから、この名がつけられた。

検索エンジンやメールのスパムフィルタを回避して、閲覧者を特定のウェブサイトに誘導することを目的としている。 誘導先のサイトは、アドセンスやアフィリエイト収益のみを目的としたサイトや、アダルト・違法サイト、閲覧者をウイルスに感染させることを目的としたサイトが多い。

過去に著名人や企業が保有しており、所有権が失効したドメインを悪用したケースも存在する。

ワードサラダは多くの場合、検索エンジンの検索結果やRSSなどのウェブ上に存在する文章を元に、形態素解析構文解析を使用して自動生成される。 このため、例えば「昨年は山に登ってみたので、今年は海に行きました。」と「今年は水着でプールを泳いだので、来年は海で泳いでみます。」の2文から、「今年は山に泳いだので、来年はプールを行きました。」のような支離滅裂の文章ができる。 近年の技術では、コンピュータが文章の意味情報を完全に理解することができない[1]ため、自然文とワードサラダを判別することは難しかった。このため、ワードサラダを使った文章はスパムフィルタをすりぬけてしまった。特に、Yahoo! が独自の検索エンジンを使っている時代には、Yahoo! に限ってワードサラダのサイトがたくさん検出された。(Google の検索エンジンでは排除されることが多かったが。)

Googleの技術では、数年前から、ワードサラダを区別することが可能になってきており、今ではワードサラダのサイトの多くは排除されるようになった。そのため、ワードサラダのサイトはあまり存在しなくなった。[2]

脚注

  1. 関連項目^ 自然言語処理#処理内容とその限界
  2. ^ ワードサラダのスパムサイトの制作者の告白(Webアーカイブ)

カテゴリ