ワードサラダとは、一見文法的に正しいように見えるが、単語をでたらめに並べたもので意味が通らない文章。コンピュータにより自動生成され、迷惑メール(スパムメール)の本文に記載されたり、検索エンジンユーザを誘導して広告を閲覧させる目的でブログスパムなどに利用される。ワードサラダという名称は、関連性のない言葉が文章の中にちりばめられている様子を、サラダの中にさまざまな野菜が散らばっている様になぞらえている。


 でたらめに並べた言葉の集まりは人間が読めばそれが意味のない滑稽な文章だと判断できるが、コンピュータにはその文章が意味のあるものかどうか、誰かに何かを伝えようとするものなのかを正確に判断することは難しい。


 ワードサラダの生成は主にソフトウェアによって自動的に行なわれ、Web上に存在する文章を大量にダウンロードしてきて単語単位に分解し、文法などを考慮しながら(意味的には)でたらめに再構成することにより作成される。できた文章は迷惑メールの本文にコピーされたり、ブログのエントリーなどの形でWeb上に公開される。


 検索エンジンで検索してきたユーザなどがワードサラダのページを訪れると、ページの内容は意味の無いものであるが、掲載されている広告を閲覧させられたり、仕込まれた悪意あるスクリプトなどによりコンピュータウイルスに感染させられたりする。


 かつてはページの自動生成は特定の単語の繰り返しなどにより生成されていたが、こうした手法はメールソフトや検索エンジンのスパムフィルタなどにより除外されるようになってきたため、こうした対策をすり抜けるための手法としてワードサラダが考案された。

 ロングテールとは、インターネット上での現象は、生起頻度の低い要素の合計が全体に対して無視できない割合を占めるという法則。少数の上位で全体の大半を占めるという、いわゆる「20:80の法則」に対するアンチテーゼで、ネット上での人々の行動の特徴を表す理論として注目されている。米WIRED誌の編集長だったChris Anderson(クリス・アンダーソン)氏が2004年10月に発表した「the Long Tail」という記事の中で提唱した法則。


 マーケティングなどの分野では伝統的に「上位2割の合計が全体の8割を占める」という経験則が知られてきた。これは「2割の顧客から8割の売り上げ」「2割の社員が8割働く」などの形でよく知られているが、オンラインショップの売り上げなどを調べると、少しずつしか売れない商品の売り上げをすべて合計すると無視できない割合になり、逆に売り上げ上位の少数の製品を合計しても大した割合にはならないことが分かった。


 この現象をグラフに描画し、縦軸に生起頻度(オンラインショップで言えば販売数量)を取り、横軸に頻度の高い順に要素を並べると、頻度の低い要素(あまり売れていない商品)の部分が横に長く伸びていることが分かる。これを動物の尻尾に見立て、「ロングテール」(long tail:長い尻尾)と名付けられた。物品の販売だけでなく、オンライン広告やWebページのアクセスなどでも見られる現象と言われている。

 ロボット型サーチエンジンとは、サーチエンジンの一種で、専用のアプリケーションソフトがインターネット上のWebサイトを自動的に巡回してデータを収集するタイプのもの。データを収集するソフトウェアをロボットと呼ぶ。


 人手でサイトの「索引」を構築するディレクトリ型にない特徴として、各Webサイト内を指定したキーワードなどの検索条件にしたがって全文検索することができる。


 ロボットは人間と違って各サイトやページに書かれている内容の意味や相互の関連までは把握できないため、ディレクトリ型サイトに掲載されているようなサイトの分類や要約などを生成することはできない。


 最近ではソフトウェア技術の進歩により、ロボット型でもサイト間の相互の関連性を利用した検索結果の重み付けを行なったり、内容をベースに自動的に関連のあるもの同士を結び付けて分類を行なったりするものも登場するようになった。

 リンクレピュテーションとは、リンク先のページの内容を判断するために、リンク元サイトのアンカーテキストの情報を元に判断するというアルゴリズムのこと。


 例えば、WebページAからWebページBにリンクを貼るとき、通常そのリンクする先のWebページBを説明する情報が含まれている。そのため検索エンジンはWebページBの評価をするときに、そのアンカーテキストの情報を読みとって評価していく。リンク先のWebページBを評価するために、リンク先のWebページAの情報であるアンカーテキスト、つまり周囲からの評価を参考としているので、リンクレピュテーションという。


 リンクレピュテーションの概念を理解しその概念を用いることで、検索エンジンは特定キーワードとWebページを関連づけることが可能になり、その検索結果の精度を高めることが出来る。Webページを評価するときに、内的要因(内部リンクなど)だけでは、悪意を持ったスパマーを排除するのが難しいため、外的要因(アンカーテキストなど)による評価は客観的な評価であると推定して高く評価しており、またスパムを排除するための有効な策になるといわれている。

 リンクフリーとは、Webサイトのオーナーに許諾を求めることなくリンクしてもよい、という意味の言葉。「このページはリンクフリーです」のように使う。


 リンクしてほしくないページはインターネットで公開すべきではないため、わざわざ「リンクしても良い」と宣言するのは本来おかしな行為だが、個人サイトのオーナーなどの間では「リンクには許可を求めるのがマナー」という共通認識があるようで、「リンクフリーです」と自サイトで宣言するのが定着している。


 ちなみに、「リンクフリー」は和製英語なので、英語圏の人間には通じない(「リンクに許可が必要」という認識がこれほど広まっているのも、おそらく日本のインターネット文化に独特の習慣と思われる)。英語で「○○フリー」というのは「○○から自由な」つまり「○○のない」という意味(例えば、"sugar free" は「砂糖抜き」)なので、"link free site" を素直に解釈すると「リンクのないサイト」つまり「どこにもリンクしていないサイト」もしくは「どこからもリンクされていないサイト」というくらいの意味になる。

 リンクファームとは、検索エンジンの検索結果で特定のWebページの表示順位を上げるために、そのWebページへの不自然なリンクが大量に張られている状態。また、そのような不自然な大量のリンクを掲載したページ/サイト群。


 Goolgeなどの検索エンジンは、どれだけ多くの人がそのWebページに対してリンクを張っているかを、そのWebページの客観的な重要度として検索結果の表示順位の指標のひとつにしている。これに目をつけ、自身の運営する複数のWebページ間、もしくは協力者が集団で運営しているWebページ間で大量にリンクを張り、人為的に指標を上げることで検索結果の表示順位を押し上げるというSEO行為が行われるようになった。


 リンクファームによって操作されたランクは客観的な重要度とは言い難く、Googleではリンクファーム参加者とみなしたWebページに対して、ランクを下げたり検索対象から外したりといったペナルティを課している。米国ではGoogle社とリンクファーム参加者の間でリンクファームをめぐる訴訟が起きたが、Google側が勝訴している。

 リファラとは、あるWebページのリンクをクリックして別のページに移動したときの、リンク元のページのこと。Webサーバのアクセスログに記録される項目の一つ。


 これを辿っていくと閲覧者がどこのサイトから訪問したのか、また、サイト内でどのような軌跡を辿ったのかなどを調べることができる。検索エンジンからの訪問の場合には、URLのパラメータ部分を調べることによって、どんな言葉で検索した結果のページから来たのかを知ることができる。Web広告の世界では、どのサイト/ページに掲載した広告に効果があったのかを調べることができる重要な項目である。

 リッチメディアとは、データ量の少ない文字や静止画だけでなく、音声や動画など様々なメディアの情報を統合して扱うこと。近年のインターネットの回線容量の向上や、様々なメディアの情報を扱う要素技術の整備により、インターネットを通じたリッチメディアによる情報配信が実用化されつつある。


 具体的には、FlashやJava、Dynamic HTMLなどの技術を用いて製作・配信され、ユーザの操作によって表示情報が変わるなど、インタラクティブ性を持っていることも多い。


 「マルチメディア」と近い意味を持つが、こちらはやや古い言い回しで、インターネット上での情報配信に際してはリッチメディアの語が好んで使われる傾向にある。特に、ネット広告として音声や動画を使うものを「リッチメディア広告」と呼ぶ。

 リッチクライアントとは、企業情報システムのクライアント環境のうち、アプリケーションの実行環境のみを搭載したもの。伝統的なクライアントサーバシステムのクライアントに当たる「ファットクライアント」と、アプリケーションをWeb化してクライアントにWebブラウザを使う「Webクライアント」(HTMLクライアント)の中間の性質を持つ。


 リッチクライアントは、必要に応じてアプリケーションをダウンロードして実行するため、ファットクライアントに比べて配布や導入に手間がかからない。また、ネイティブアプリケーションとして実装されるため、Webブラウザをクライアントにする際の最大の弱点であるユーザインターフェースの貧弱さを克服し、ファットクライアントと同等の表現力や操作性を実現できる。両者の「いいとこ取り」に近い手法である。


 最近では、サーバアプリケーションの実装や通信部分などで可能な限りWeb技術を転用し、クライアントにWebブラウザを独自拡張したソフトウェアを使うことでリッチクライアント環境を実現するアプローチが流行している。

 リーチとは、特定のWebサイトがある期間内にどれだけの人に閲覧されたかを示す値。(対象となる)全インターネットユーザに対する比率で示される。インターネット広告の場合は、特定の広告が何人に配信されたかを表す(全ユーザ数に対する比率であらわす場合もある)。同一回数の配信を行なう場合、広告内容がすぐに理解可能な内容であれば、フリークエンシー(一人当たりの露出回数)よりリーチを重視し、回数を重ねなければ広告に興味を示さないと考えられる場合はリーチよりフリークエンシーを重視した方が広告効果が高いとされる。