●検索エンジンの種類について説明します~その4


前回の続きです。


こうして増え続けるすべてのサイトを、タイムリーにディレクトリに反映させることが不可能なのです。

このため、ディレクトリ型検索エンジンはメインで使われなくなりました。

ですが、手入力していることを考えてみれば当然のことかもしれません。


また、ディレクトリ型検索エンジンは、ユーザーが検索して出てくるサイトがディレクトリに存在しなかったとき、更にロボット型を使って、違う結果を表示させるようになりました。

このような、ロボット型を併用しているタイプが多いです。

ウェブサイトの例をあげてみますと、大手の「Yahoo」もそうですし、また「infoseek」、「goo」、または「Open・Directory・Project」などのサイトがあります。


また、検索エンジンの種類でメタ検索エンジンと言うものがあります。

これは、1個のキーワードを、同時にいくつかの検索エンジンで調べることが出来るサイトです。

例えば、あなたが安く海外旅行をしたい場合、「海外旅行」と言うキーワードを入れるとします。

すると、いくつかの検索エンジンから得たそれぞれの結果を一覧で表示すると言ったものです。

メタ検索エンジンは、別名、メタサーチエンジンと呼ばれることもあり、また、横断検索エンジンとも言われています。


メタ検索エンジンには、これから検索しようとするときに、対象サイトを選択出来る非統合型があります。

また、検索した結果を一覧に統合して表示させる、統合型があります。
これは、結構使っている人が多いと思います。


アクセスアップ@藤村


関連記事

検索エンジンの種類について解説します~その3



●検索エンジンの種類について解説します~その3


こんにちは、アクセスアップ@藤村です。


検索エンジンのシステムのひとつである、ロボット型検索エンジンをご紹介しましたが、それと相反するシステムもあります。

それが「ディレクトリ型検索エンジン」です。


ロボット型検索エンジンは、コンピューターを使って、人が行わなくても自動的に情報を集めていることだと説明しました。
これとは反対で、人の手によって構築されているものがディレクトリ型となります。

人の手によって構築されているウェブディレクトリの中を検索出来るサーバー、またはシステムのことを「ディレクトリ型検索エンジン」と言います。


自動的にコンピューターがやっていることに比べてみると、人の手で構築されているので、特に質の高いサイトを検索することが出来ます。

また、サイトの概要を人間が手入力しているので、検索した結果一覧から、自分の求めるサイトが探し易いのです。

また、カテゴリで分けられているため、特定の分野だったり、地区だったり、限定したものも探し易くなっています。

ですが、このディレクトリ型にも不利な点があります。
検索の対象になるウェブサイトを手入力しているため、検索の対象になるサイト数がロボット型と比べてそれほど多く出来ないということです。


ネットが普及したころは、検索エンジンと言えば、このディレクトリ型検索エンジンが主でした。

ですが、現在までの急速な普及によって、サイトの数も膨大になりました。
日々、数多くの新しいサイトが出来ていると言えますよね。


アクセスアップ@藤村

●検索エンジンの種類について解説します~その2


こんにちは、アクセスアップ@藤村です。


これらロボット型検索エンジンと呼ばれているシステムですが、クローラと呼ばれるロボット・スパイダーを使うことが特徴だと言えます。

これによって、ネット上に存在するあらゆる情報を効率良く集めることが出来ます。

検索エンジンでも規模が大きくなると、何十億ページにもなる大量のページから情報を得ることが出来るのです。


さて、収集されたページ情報は、解析され、インデックスも作成されます。

特に私達が使っている日本語は検索プログラムにとっては難しいものなのです。

なぜなら、日本語は普段使っている言葉と正式な言葉とは違いが出ることがあるからです。

特にブログに書かれている言葉などは口語的ですよね。

今風の言葉を使っていたり、ちょっと砕けた言い方をしていたりしますよね。

それらもきちんと検索にヒットするように、情報収集をして、キーワードをブログに書く必要があるんですね。


でないと、まったく検索エンジンからのアクセスはありません。


自然言語処理機能とは、日常語を自動的に処理出来るシステムなのです。

データベースの情報を、自動的に自然言語に変換することや、自然言語になっている言葉をコンピューターが分析しやすい表現に変換することも出来ます。

このように、自然言語をコンピューターに理解させることを、自然言語理解と呼びます。


このように、普段の言葉使いで書かれているページの情報も、すべて収集できるようにするため「自然言語処理機能」と言うものが使われています。

ですから、この機能を使っているロボット型検索エンジンですと、かなりの情報量を集められますと言えます。


アクセスアップ@藤村