インターネットお役立ち情報局@Web

インターネットに存在する様々なお役立ちサービスを紹介していきます。
各種レンタルブログサービスから、日本・海外の検索エンジンまで幅広く紹介していきます。


テーマ:

Sogou捜狗


大手ポータルサイト捜狐傘下の検索エンジン捜狗。


http://www.sogou.com/


-----------------------------------------------------------------------------------------------------------------------------------


検索エンジンは、狭義にはインターネットに存在する情報(ウェブページ、ウェブサイト、画像ファイル、ネットニュースなど)を検索する機能およびそのプログラムです。インターネットの普及初期には、検索としての機能のみを提供していたウェブサイトそのものを検索エンジンと呼んでいましたが、現在では様々なサービスが加わったポータルサイト化が進んだため、検索をサービスの一つとして提供するウェブサイトを単に検索サイトと呼ぶことはなくなっています。広義には、インターネットに限定せず情報を検索するシステム全般を含みます。また、狭義の検索エンジンは、ロボット型検索エンジン、ディレクトリ型検索エンジン、メタ検索エンジンなどに分類されます。


ロボット型検索エンジン

与えられた検索式に従って、ウェブページ等を検索するサーバ、システムのことです。検索式は、最も単純な場合はキーワードとなる文字列のみであるが、複数のキーワードにANDやOR等の論理条件を組み合わせて指定することができるものが多いようです。ロボット型検索エンジンの大きな特徴の一つとして、クローラ(ロボット・スパイダー)を用いることが挙げられます。このことにより、WWW上にある多数の情報を効率よく収集(日本の著作権法では複製)することができる。大規模な検索エンジンでは、80億ページ以上のページから検索が可能になっています。収集したページの情報は、前もって解析し、索引情報(インデックス)を作成する(日本の著作権法では編集)。日本語などの言語では、自然言語処理機能が生成される索引の質に影響する。このため、多言語対応した検索エンジンの方が精度の高い検索が可能となります。検索結果の表示順は、検索エンジンの質が最も問われる部分である。ユーザーが期待したページを検索結果の上位に表示することができなければ、ユーザーが離れてしまうからです。そのため、多くの検索エンジンが、表示順を決定するアルゴリズムを非公開にし、その性能を競っています。検索エンジン最適化業者の存在も、アルゴリズムを公開しない要因になっています。Googleは、そのアルゴリズムの一部であるPageRankを公開しているが、やはり、多くの部分が非公開になっています。Googleの場合、創設初期におけるアルゴリズムについては、創設者自身がウェブ上で公表している論文でその一端を知ることができます。 ウェブページの更新時刻の情報を用いて、新しい情報に限定して検索できるものや、検索結果をカテゴリ化して表示するものなど、特長のある機能を搭載したり、検索結果をユーザーへ最適化していく動きもあるようです。従来のウェブページを検索するだけの検索エンジンにとどまらず、最近ではインターネットショッピング専用の検索エンジンなど特定の分野に特化した検索エンジンの開発も散見されます。商品検索では、価格比較サービス最大手の価格.comや、ベンチャー企業が開発するQOOPIEなどがあります。また、職業検索エンジンとしては派遣の検索などがあります。


ディレクトリ型検索エンジン

人手で構築したウェブディレクトリ内を検索するサーバ、システムのことです。人手で構築しているため、質の高いウェブサイトを検索可能です。概要を人手で記入しているため、検索結果の一覧から目的のサイトを探しやすい、サイトのカテゴリ分けがされていることから、特定分野や地区などに限定したサイトを探しやすいという特長があります。しかし、検索対象となるサイトは人手で入力するため、検索対象となるサイト数が多くできないという欠点があるようです。インターネットが一般に使われるようになった初期(1990年代)のころには、ディレクトリ型が主体でしたが、WWWの爆発的な拡大によって、あらゆるウェブサイトを即時にディレクトリに反映させることが事実上不可能になり、現在では主流ではなくなっています。 このため、ディレクトリ型検索エンジンでは、検索にヒットするサイトが無かった場合、ロボット型検索エンジンを用いて結果を表示するような、併用型のものが多いようです。


メタ検索エンジン

ひとつの検索ワードを複数の検索エンジンで検索することをメタ検索といいます(横断検索エンジンと呼ぶこともある)。メタ検索エンジン(メタけんさくエンジン)は、入力されたキーワードを複数の検索エンジンに送信し、得られた結果を表示するタイプの検索エンジンです。検索する際に、検索対象サイトを選択する「非統合型」と、検索結果を1つのページに統合して表示する「統合型」とがあります。統合型では結果表示に広告が出ないため、GoogleやLycosのように、メタ検索エンジンでの利用を禁止しているところもあるようです。


-----------------------------------------------------------------------------------------------------------------------------------


ホームページ制作Webデザインシステム開発SEO対策
AD
いいね!した人  |  コメント(0)

[PR]気になるキーワード