HTMLのメタタグの記述、またはサーバーの設定で、サイト内の特定のウェブページをインデックスに登録することを拒否できます。

メタタグを使用する方法

HTMLの head のなかに次の記述をします。

meta name="robots" content="noindex"
上記は、すべての検索エンジンでインデックスへの登録を拒否する方法です。YSTのインデックスへの登録を拒否する場合には、次のように記述します。

meta name="Slurp" content="noindex"
サーバーで設定する方法

ウェブページをホスティングしているサーバーのHTTPヘッダーの設定で、次のようなディレクティブを設定します。

X-Robots-Tag: NOINDEX


注意
robots.txtで巡回が拒否されているウェブページでも、公開されているほかのウェブページからリンクされていると、URLのみが検索結果に表示されることがあります(URLやドメイン名を検索キーワードにして検索した場合)。YSTは、このようなウェブページは「thin document」としてURL情報のみ登録し、ウェブページの内容はインデックスに登録していません。
YSTは次のサイトマップのフォーマットに対応しています。

Sitemaps
Yahoo! Inc.をはじめ、複数の検索エンジン運営会社が対応しているフォーマットです。詳細については、や「Sitemapsの記述方法」やsitemaps.orgの「サイトマップのXML形式」(外部サイト)を参照してください。
RSS
RSS 0.9、RSS 1.0、RSS 2.0の3つのフォーマットに対応しています。これらのフォーマットは、ブログの更新情報の通知に使われていて、多くのブログサービスでいずれかのフォーマットが導入されています。
Atom
Atom 0.3、Atom 1.0の2つのフォーマットに対応しています。これらのフォーマットは、ブログの更新情報の通知に使われていて、いくつかのブログサービスでいずれかのフォーマットが導入されています。
テキスト形式
URLのリストを次の例のように1URLごとに改行して記述し、ファイル名は「urllist.txt」とします。
http://searchranking.yahoo.co.jp/
http://searchranking.yahoo.co.jp/burst_ranking/
http://searchranking.yahoo.co.jp/combo/20080424/11
http://searchranking.yahoo.co.jp/combo/20080424/12
http://searchranking.yahoo.co.jp/combo/20080424/13
http://searchranking.yahoo.co.jp/combo/20080424/24
圧縮されたテキスト
上記のテキスト形式のファイルをgzip圧縮したもので、ファイル名は「urllist.txt.gz」とします。
YSTは、サイトマップをサポートしています。サイトマップとは、サイトを構成するURLを記載したファイルで、例えばsitemaps.org(英語、外部サイト)で定義されているようなフォーマットが一例となります。

サイトのサイトマップを用意し、検索エンジンに通知しておくと、クローラーは、通常の巡回方法よりも効率的にサイトを巡回できるため、更新したウェブページや新しいウェブページなどが、より早く巡回されるようになります。サイトマップは、以下のいずれかの方法で、検索エンジンに通知できます。
なお、サイトマップの記述については、「Yahoo!が対応しているサイトマップのフォーマット」や「Sitemapsの記述方法」を参考にしてください。

robots.txtに記述

robots.txtに、サイトマップファイルのURLを記述します。

robots.txtの記述例
Sitemap: http://www.example.com/sitemap.xml
Yahoo!検索 サイトエクスプローラーを利用

robots.txtを設置できない場合でも、通知できます。対応フォーマット、通知方法など、詳しくはYahoo!検索 サイトエクスプローラーヘルプの「フィードURLの送信とは」(Yahoo!検索 サイトエクスプローラーヘルプ)をご覧ください。