2011年02月02日(水) 14時57分34秒

【実践SEO対策】第八回 robots.txtとsitemap.xml 1

テーマ:仕事:Web関連
なんと!
本年一発目の
皆様と進めていくSEO対策!です!

更新遅過ぎで申し訳ございません。
いろいろ一区切り付きましたので、これからガンガン更新していきますよ!


バックナンバー
【予告】SEO対策始まる
【実践SEO対策】第一回 現状を知る1
【実践SEO対策】第二回 現状を知る2
【実践SEO対策】第三回 CSSで横メニュー 1
【実践SEO対策】第四回 CSSで横メニュー 2
【実践SEO対策】第五回 CSSで単体ボタン
【実践SEO対策】第六回 アクセス解析導入編1
【実践SEO対策】第七回 アクセス解析導入編2



さて、今回は一風変わったお話しをば
robots.txtとsitemap.xmlでございます。

「ロボットテキストってなんやねん、ロボットの設計図かなんかか?」
「サイトマップは聞いたことあるで!ホームページの案内板やろ、うちのページにもついとるわ」

お客さま、そのご意見は間違っているようでだいたいあってたりする微妙なラインでございます。

robots.txtというのは、Yahoo・Google・Microsoft(Live Search)の3社様が取り決めている、サーチエンジンのロボット(クローラー)に、見ても良いコンテンツと見てはいけないコンテンツを指定するファイルのことです。

書式は
見ても良いコンテンツ Allow: /
見てはいけないコンテンツ Disallow: /

と書きます。

例えば写真ファイル(jpg)は直接検索エンジンから見てほしくないという時
Disallow: /*.jpeg$
と書きます。

さて、このファイル今回何に使うのかといいますと、もうひとつの話題「sitemap.xml」をクローラーさんに見てもらうために使います。

サイトマップとは一般的にサイト構成を分かりやすく書いたページの事をいいますよね。
sitemap.xmlは、クローラー向けのサイトマップの事です。
書式は下記のような感じです。

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.abeprint.co.jp/</loc>
<lastmod>2011-02-02</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.abeprint.co.jp/PDF/abe_sheet.pdf</loc>
<lastmod>2011-02-02</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
</urlset>

今回は2ページ分しか書いてませんが、全ページ分書いてください。

「こんな小難しいの書けねーよ!だいたいxmlってなんやねん」

ご安心ください、今は便利なツールがございまして、いちいち手書きする必要がないのです!
いくつかツールがございますが、今回ご紹介するのはこちら

FC2サイトマップ

画面を見ていただければ説明の必要がないくらいシンプルです。

$Webディレクターがたまに教える儲かる秘密!?・・・と日常風景

URL入力のところにsitemap.xmlを作りたいサイトのURLを入れてください。
弊社の場合はhttp://www.abeprint.co.jp/ですね。
下にあるチェックボックにチェックを入れておくと、現在それぞれの検索エンジに登録されているか否かを教えてくれます。

ただしこの機能は時間がかかるので、今回はデフォルトのGoogleのみにチェックを付けました。
お時間が無い方は全部チェックを外しても支障はございません。

しばらーく待つとリストが表示されます。

$Webディレクターがたまに教える儲かる秘密!?・・・と日常風景
なんとURLを1つしか入れていないのに全ページ分できちゃいました!
優秀ですね~。

これが生成されるxmlの項目になります。
見本はgoogleさんの登録状況にチェックを入れてますが全部の項目に○がついてますね。
これは全ページがGoogleに登録されているという事です。
もし○が付いてないページがあるとしたら、そのページはGoogleさんに登録されていないということになります。

ココで、お客さまの中にはリストが空っぽな方もいらっしゃるかと思います。
トップページが全面Flashで出来ているサイトをお持ちの方などが該当するかと思います。
この場合もうsitemap.xmlは作れないのでしょうか。

ご安心ください!
そんなことはありません。

エントリーが長くなってしまいますので、次回以降に回しますが、方法はあります。
今しばらくお待ち下さい。


さて、画面をよく見てみると、「更新頻度」「優先度」というところにボタンがついてますね。

$Webディレクターがたまに教える儲かる秘密!?・・・と日常風景
このボタンを押していただくと、プルダウンメニューが出てきますので、更新頻度や重要度をコンテンツに合わせて変更してください。
弊社の場合はスタッフブログのページが毎日更新ですので、変更しております。
優先度につきましては、サイト内での相対的な物ですので、「高」ばかりにしておくと本当に重要な情報が他の情報に埋もれてしまう可能性があります。
適切に設定しましょう。

この段階で、欠損しているページがないかよく見ておいてください。
Flashからのみのリンク先などはこのリストに表示されていません。
欠損ページの追加は次回以降のエントリーでご紹介しますので、ちゃんと覚えといてくださいね。

「サイトマップ保存」というボタンを押して保存しましょう。
コレでsitemap.xmlは完成しました!

このsitemap.xmlがどこにあるのか教えてあげるのが今回のrobots.txtのお役目。
ようやく出番がきましたね。

お馴染みのテキストエディタで下記のように書いてください。

User-agent: *
Sitemap: http://www.abeprint.co.jp/sitemap.xml



http://www.abeprint.co.jp/sitemap.xmlの部分はお使いの環境に合わせて変更してくださいね。
ファイル名を「robots.txt」として保存しましょう。

出来ましたファイル「robots.txt」と「sitemap.xml」をFTPで第一階層にアップすれば完成です。

お疲れ様でした。

次回はsitemapの修正方法やGoogleで実際にどう扱われているのかをご紹介する予定です。

お楽しみに!



本日の儲かる秘訣!
robots.txtとsitemap.xmlでクローラーの迷子をなくそう!
毎度の宣伝で大変恐縮なのですが、robots.txtとsitemap.xmlの設置もアベ印刷にお任せ!
メールもしくはお電話で、「インターネットを見ました」と伝えていただければ私が対応させていただきます。


あいも変わらずコメントもペタも絶賛大歓迎中です。
ペタしてね

コメント

[コメントをする]

コメント投稿

一緒にプレゼントも贈ろう!

Amebaおすすめキーワード

    メルマガ購読・解除
     
    アメーバに会員登録して、ブログをつくろう! powered by Ameba (アメーバ)|ブログを中心とした登録無料サイト