なんか適当な話 | 30歳から始めたプログラミング

なんか適当な話

たまにあるサービスですけど、yahooやgoogleの検索サイト
であるキーワードにおいて何番目にインデックスされているか
を取得することができます。

例えば、「アメブロ」というキーワードをヤフーとグーグルで検索すると
どちらも1番目にこのアメーバブログのトップページが表示されます。

つまり調べたいurlとキーワードを入力してそのキーワードで検索した
ときそのURLが何番目に表示されるかを教えてくれるサービスです。

いったいどのように取得しているのでしょうか?
ソースを公開しても良いのですが、あんまりまとまっていないので
どのような操作をしているのか概要を公開しようと思います。


まず、phpで指定したURLのファイルを丸ごと取得する命令があります。
それを使ってyahooのurlとキーワードを入力し、(URL変数を多少操作する)
検索結果をまず取得します。

その後、取得したソースのタグを調査して、繰り返されているタグを正規表現
などで取得し、変数などに格納して何番目のタグに指定したURLがあるかを探して
評価します。

その何番目が検索順位になるということです。

今度サンプルプログラムを作成し、公開しようと思います。
phpの使える無料レンタルサーバーをご存じの方がいらっしゃったら
是非情報を教えてください。


$30歳から始めるWEBプログラミング

トピッキング


人気ブログランキング