魔王の憂鬱 -16ページ目

魔王の憂鬱

情報通信っぽいことを、分かりやすく述べているつもりです。

シルバーウィークも終わりを迎えようとしております・・

私はいい歳をしてポケモンばっかりやっておりました。


ここ数日で、朝晩が一気に冷え込んでまいりましたねー。


少し前までクーラーor扇風機だったのに、

最近は掛け布団にくるまって寝る始末。

風邪をひきやすい時期かもしれません。気をつけなければ。



今回は、

以前から予告をしておいて放置していました

「検索サイトの仕組み」関連の話です。



まず調べてみて分かったのが、

検索サイトって、それぞれ検索方法が異なるみたいなのです。


・ディレクトリ型 : 人の手で情報を収集、分類する。

例: yahoo!


・ロボット型 : プログラムによって自動的に収集、分類する。

例: Google goo


・混在型 : プログラム人の手による収集

例: excite lycos infoseek



人かロボットかという違いでしたね。

人の手だと、処理に時間がかかりますが、分かりやすく解説してくれます。

ロボットだと、検索件数(データベース登録数)は多いけど、検索結果が分かりにくいかも。


探すページの内容が具体的に分からなければディレクトリ(人の手)型。

固有名詞など、特定化できる内容が分かっていればロボット(プログラム)型。


このように、検索サイトを使い分けることも可能って訳ですね。

検索サイトによって表示順が異なることにも納得できました。



さて!

プログラマーとして気になるのは、「ロボット型の検索内容」ですよね。



ロボット型の検索エンジンでは、大きく3つの機能が動作しているようです。


   ・Webサーバー

      ↑

     クローラー             ←(情報ゲット)

      ↓

   ・検索エンジン

      

     インデクサ             ←(情報分類)

      ↓

   ・検索エンジン(検索結果データベース)

      

     クエリサーバー          ←(情報表示)

      ↓

   ・検索ユーザー



クローラーという機能で、

世界中のWebサイトから検索エンジンへ、情報をかき集めてきます。


インデクサという機能で、

かき集めてきた内容を解析します。

ここでキーワードやテーマを分析して、自身のデータベースに保存します。


クエリサーバーという機能で、

解析結果を検索結果ページとして作成、表示します。



そもそも、まず「クローラー」でホームページの情報が取ってこられなければ、

検索サイトに表示されることもないってことですね。


じゃあ、どうすればいいの?という話ですが、

「クローラー」の処理をもう少し詳しく書きます。



クローラーは、

あるページで、「A HREF="~"」とリンクされているURLを見つけると、

そのURLに対して、ステータスコードを要求します。


↑「A HREF ~」は、ホームページに使われているHTMLという言語で、

このページでの参考文献などに使われております、リンクを表現する記述です。

↑ステータスコードは、簡単に言いますと、

ページリンク対象があるのか、移動したのか、ないのかを示すものです。


ステータスコードが「200:OK」ならばデータベースに保存し、
ステータスコードが「404:Not Found」ならばデータベースより削除しようとします。
(他にも多くのステータスコードや、クローラーの処理はあります)



ちょっと難しい話かもしれませんでしたが、

どこかのホームページで、自分のホームページへのリンクが貼られており、

そのリンクが正しく機能しているならば、

ロボット型の検索サイトのどこかにはヒットするってことでしょうかね?



今回は、検索サイトの処理について、

特に、ロボット型の処理の内容について触れました。

どのようにホームページの情報を集めるのかをご紹介しましたが、

では、どうすれば検索上位に来るの?という内容については、

また次回以降の話にしたいと思います。


今回は、参考文献2つ目の内容をメインに私なりの解釈を交えましたが、

とても参考になりましたので、こちらは一見してみるといいかと思います。


シルバーウィークオヤスミ分も含め、少し長めに書いてみました



●参考文献

検索サイトの仕組み

http://www.toba-cmt.ac.jp/center/gijyutu/kensaku.htm


Web担当者Forum
http://web-tan.forum.impressrd.jp/e/2009/03/27/4952


メインPCのファンが壊れ、また動かなくなってしまいました。

とっくの昔に保証期限も切れており、

結構な修理費用がかかりそうです。


新しいノートPCもな・・、

きっとWindows 7 なんだろうな・・

と思い、購入へは至らず。

まだ動作自体は問題ないし、現役で頑張ってもらうつもりです。


というわけで、しばらくセカンドPC(windows 7搭載)です。



セカンドPCでは、当HPはブックマークに入れていなかったので

ヤホー(古い)で検索してみたところ・・


「魔王の憂鬱」で、当HPが一番上にきておりました!万歳!

以前は何位だったっけな・・?2番目だった。

また、「検索クン2」と題し、どう変動しているか調べてみようかな?



さて、9月に入っても暑い暑い世の中です。

会社では扇子を片手にパタパタ。もう片方の手でポチポチ。

これでは効率が悪いと、

今更ながら、USB対応の扇風機を購入しました。


結構な種類がありまして、千円~二千円といった感じです。

使用環境を考慮し、一番静かなものにしました。


小さいからといってなめてはいけません。

これが結構涼しいんですよ。

元々PCの目の前にいますので、

扇風機も近い位置にあるからでしょうね。


中には電池でも動くものがあります。

私はこれも持ってはいるのですが、

触っても大丈夫なように、柔らかい羽根のものもあります。


ちょっと導入が遅かったかなーとも思いましたが、

冬は冬で暖房が効きすぎて暑くなってしまったときに

使うことができるとのこと。


これで仕事の効率が上がるのならば、

大きく元をとることができるかと考えています。





参考文献:購入にあたって調べたサイト

http://pc.watch.impress.co.jp/docs/topic/feature/20100702_377991.html


購入したUSB扇風機

http://www.sanwa.co.jp/product/syohin.asp?code=USB-TOY50

外部ディスプレイを購入しました。


設定は主に2通りあります。

①本体と同じ画面を表示させる

②デスクトップ画面の拡張とする


この②の使い方をしている方を会社で見かけ、

「おぉーこれは便利!」と思い、衝動買いしてみたのですが、

家で使う分には全然使う機会がありませんw


しかも、なんか安かったので買ってしまいましたが、

画面サイズがノートPCの2倍もありました。

・・置き場所に困る!


現在、外部ディスプレイでウェブサイトを開きながら

本体ディスプレイでブログ更新作業を行っています。


調べものや勉強をするとき、また、

もう一つのノートPCで①の使い方をして

活躍させようかと思います。


あと、この画面でDVDでも再生させれば、

なかなか迫力があるんじゃないかな。



さて、画面の大きさに関連して、

今回は「解像度」の話をしましょう。


解像度は、簡潔に言いますと、

画面における、画素の密度のことです。


もうちょっと詳しく言いますと、

画像を構成する要素の細かさのことです。


この数値が低いほどモザイクのような粗い画像となり、

大きければ細かな描写が可能となります。


PCでは、一般的には[1024×768](横:縦=4:3)が

「画面解像度」と呼ばれ、この設定がよく使われています。


最近のノートPCには、横にちょっと広がった、ワイドな画面のものがあります。

それらの解像度は主に[1280×800](16:10)のようです。


ちなみに、地上デジタルの解像度は[1440×1080](4:3)みたいですね。


画面サイズが大きいディスプレイは、

解像度を小さくすれば文字やウィンドウが拡大され、

解像度を大きくすれば画面を広く扱えます。



今回購入した外部ディスプレイ。

本来の推奨解像度は[1920×1080]ですが、

本体の画面に合わせて[1280×768]にしてあります。


解像度が小さくなっていますので、

全体的に拡大表示されていて、ちょっと違和感がありますね。



・参考文献:wikipedia

http://ja.wikipedia.org/wiki/%E7%94%BB%E9%9D%A2%E8%A7%A3%E5%83%8F%E5%BA%A6