検索のスキルを上げよう【音楽ファイルの探し方】 | タダのブログ:ネット内外からいろいろと

検索のスキルを上げよう【音楽ファイルの探し方】

GIGAZINEさんのMP3ファイルの探し方についての記事。特に目新しいものでは無いんだが、こういう事を書く事は凄く意義があると思ったので、書いてみる。
フレーズ検索とか排他語句指定、サイト指定とか使いこなせるだけで、かかる時間が全然違うからね。

検索記事について考えることは、先日cnetで書いたgoogleマップの情報流出の話にも関連する。ユーザが必要な技術や知識をもつことはリテラシー面からも意義のあることと考えているからだ。

さて、と。本題に戻る。
googleに、ある語句を入れて検索すると、MP3が見つかるかも?!て話なんだけど、「MP3を探すため」と考えずに、「検索スキルを上げるため」と考えればこういう考え方は大変有意義だと思う。これをただコピペして音楽ファイルをあさるだけでなく、画像ファイルで考えるとか、関連するPDFを探すとか、いろんな用途が考えられる。

最初に、どうしてこういうことが可能か?て話。
Webサーバにはapacheというのが多く使われてるんだけど、コイツは、それぞれのディレクトリ(フォルダ)に「index.html」というファイルが存在しないと、ファイルの一覧を自動生成してくれる、という機能がある。普段は、セキュリティ対策上、この機能をオフにするんだけど、たまに漏れのあるサーバがあるって話。

で、バージョンにもよるんだけど、必ず、以下のような特徴がみつかる。
・タイトルは、「Index of フォルダ名」となる
・上の階層に上がるボタン「parent directory」が付与される
・一覧には、"name" "size" "last modified" "description"が表示される

上記の共通項に加えて、下記共通項が加わる。
・そもそも、探してるのは、mp3ファイルかmp4ファイル、aviファイル…である
・探しているのはXXXXというミュージシャンである

以上の条件を踏まえてgoogleさんに紹介されていた検索式を見てみる。

-inurl:(htm|html|php) intitle:"index of" +"last modified" +"parent directory" +description +size +(wma|mp3) "<バンド名/歌名>"

ちょっと長いので改行してみる。
-inurl:(htm|html|php) アドレスにhtmlやhtm、phpといった言葉を含まないこと(排他語句指定)ぎjy
intitle:"index of" タイトルに「index of」が含まれること
+"last modified" 本文にlast modifiedと言う言葉が含まれること
+"parent directory" 本文にlast modifiedと言う言葉が含まれること
+description 本文にdescriptionと言う言葉が含まれること
+size 本文にsizeと言う言葉が含まれること
+(wma|mp3) 本文にmp3もしくはwmaと言う言葉が含まれること
"<バンド名/歌名>"

ということになる(+は省略可)。

引用符(”)で囲まれてるのは、たとえば、
「山田家の人々」で検索した場合、引用符が無いと、本文に「山田家」と「の」と「人々」があるページが該当するけど、引用符をつけると「山田家の人々」という言葉があるページが検索結果にひっかかる(フレーズ検索)という機能です。

で、改めて見直すと、もうちょっと削ったり、拡張ができそうな感じがする。

intitle:"index of" "parent directory" "size" "last modified" "description" (mp4|mp3|avi|ogg|wmv|mov|flv|3gp) 歌手名および曲名(動画タイトルも可)

これでもいけるんじゃないかな?
intitle:"index of" タイトルに「index of」が含まれること
"last modified" 本文にlast modifiedと言う言葉が含まれること
"parent directory" 本文にlast modifiedと言う言葉が含まれること
description本文にdescriptionと言う言葉が含まれること
size 本文にsizeと言う言葉が含まれること
(mp4|mp3|avi|ogg|wmv|mov|flv|3gp) 本文にmp4かmp3かaviかwmvかmov、flv、3gpと言う言葉が含まれること
歌手名および曲名(動画タイトルも可)


なので、含まれる拡張子を制限して、下記のように検索すれば、メルマガ顧客リストや、購入データ一覧、プレゼンの資料や雑誌の原稿?なんかが結構出てくる(検索語句に『一覧』とか『会員』とか『list』や『secret』なんて語句をつけるといいかもね)

intitle:"index of" "parent directory" "size" "last modified" "description" (xls|pdf|txt|doc)

こんなのハッキングでも何でもなくて、当たり前にできて当然だと思うし、検索スキルを考える上ではいい記事だなぁ、て思ったんで、こんな文章を書いてみた。
検索フォームに指定語句を付与させるようなフォームを作ってもいいかなぁ、とも思ったりしたんだけど、それだとリテラシーの向上に繋がらないし、そのためにわざわざページ作るのも何だしな~と思ってやめてみた。そうやって考えると、楽すること、とリテラシーの向上って反比例の関係にあるのかもしれないな…

まぁ、いろいろ書いてみましたが、検索スキルを向上させるきっかけにでもなれば幸いです。

【追記】
パソコンが得意って思われるやつは、だいたいタイピングが早いか検索するのが上手いかのどっちかだよなという記事を読んでて、うまい検索、ヘタな検索というのが分からないという人がいたので、TBしてみました。