サイトを運営されている方、SEOを実施されている方であれば「site:」というコマンドを一度は使用した事が
あるのではないでしょうか?
「site:」は対象サイトのindex数が認識できる便利なコマンドで、
自分のサイトがどのくらいindexされたのか?indexされているページはどこか?を知るのに非常に役立ちます。
しかしながら、確認できる件数には制限があり、大規模なサイトとなると全てを見る事ができません。
例えば、「www.cyberagent.co.jp」で調べてみると、

と、index総数は2,810件あるのに対し、

の様に、1,000件目までしか確認する事ができません。
では、どのように全てを確認すれば良いのでしょう?
それは、「site:」と併せて「inurl:」コマンドを併用する事で、幾分解決に向かいます。
「inurl:」は、URL内に「:」以下に入れたキーワードが含まれるサイトを検索する機能ですが、
これを併用する事で、「site:」の検索結果から、さらに「inurl:」のキーワードを含むURLを絞る事ができます。
例えば、「site:www.cyberagent.co.jp inurl:press」で検索すると、

のように、「site:」の結果から、URL内に「press」を含むもののみを表示しています。
その数784件。
ディレクトリ構造がきれいに作られているサイトであれば、それぞれのディレクトリ、カテゴリごとに
上記の検索をすれば、全て(に近い)indexを確認する事ができそうです。
ただ、「inurl:」は通常、句読点を無視するようですので、
「/blog」と「blog.」の結果は同じものとなる場合が多いとの事。
この結果はケースバイケースで違うようですので、確認していく必要がありますね。
また、複数の「inurl:」を組み合わせて使用する事もできます。
これは、「AND」や「OR」を使って、
「site:www.cyberagent.co.jp inurl:press AND inurl:news」
「site:www.cyberagent.co.jp inurl:press OR inurl:service」
と検索するものです。
さらに、「-inurl:」で対象キーワードを含む結果を削除する事もできますので、
一度試してみてはいかがでしょうか?
[参照・引用]
Cracking Google's 1,000 Page Barrier /SEOmoz
(石田)