WEB上のリソースを取得し、解析したい人はたくさんいるのでは?・・・と思い次のサンプルコードを掲載してみます。
-- code ------------
System.Net.WebClient client = new System.Net.WebClient();
// ユーザエージェントの設定
string userAgent = "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727)";
client.Headers.Add("user-agent", userAgent);
// URLの指定
string url = "http://ameblo.jp/only-human/ ";
// バイトで取得
byte[] downloadBytes = client.DownloadData(url);
// 文字コード指定
System.Text.Encoding encoding = System.Text.Encoding.GetEncoding("EUC-JP");
Console.WriteLine(encoding.GetString(downloadBytes));
-------------------
こんな感じですかね?
最初から文字コードがわかっている場合は、WebClientクラスのEncodingプロパティを指定し、DownloadDataメソッドの代わりに、DownloadStringを利用すれば、一回で文字列を取得するこも可能。
後は正規表現等を利用し解析すれば、色々とオリジナルの解析ソフトも自由自在に作れるはずでわ。