何を作るからちと考える(´・ω・)ス
以前、たしか独自のブラウザ作る所で業務でとん挫だったような。
その間にアメブロやら巡回先はインターフェイスがずいぶん変わってたり。
HTMLのコード抜き出す部分が多かったから、
そうなると作り変えも必須(´・ω・)ス
では、アメブロ専門のブラウザでも作るか。
早速、オレオレ要件定義でも。
1.ぺタリストやコメントのIDを保存して、どれくらいの頻度か保存
2.IDの保存はCSVファイル形式で保存
3.リストはDatasetで持たせて、Gridviewでクリックで移動など。
4.禁止リストなど記録
5.【追記】プロフィール画像も保存して表示。
おk、ここまでなら安価にできそう。
問題は、HTMLのソースで正規表現で抜くのが面倒ぐらいか。
さっそく途中までやってみるか。
作業があるのであと30分でできる範囲で♪
// ちと作業中
01:59 作業開始
まずはぺタのURL確認、トップはhttp://peta.ameba.jp/p/showPeta.doはおk
http://peta.ameba.jp/p/showPeta.do?pageNo=ページ&allCount=カウント数
ここもおk
http://peta.ameba.jp/p/showPeta.do?pageNo=1
http://peta.ameba.jp/p/showPeta.do?pageNo=2
http://peta.ameba.jp/p/showPeta.do?pageNo=3
なんて巡回もおk
1ページには20ぺタがされているので、
単純に割れば全て取得おkかな?一応テスト。おkこれもおk
次はソースコード
各該当の部分は、
<li class="clearFix">
<h3><span class="prfImg">
<a href="http://profile.ameba.jp/【アメーバID】/">
<img src="http://stat.profile.ameba.jp/profile_images/20120528/00/cb/94/j/t004000401338134385274.jpg" alt="" onload="imageResize(this,'40');"></a>
</span>
<a href="http://profile.ameba.jp/【アメーバID】/">
</h3>
<ul id="listLink">
<li>
<a href="http://ameblo.jp/【アメーバID】/" title="【ニックネーム】のブログ">
ブログ
</a></li>
<li><a href="http://now.ameba.jp/【アメーバID】/" title="【ニックネーム】のなう">なう</a></li>
<li><a href="http://group.ameba.jp/user/groups/【アメーバID】/" title="【ニックネーム】のグルっぽ">グルっぽ</a></li>
<li class="last"><a href="http://pigg.ameba.jp/?targetAmebaId=【アメーバID】" target="_blank">ピグの部屋</a></li>
</ul>
<p class="dateTxt">01時53分
</p>
<p class="deleteIcon">
削除ボタン
</p>
<p class="rootName">
<a href="http://profile.ameba.jp/konica/">プロフィール</a>から
</p>
</li>
そうなると、画像も欲しいな。
一応入れておくか。
まずは、WEBブラウザフォームに追加して、
タイマーで、
nowdoing = "ペタ取得開始";
webBrowser1.Navigate(pata_url + pageNo);
とかぶっぱなすか。
あとは正規表現でバンバン抜く。
・・・・お、時間、続きは明日でも。
そんな記録。
その間にアメブロやら巡回先はインターフェイスがずいぶん変わってたり。
HTMLのコード抜き出す部分が多かったから、
そうなると作り変えも必須(´・ω・)ス
では、アメブロ専門のブラウザでも作るか。
早速、オレオレ要件定義でも。
1.ぺタリストやコメントのIDを保存して、どれくらいの頻度か保存
2.IDの保存はCSVファイル形式で保存
3.リストはDatasetで持たせて、Gridviewでクリックで移動など。
4.禁止リストなど記録
5.【追記】プロフィール画像も保存して表示。
おk、ここまでなら安価にできそう。
問題は、HTMLのソースで正規表現で抜くのが面倒ぐらいか。
さっそく途中までやってみるか。
作業があるのであと30分でできる範囲で♪
// ちと作業中
01:59 作業開始
まずはぺタのURL確認、トップはhttp://peta.ameba.jp/p/showPeta.doはおk
http://peta.ameba.jp/p/showPeta.do?pageNo=ページ&allCount=カウント数
ここもおk
http://peta.ameba.jp/p/showPeta.do?pageNo=1
http://peta.ameba.jp/p/showPeta.do?pageNo=2
http://peta.ameba.jp/p/showPeta.do?pageNo=3
なんて巡回もおk
1ページには20ぺタがされているので、
単純に割れば全て取得おkかな?一応テスト。おkこれもおk
次はソースコード
各該当の部分は、
<li class="clearFix">
<h3><span class="prfImg">
<a href="http://profile.ameba.jp/【アメーバID】/">
<img src="http://stat.profile.ameba.jp/profile_images/20120528/00/cb/94/j/t004000401338134385274.jpg" alt="" onload="imageResize(this,'40');"></a>
</span>
<a href="http://profile.ameba.jp/【アメーバID】/">
</h3>
<ul id="listLink">
<li>
<a href="http://ameblo.jp/【アメーバID】/" title="【ニックネーム】のブログ">
ブログ
</a></li>
<li><a href="http://now.ameba.jp/【アメーバID】/" title="【ニックネーム】のなう">なう</a></li>
<li><a href="http://group.ameba.jp/user/groups/【アメーバID】/" title="【ニックネーム】のグルっぽ">グルっぽ</a></li>
<li class="last"><a href="http://pigg.ameba.jp/?targetAmebaId=【アメーバID】" target="_blank">ピグの部屋</a></li>
</ul>
<p class="dateTxt">01時53分
</p>
<p class="deleteIcon">
削除ボタン
</p>
<p class="rootName">
<a href="http://profile.ameba.jp/konica/">プロフィール</a>から
</p>
</li>
そうなると、画像も欲しいな。
一応入れておくか。
まずは、WEBブラウザフォームに追加して、
タイマーで、
nowdoing = "ペタ取得開始";
webBrowser1.Navigate(pata_url + pageNo);
とかぶっぱなすか。
あとは正規表現でバンバン抜く。
・・・・お、時間、続きは明日でも。
そんな記録。