MySQLへとっておきの情報を蓄えるのに、ネットのページやメールを情報源にしたら楽にデータ収集が可能になるのではと思い立って二ヶ月位経った。
先ずはiTunesの受領通知メールからアプリやミュージックの購買履歴をMySQLへ登録する「メール登録オペレータ」の制作から始めた。
途中未知のエンコーディングや文字化けに遭遇したが、データ収集の肝となるテーブルパーサーがここに来て漸く完成した。
このテーブルパーサーというのはHTMLのTABLEタグを解析し配列に格納するもので、このパーサーを通すことで必要なデータを列と行を指定するだけで取り出すことができる。
因みに受領通知メールでは、2番テーブルの1行1列のところに受取日、注文番号、請求先が改行して収納されて、アプリ名が4番テーブルの4列の1行に収納され複数ある場合は5列、6列の1行にと空白行になるまで収納されている。
このパーサーは、他のネットのページに対しても使えるハズなので検証してみたい。もし汎用性が高い物だと実証できたらネットからの情報収集に大きな武器となるだろう。
この検証結果は、別の機会に報告したいと思う。
少し見づらいと思うが、このテーブルパースの骨格を表す状態遷移図を載せてみる。
次回はいよいよスルーテスト(結合テスト)の経過についてまとめてみます。

先ずはiTunesの受領通知メールからアプリやミュージックの購買履歴をMySQLへ登録する「メール登録オペレータ」の制作から始めた。
途中未知のエンコーディングや文字化けに遭遇したが、データ収集の肝となるテーブルパーサーがここに来て漸く完成した。
このテーブルパーサーというのはHTMLのTABLEタグを解析し配列に格納するもので、このパーサーを通すことで必要なデータを列と行を指定するだけで取り出すことができる。
因みに受領通知メールでは、2番テーブルの1行1列のところに受取日、注文番号、請求先が改行して収納されて、アプリ名が4番テーブルの4列の1行に収納され複数ある場合は5列、6列の1行にと空白行になるまで収納されている。
このパーサーは、他のネットのページに対しても使えるハズなので検証してみたい。もし汎用性が高い物だと実証できたらネットからの情報収集に大きな武器となるだろう。
この検証結果は、別の機会に報告したいと思う。
少し見づらいと思うが、このテーブルパースの骨格を表す状態遷移図を載せてみる。
次回はいよいよスルーテスト(結合テスト)の経過についてまとめてみます。
