PiTaPa履歴から利用統計を作るbatファイル 解説(03:履歴加工) | のこはんのブログ

のこはんのブログ

主に京阪電車の写真を撮影しています。
ダイヤ解説もやってます。

前回このバッチファイルの本体()は複数のバッチファイルを生成し、それらを順に実行する形になっていると説明しました。今回はどんな工程があるかを説明します。

1.PiTaPa倶楽部からダウンロードしたCSVファイルは計算処理がしにくいので、計算しやすいように加工する。CSVファイルは月ごとに生成されるのでそれらをまとめる。(「PiTaPa履歴ver2.bat」、書き換え用データ「置換.tsv」)

2.バッチファイルの処理に、デリミタ(列の区切り文字、CSVならカンマ)が連続するとき(セルの中身がないとき)は複数あっても一つだけしか認識しない(中身のないセルは飛ばして特定される)という謎仕様があるため、それを回避する目的で空白セルに無意味な文字列「☆」を入れる(「,,」を「,☆,」に変える作業を2回行う。1回だけだと3連続デリミタ以上に対応できない。「,,,」だと「「,,,」と認識され、「,☆,,」になる。もう一度やると、「,☆,,」」と認識され「,☆,☆,」になる)。(「星影.bat」)

3.入出場した駅とその時刻から各乗車毎の移動距離(*0.1km)と入場から出場までの時間を計算し、それらの全合計を算出します。(「京阪距離時間_簡易版.bat」、計算用データ「京阪.tsv」)

4.3.で計算した距離、時間を月ごとに集計します(今後機能を増やしていくつもりです)。(「京阪統計.bat」)

 

この4つを順に実行すると、少し見やすくなった(と思う)履歴CSV(199999.csv)、それに移動距離と利用時間が付け加えられたCSV(京阪距離時間.csv)、月ごとの利用統計(京阪統計.txt)ができるはずです。

これに加えて、説明書(「よんでね.txt」(←ちょっと古いけど気にしないでください))と空白セルを埋めるための「☆」を消す「Stella_Vanishment.bat」が同棝されています。