タウンページ ダウンロード ツール(´・ω・)ス そんな文字まで・・・ | WEB系技術電脳日記

タウンページ ダウンロード ツール(´・ω・)ス そんな文字まで・・・

$WEB系技術電脳日記-タウンページ ダウンロード


タウンページからデータ引き出すツールも稼動。
だが、また問題が。
お店の名前でアルファベットまで含まれていた。
考えてみればそうだが、カタカナで読みだけじゃないのか・・・。
さっそく追加。
//正規表現を設定
RegularExpressions.Regex(@"\b\p{IsHiragana}+\b");
RegularExpressions.Regex(@"\p{IsCJKUnifiedIdeographs}");
RegularExpressions.Regex(@"\p{IsKatakana}");
RegularExpressions.Regex("[A-Z]");

もうお店の名前に〒記号が出たらアウトだ・・・(;´・ω・)・・むぅむぅ・・・