とある会社から、中国商標(ロゴ)の調査依頼がありました。

これまでは、複数人の在宅ワーカーに依頼して、ロゴの調査を依頼していたが、多すぎる情報量、サイトの閲覧制限、サイト混雑による頻繁な接続障害等の理由で、1年間納品が滞っており、社員も土日出勤せざるを得ない状況とのこと。
ご連絡を受け、内容を把握した上で実施可能の返答とともに業務開始。
企業様から依頼されたページ数(20万ページ)を元に人力精査は不可能と判断し、すぐに自動化できないか調査を開始しました。
サイトの不安定性(画面が真っ白に表示されることあり)、膨大なページ数、情報の不確実性(表示されている項目と判断元になるデータに差異がある)、早目の対応が求められたため
自動精査→目視作業(約8時間)の手順で作業を実施し、約10日間で作業を完了させることができました。(実稼動約3人日)

内訳ですが、プログラムを組み、夜間に自動精査することで20万ページあった調査対象を1.5万ページまで絞込み(所要日数:3日間【プラグラムもスレッド式に起動させ効率を上げました】)、その後は目視判断で精査した上でデータのとりまとめを実施しました。
プログラムとしてはさほど難しくはありませんが、サイトの特殊性による、取得したはずの情報が正確でない可能性があるという点が一番ネックでした。
まず正確な情報が取得できたときの指標を把握しておき、自動精査の際にはその指標が確認できるまでページを精査しました。

濃霧は無事完了し、現在では継続してご利用いただいております。
社員の土日出勤もなくなり業務フローも改善されたとのこと。

具体的には15人の在宅ワーカーに依頼→定期的に社内にて取りまとめていたフローが
1箇所に依頼→情報が整理された状態で納品することで、1元管理化、土日出勤もなくなり、社員の稼動も削減できた事例になります。