Booking.comは、世界最大規模の旅行ECサイトです。オランダ・アムステルダムに本拠地を置き、世界70カ国・198の支社を展開しているOTAの世界最大手。日本では楽天トラベルと2016年2月より海外ホテル予約サービスに関して提携し、一部地域に対する在庫提供を開始しています。旅館やバケーションレンタルを含む合計2,904万件ものリスティングを掲載しており、宿泊予約コンテンツとしては世界最大級の利用実績があります。世界最大規模の旅行ECサイトです。

スクレイピングツールの概要

ScrapeStormは、AIを使用した視覚的なWebスクレイピングツールです。プログラミングが必要なく、ほぼすべてのWebサイトからデータを抽出できます。強い機能を持って、使いやすいです。 URLを入力だけで、自動的に抽出するデータと次のページボタンを識別できます。複雑なルール設定が必要ないし、ただクリックしてスクレイピングができます。

ScrapeStormにより、大量のWebデータを素早く正確的に取得できます。手動でデータ抽出が直面するさまざまな問題を完全に解決し、情報取得のコストを削減し、作業効率を向上させます。

1.タスクを新規作成する

(1)BookingのURLをコピーする

まず、「すべてクチコミを見る」をクリックして、すべてのクチコミを表示させます。そしてWebページのURLをコピーしてください。

詳細には下記のチュートリアルをご参照ください。

URLを正しく入力する方法

(2)スマートモードタスクを新規作成する

ソフトウェアのホムページ画面に新規作成できます。持っているタスクをインポートすることもできます。

詳細には下記のチュートリアルをご参照ください。

URLを正しく入力する方法

2.タスクを構成する

(1)リストを選択する

①ソフトウェアの自動識別されたデータをクリアします。

②ページタイプの設定機能を利用して、リストをページで選択します。

ページタイプの設定詳細には下記のチュートリアルをご参照ください。

ページタイプの設定

(2)フィールドの編集と追加

必要に応じてフィールドの名前の変更または削除、結合できます。

フィールドの追加には、「フィールドを追加」ボタンをクリックして、画面に抽出するデータを選択、データが自動的に抽出されます。

フィールドの設定の詳細には下記のチュートリアルをご参照ください。

抽出されたフィールドを配置する方法

(3)Xpathの編集

クチコミ画面のページボタン識別にはXpathの編集が必要です。Xpathと編集手順は下記のようにご覧ください。Xpath【//a[contains(@class,'pagenext')]】

3.タスクの設定と起動

(1)起動の設定

ソフトウェアは数多くの機能を提供します。必要に応じて、スケジュール、アンチブロック、自動エクスポート、画像のダウンロード、スピードブーストを設定できます。

タスク起動の設定詳細には下記のチュートリアルをご参照ください。

スクレイピングタスクを配置する方法

(2)しばらくすると、データがスクレイピングされます。

4.抽出されたデータのエクスポートと表示

(1)エクスポートをクリックして、データをダウンロードしする

(2)必要に応じてエクスポートする形式を選択します。

ScrapeStormは、Excel、csv、html、txt、データベース、ローカルなどさまざまなエクスポート方法を提供します。ライトプラン以上のユーザーは、WordPressに直接投稿することもできます。

抽出結果を表示し、抽出されたデータを消去する方法の詳細には下記のチュートリアルをご参照ください。

抽出されたデータの表示と消去する方法

抽出結果のエクスポート方法の詳細には下記のチュートリアルをご参照ください。

抽出されたデータのエクスポート方法