ウエブページの表から文字データを取り込む
ウエブページ上の文字データで、表形式になっているものを、エクセルを使って活用する方法を解説します。
例として、厚生労働省HPから特定保健用食品の規格について解説した表を使ってみます。テーブルになっているものは、そのままの形で、エクセルに取り込めます。
特定保健用食品(規格基準型)について
http://www.mhlw.go.jp/topics/bukyoku/iyaku/syoku-anzen/hokenkinou/hyouziseido-1.html
下の画像は、表の一部です
表の部分をブラウザ上で、選択し、「コピー」をします。
エクセルの新規ワークシートに貼り付けと、文字データが表になって取り込まれます。
テーブルに色が付いていたり、画像が配置されている場合、文字データ以外の情報も取り込まれてしまい、取り扱いにくくなります。
また、ウエブサイトへのハイパーリンクが埋め込まれていたりすると、触るたびにそのページにジャンプしてしまい、作業ができません。
そうした余分な情報を排除するには、簡単な方法があります。
下の画像は航空券予約サイトのシーズン毎の料金表をエクセルに貼ったものです。
一度このようにエクセルに貼り付けてから、必要な部分を範囲選択します。
新規ワークシート、または新規ファイルを開きます。
そのシートに「形式を選択して貼り付け」をします。形式は、「値」をチェックします。
すると、書式(装飾情報)が無くなり、文字データだけをコピーすることができます。
次回は、セルのデータを「文字列結合式」を使って文章データにする方法を解説します。