ウエブページの表から文字データを取り込む | 健康情報を考えるブログ

ウエブページの表から文字データを取り込む

ウエブページ上の文字データで、表形式になっているものを、エクセルを使って活用する方法を解説します。

例として、厚生労働省HPから特定保健用食品の規格について解説した表を使ってみます。テーブルになっているものは、そのままの形で、エクセルに取り込めます。


特定保健用食品(規格基準型)について

http://www.mhlw.go.jp/topics/bukyoku/iyaku/syoku-anzen/hokenkinou/hyouziseido-1.html


下の画像は、表の一部です





表の部分をブラウザ上で、選択し、「コピー」をします。





エクセルの新規ワークシートに貼り付けと、文字データが表になって取り込まれます。



テーブルにが付いていたり、画像が配置されている場合、文字データ以外の情報も取り込まれてしまい、取り扱いにくくなります。

また、ウエブサイトへのハイパーリンクが埋め込まれていたりすると、触るたびにそのページにジャンプしてしまい、作業ができません。

そうした余分な情報を排除するには、簡単な方法があります。


下の画像は航空券予約サイトのシーズン毎の料金表をエクセルに貼ったものです。



一度このようにエクセルに貼り付けてから、必要な部分を範囲選択します。


新規ワークシート、または新規ファイルを開きます。


そのシートに「形式を選択して貼り付け」をします。形式は、「値」をチェックします。




すると、書式(装飾情報)が無くなり、文字データだけをコピーすることができます。




次回は、セルのデータを「文字列結合式」を使って文章データにする方法を解説します。