Excelの表を分析Panddas
pandasでExcelファイル(拡張子:.xlsx, .xls)をpandas.DataFrameとして読み込むには、pandas.read_excel()関数を使う。
ここでは以下の内容について説明する。
- openpyxl, xlrdのインストール
- pandas.read_excel()の基本的な使い方
- 読み込むシートを番号・シート名で指定: 引数sheet_name
- 一つのシートを読み込み
- 複数のシートを読み込み
- すべてのシートを読み込み
- ヘッダー、インデックスを指定: 引数header, index_col
- 読み込む列、読み込まない行を指定: 引数usecols, skiprows, skipfooter
以下のxlsxファイルを例とする。
sheet1とsheet2の二つのシートを持つ。それぞれの中身は以下の通り。
sheet1。
A B C
one 11 12 13
two 21 22 23
three 31 32 33
sheet2。
AA BB CC
ONE 11 12 13
TWO 21 22 23
THREE 31 32 33
pandasでcsv/tsvファイル読み込み(read_csv, read_table)
pandasでCSVファイルやTSVファイルをDataFrameとして読み込むにはread_csv()を使う。