Pythonのデータフレームの欠損値(NaN)を埋める際にfillnaメソッド
が使用される。
df.fillna(0)
とすれば、データフレームdfの欠損値を0に変えたものが得られる。
実際にデータフレームの値を変更するためには、
df = df.fillna(0)
と代入するか、df.fillna(0,inplace=True)とする必要がある。
平均値や中央値を使って埋める場合もある。
列名'A','B','C'’の各列ごとに違う値を埋める場合には、辞書型を使用し
df.fillna({'A':10,'B':20,'C':30}) などとする。
直前、または直後のデータで埋めるには、
df.fillna(method='ffill')
df.fillna(method='bfill')
としていたが、pandas 2.1.0以降、、
df.ffill()
df.bfill()
が使われることになった。
いずれ df.ffill(),df.bfill()に統合される見込みである。
が使用される。
df.fillna(0)
とすれば、データフレームdfの欠損値を0に変えたものが得られる。
実際にデータフレームの値を変更するためには、
df = df.fillna(0)
と代入するか、df.fillna(0,inplace=True)とする必要がある。
平均値や中央値を使って埋める場合もある。
列名'A','B','C'’の各列ごとに違う値を埋める場合には、辞書型を使用し
df.fillna({'A':10,'B':20,'C':30}) などとする。
直前、または直後のデータで埋めるには、
df.fillna(method='ffill')
df.fillna(method='bfill')
としていたが、pandas 2.1.0以降、、
df.ffill()
df.bfill()
が使われることになった。
いずれ df.ffill(),df.bfill()に統合される見込みである。