pandasで0の要素を欠損値(NaN)にする方法
データフレーム型を扱うときに0.0を欠損値(NaN)にしたい場面は多い(私の場合)
今までは
import pandas as pd a = pd.read_csv("sample.csv")
で読み込み
import numpy as np b = np.array(a)
でnumpyの配列に変換し
for n in range(b.size): if b[n] == 0.0: b[n] = float(NaN)
で欠損値にしていた.
しかし,この手法は相当面倒である.
またデータフレーム型に直さなければならないし
そこで,画期的(私にとっては)な方法を知ってしまった.
import pandas as pd a = pd.read_csv("sample.csv") b = a[a!=0.0]
これだけでできてしまった.
これまでの苦労は...(こんなことは日常茶飯事なので前向きに)