pandas
データフレーム型を扱うときに0.0を欠損値(NaN)にしたい場面は多い(私の場合) 今までは import pandas as pd a = pd.read_csv("sample.csv") で読み込み import numpy as np b = np.array(a) でnumpyの配列に変換し for n in range(b.size): if b[n] == 0.…
今回はpandasを使ってデータフレーム型のcolumnsとindexの名前を変える方法をかる〜く紹介 >>>data a b 0 4.5 2.1 1 5.4 8.3 2 7.6 5.5dataに対して名前を変更する >>>data.columns = ['name1','name2'] >>>data.index = ['index0','index1','index2'] >>>da…
筆者が研究中にcsv形式のデータをwekaに読みこませるとエラーが出たので,原因部分を特定するために書いたワンライナーをメモpythonのpandasなどでは統計量をまとめて取得できる. import pandas as pd data = pd.read_csv("sample.csv") a = data.describe() …
pandasを使ってデータフレーム(DataFrame)型のデータをいじる方法をメモ. 私がよく使うものだけ.まず import pandas as pd pdが一般的らしい. そしてcsvファイルを読み込む(csvとはカンマ区切りのデータ,スペース区切りはssv,タブ区切りはtsv). オプショ…