読者です 読者をやめる 読者になる 読者になる

たかきろぐ

「自動運転」「情報系大学」「雑記」をだらだらと書いています

MENU

pandas-APIマラソン始めました

最近業務でpythonをいじっているのだけど,優秀なパッケージが多い.

中でもpandas, matplotlib, numpy なんかは便利なんだと思う.(機会学習系のことをやりたいならscikit-learn.DNNを試したいならtheano, Kerasなんかがあるし.)

「なんだと思う」っていうのは,使い慣れていないから,それを調べたりするのに時間がかかる.pandasなんかはリレーショナルモデルのデータに対する操作を簡単に行えるのだけど,SQLほど直感的には書けない.

というわけで,これらのパッケージの使い方をさらってしまおうかと思っている.

まずはpandasから,pandasのAPIリファレンスって舌ったらずでわかりにくいんだよね.だから,やることは単純で,pandas.DataFrame型のattributeとmethod全てに関して一度サンプルコードを書き,備忘録として残しておく.要点なんかをまとめたブログはたくさんあるけど,網羅的にやってる人いないみたいだし.

APIは総数159個.今9個目を書き終わった.2ヶ月以内には完走したい.

「pandas-APIマラソン」でググってみてね.