Posts on seaborn

機械学習ネタ。ピアソンの相関係数をヒートマップ化してプロットするには。

Udemyのデータサイエンス講習は一通りやってしまったので、復習するのもいいけど何か新しいことをやりたいと思い… これを買ってしまいました。 Python機械学習プログラミング 達人データサイエンティストによる理論と実践 impress top gearシリーズ[Kindle版]posted with ヨメレバSebastian Raschka,株式会社クイープ,福島 真太朗 インプレス 2016-06-30 KindleAmazon[書籍版] 大学数学から離れて10年以上立つので正直きついですが、かなり掘り下げて解説してくれるので理解が深まります。 その中でも、やってみて面白かったことを備忘録と練習を兼ねて、本書とは別のデータセット、irisデータを使い、特徴量同士の相関をヒートマップ化してみようと思います。 まずは特徴量同士のpairplot出力を見てみます。 この図を出すには、以下のようにします。 import numpy as np import seaborn as sns import pandas as pd from sklearn.datasets import load_iris iris = load_iris() iris_df = pd.…

実践 Python データサイエンス@Udemy の理解度を試すために、使用電力量と電気代推移データを使って実践してみる

現在、実践 Python データサイエンス講習を3分の1程度消化したところ。 初学者でも分りやすい構成で、とても良いです。 ただ、言われた通りに練習しているだけだと身についた感じがしないので、これまでの「numpyを知ろう」「pandas入門」辺りの内容を組み合わせて、自前のデータを可視化してみます。 使うのは以下のデータです。東電の電気家計簿から取得した、我が家の月ごとの消費電力量と電気代。 これをexcelファイルとしてダウンロードしてDataFrame化した後、単純にbarplotしてみると、こうなります。 import pandas as pd import seaborn as sns data = pd.read_excel("Downloads/evaluation of solar power plant.xlsx", sheetname="(log) tepco") sns.barplot(x="年月", y="使用量総計(kWh/月)", data=data) sns.plt.…

データの可視化をseabornでお手軽に。

文字化け解消法で紹介したmatplotlibですが、使いこなせる気が全くしないのが正直なところ。 だってこのキーワード引数の多さったら… 覚えきれませんよ。 plot関数だけでも指定可能な引数は30以上かな。 http://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.plot Property Description agg_filter unknown alpha float (0.0 transparent through 1.0 opaque) animated [True | False] antialiased or aa [True | False] axes an Axes instance clip_box a matplotlib.transforms.Bbox instance clip_on [True | False] ... それでいて出来上がるのはこんなダサいグラフ。 頑張れば綺麗なグラフも描画できるみたいなんですけど、…