Posts on machine-learning

MNIST手書き文字機械学習。TensorFlowチュートリアルの前に、scikit-learnのSVMで復習する。その2。

前回惨敗の正答率だった、SVMによるMNIST手書き文字分類。 まずはscikit-learn付属のデータセットで復習してみることにする。 scikit-learn付属の手書き文字データセットは解像度がひどい こんな感じで試してみると、 from sklearn.datasets import load_digits from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score from sklearn.svm import SVC d = load_digits() X_train, X_test, y_train, y_test = train_test_split(d.data, d.target, train_size=0.8) svc = SVC() f…

機械学習ネタ。ピアソンの相関係数をヒートマップ化してプロットするには。

Udemyのデータサイエンス講習は一通りやってしまったので、復習するのもいいけど何か新しいことをやりたいと思い… これを買ってしまいました。 Python機械学習プログラミング 達人データサイエンティストによる理論と実践 impress top gearシリーズ[Kindle版]posted with ヨメレバSebastian Raschka,株式会社クイープ,福島 真太朗 インプレス 2016-06-30 KindleAmazon[書籍版] 大学数学から離れて10年以上立つので正直きついですが、かなり掘り下げて解説してくれるので理解が深まります。 その中でも、やってみて面白かったことを備忘録と練習を兼ねて、本書とは別のデータセット、irisデータを使い、特徴量同士の相関をヒートマップ化してみようと思います。 まずは特徴量同士のpairplot出力を見てみます。 この図を出すには、以下のようにします。 import numpy as np import seaborn as sns import pandas as pd from sklearn.datasets import load_iris iris = load_iris() iris_df = pd.…

機械学習ライブラリTensorFlowの日本語書籍まとめ。

まだ全部は読破できていない上、1冊は発売予定なんですが… Google製機械(深層)学習ライブラリ、TensorFlowの解説本を紹介します。 TensorFlowのフロントエンドがPythonなので、どの書籍もPythonの基本を理解していることが前提の内容となっています。 まずはこちらのポップな表紙の「TensorFlowはじめました」。 TensorFlowはじめました 実践!最新Googleマシンラーニング (NextPublishing)[Kindle版]posted with ヨメレバ有山 圭二 インプレスR&D 2016-07-29 KindleAmazon[書籍版] 本当にTensorFlowとは何なのか? Tensorとは何か? といった、TensorFlow公式ページのチュートリアルを読めば分かるような位置から図解入りで解説してくれます。 Amazonの評価コメントの評価は低いですが、入門としてはとてもお勧めだと思います。自分のような入門者にとっては、概念を図解してくれるだけでも理解のとっかかりになって、有難いものです。 次は、「TensorFlowで学ぶディープラーニング入門」。はい、まだ発売してません。すいません。 TensorFlowで学ぶディープラーニング入門 ~畳み込みニューラルネットワーク徹底解説~posted with ヨメレバ中井 悦司 マイナビ出版 2016-09-28 AmazonKindle楽天ブックス でも上記の書籍は、副題からも、この中井悦司さんが出されている他の書籍を見ても、かなり本格的な内容であることが予想できますね。ニューラルネットワークって… 言葉は知っているけど、技術的にどうこう言われるとガクブルなので、勉強します。…

「不倫」データセットを機械学習して妻の説明変数パラメータを与えたところ、結果は…

結果はシロでした! 不倫しないそうです。(本人に結果報告したら「わかんないよ」と言われましたが…) まずは学習データをロードします。 import pandas as pd import numpy as np from pandas import DataFrame, Series import statsmodels.api as sm X = sm.datasets.fair.load_pandas().data 学習データに対する正解を作ります。 未知のデータ(妻パラメータ)に対する不倫するか(1)しないか(0)の結果を知りたいんですよね。 def is_affairs(affairs): return 1 if affairs > 0 else 0 Y = X.affairs.apply(…