勉強したこと20171108

Schoo エンジニアのためのベイズ統計学1~2 エンジニアのためのベイズ統計学 logを利用する理由 一番勉強になったのは、2限目の途中で紹介があった、logを使う理由。 logを使うと、掛け算を足し算に、割り算を引き算に変換することができる。 掛け算 2 x 3 = …

勉強したこと 20171107

だいぶん期間が空いてしまった。 が、再開。 今回は、統計学入門−第1章 は一旦おいておいて、Graph DBについてと決定木についてをまとめる。 Graph DBとは ノードとリレーション、プロパティでネットワーク構造を記録する事ができるDB。 NoSQLの一種。 RDBだ…

勉強したこと 20171024

統計学入門−第1章 1.5 有意性検定の考え方 をよんでもはっきりと理解できなかったので、 以前読んだ統計学入門のt検定の箇所を再度読んでみた。 わかってなかったこと わかってなかった事としては、 「分布」の扱いというかイメージが全然できてなかったとい…

勉強したこと 20171023

統計学入門−第1章 1.5 有意性検定の考え方 期間が空いてしまったが、再度勉強再開。 優位性検定について再度読んだ。 標準誤差をちゃんと理解していなかったという事がわかった。 標準誤差とは、標本平均の標準偏差の事。 例数が増えれば増えるほど小さくな…

勉強したこと 20171018

統計学入門−第1章 1.5 有意性検定の考え方 優位性検定の基本は、標本集団を観測したとして、それを元に母集団を想定するというよりは、母集団がそもそもあるというイメージを持つこと。 仮説のたてかたも。 たまたま標本集団の平均値が60だとしたら、 その仮…

勉強したこと 20171017

統計学入門 1.1 ~ 1.4 統計学とは? * 要約値や代表値を用いて、事象を計る学問 * 記述統計学。データを説明 * 推測統計学、母集合を推測 要約* 標準偏差。データのばらつき。 * 標準誤差。標本平均のばらつき。 推定と検定 * 区間推定。信頼区間に標本平均…

勉強したこと 20171016

データサイエンティスト講義 14.3 ~ 最後まで 流し読みした。 * MapResuce * 生徒たちの声 * 次世代のデータサイエンティスト 心持ちの話がメイン。 問題を解決する、データサイエンティストであれ的な話。 Deep Leaning 第一章 * 機械学習の歴史 サイバネテ…

勉強した事 20171015

データサイエンス講義 4.3~14.4 流し読みした程度 * ロジスティック回帰のイメージ。回帰をlogit関数で行う * 決定木のイメージ。2つに分類していって、枝を増やしつづける。 * ネットワークの分析。何か他の手法が必要 * 可視化。芸術的な表現が可能。とい…

勉強した事 20171014

データサイエンス講義 4.1 ~ 4.2.3 スパムフィルタの構築 * 線形回帰で2値の判定を行う事は適切ではない * k近傍法でスパムフィルタを構築するのは、計算時間が非常にかかる * また、特徴が高次元すぎる(単語数)ので、最近傍な点間の距離であっても非常に…

今勉強している事

ゼロから始めるディープラーニング www.oreilly.co.jp データサイエンス講義 www.oreilly.co.jp Pythonによるデータ分析入門 https://www.amazon.co.jp/Python%E3%81%AB%E3%82%88%E3%82%8B%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86%E6%9E%90%E5%85%A5%E9%96%80-…