練習
JupyterにおけるPandasのテーブルデータの出力に色をつけてわかりやすくしたい。 そのためには、pandasのstyle周りをいじれば良いみたい。 基本的にドキュメントのUser Guideベースで書いていく。 pandas.pydata.org pandas.pydata.org styleのいじり方は2つ…
ggplotをきれいに見せるパッケージlemonを動かしたので紹介。 基本的に公式ベース github.com facetしたときの軸目盛りの明示 以下のようなデータがあるとする。 library(tidyeval) g = mtcars %>% # ggplot(aes(wt, mpg)) + ggplot(aes(wt, mpg, color = fa…
これはなにか 最近pandasを触っているが、色々なことにモヤモヤしている。 例えば、人によっては書き方がdf[[絞りたい行条件],[列1, 列2]]みたいな書き方なので、df %>% select(列1, 列2) %>% filter(絞り込みたい行条件)に慣れた身からすると可読性が悪い。…
前回では以下のようなModelを考えた。 tが閉店日の場合、 それ以外の場合、 knknkn.hatenablog.com だが、結果としてsamplingがおこなわなかった。そのため、今回もプロットは無しで理屈のみ。。。 前回のモデルと今回のモデルの差 前回のモデルは「ある1店…
注)本記事は途中で詰まったので結局モデル立てただけで結果は出てません。 状態空間モデルの勉強をしたものの、手を動かしていないので練習。 データ kaggleのrossmann-storeコンペ。 Rossmann Store Sales | Kaggle カラム名の意味とかはここにまとまって…
続き。 Rではじめるデータサイエンス作者:Hadley Wickham,Garrett Grolemund発売日: 2017/10/25メディア: 単行本(ソフトカバー) なお、目的は思い出すためなので割と省略している。 knknkn.hatenablog.com knknkn.hatenablog.com 3-2.演習 1.次のようなフ…
続き。 Rではじめるデータサイエンス作者:Hadley Wickham,Garrett Grolemund発売日: 2017/10/25メディア: 単行本(ソフトカバー) knknkn.hatenablog.com 1.5演習問題 1. 連続変数でファセットを作るとどうなるか。 ggplot(data = mpg) + geom_point(mapping…
tidyverse系を思い出すためにHadley神の「Rではじめるデータサイエンス」の演習問題をやる。 Rではじめるデータサイエンス作者:Hadley Wickham,Garrett Grolemund発売日: 2017/10/25メディア: 単行本(ソフトカバー) ちなみに英語版はここで読める。 r4ds.h…