楽にEDA初手ができそうなSweetvizメモ

使い方メモ(ライブラリ) 可視化メモ

EDA初手としてpandas_profilingが有名だがデータ数が多いとめちゃくちゃ時間がかかるのであまり好きではない。 Sweetvizが高速かつ、データ比較もできるようなので雑に試す。 github.com 1データの場合 import sweetviz as sv my_report = sv.analyze(df) my…

2021-05-20

Evidentlyで機械学習モデルの挙動を可視化する

Python 使い方メモ(ライブラリ) 可視化機械学習

背景機械学習モデルは作成後にそのモデルがどのような振る舞いをするのか調べる必要がある。理由としては実運用上での注意点例えば、「このモデルは全体としてはそこそこの精度だが、20代では精度があまり良くない」といったことを把握しておくと実運用…

2020-06-20

ggplotで他の変数を基準に並び替える

R 使い方メモ(不便解決) 可視化

数値で並び替える場合以下のようなグラフで考える。 library(tidyverse) data(diamonds) # データ作成 df = diamonds %>% group_by(clarity, cut) %>% summarise(n = n()) %>% ungroup() # わかりやすいものだけ抽出 df_filtered = df %>% filter(clarity %…

2020-06-19

ggplotのfacet日本語テキストを折り返す

R 使い方メモ(不便解決) 可視化

これはなにか ggplotのfacet内の文字を任意の文字数で折り返し(改行)をしたい。どういうことかというと、下記のようにirisベースでテキトーにSpeciesを日本語化して文字数を増やしたもので考える。 library(dplyr) iris2 = iris %>% mutate(Species_jp = ca…

2020-05-25

plotly expressを試す

Python 可視化

plotly expressとは可視化ライブラリplotlyのラッパー。 plotlyはグラフに対してドラッグ選択すると拡大ができたり、マウスポインタを合わせると詳細な数値をポップアップしてくれる。そのplotlyをより簡単に記載することができるのがplotly express。 plo…

2020-05-04

pandasのstyleでテーブル出力をわかりやすくする

Python トレース記事練習可視化

JupyterにおけるPandasのテーブルデータの出力に色をつけてわかりやすくしたい。そのためには、pandasのstyle周りをいじれば良いみたい。基本的にドキュメントのUser Guideベースで書いていく。 pandas.pydata.org pandas.pydata.org styleのいじり方は2つ…