CourseraのDeepLearningコース+αを使ってどうDeepLearningを勉強したか

機械学習

この記事はデータラーニングギルド Advent Calendar 2021です。この記事はなにか何を書かないかお前誰本記事の要約受講してみてどうだったか勉強の進め方どれくらいの時間を使ったか英語字幕の視聴方法プログラミング課題について日本語に関して …

2021-10-26

atmaCup #12に参加して覚えたことメモ②lightGBM関係

Kaggle Python トレース記事機械学習

これはなにか下準備 Cross Validationをいい感じに実行するカスタムメトリクスを使うこれはなにかデータ分析コンペのatmaCup #12に参加して、他の人のコードを読んで覚えたことのメモです。 atma.connpass.com コンペのdiscussionで公開されているコード…

2021-10-26

atmaCup #12に参加して覚えたことメモ①特徴量作成

トレース記事 Python Kaggle 機械学習

これはなにかよく使う項目グループを定数化特徴量の作成特徴量の処理の仕方まとめて一気に関数処理ひとつずつ処理集約関数のエレガントな処理これはなにかデータ分析コンペのatmaCup #12に参加して、他の人のコードを読んで覚えたことのメモです。 a…

2021-10-13

順序付き多値分類を回帰問題で解くときの閾値をoptunaで求める

Python 機械学習

目的データ分類問題として解く回帰問題として解く連続値の予測部分パターン1.Clipping+四捨五入でラベル化するパターン2. Optunaで閾値を探索してラベル化する計算時に変数を用いる対応策1.高階関数対応策2. Objective Class+call 最適化の実行目…

2021-09-01

scikit-learnの機能を拡張/変更したscikit-learn準拠モデルを作る

Python 使い方メモ(ライブラリ) 機械学習

これはなにか scikit-learn準拠の自作予測モデルを作成する実例実際にリッジ回帰をおこなう場合のsklearn.linear_model.LinearRegression 自作のTransformerを使う実例外れ値の置き換え特徴量追加その他参考これはなにか scikit-learn APIにはない新…

2021-06-29

GBDTのハイパーパラメータの意味を図で理解しつつチューニングを学ぶ

機械学習トレース記事俺俺メモ

この記事は何か lightGBMやXGboostといったGBDT(Gradient Boosting Decision Tree)系でのハイパーパラメータを意味ベースで理解する。その際に図があるとわかりやすいので図示する。なお、ハイパーパラメータ名はlightGBMの名前で記載する。XGboostとかで…

2021-06-14

Optunaを使ってみる

Python 機械学習使い方メモ(ライブラリ)

Optunaとは実装1: 簡単な例評価関数目的関数最適化実装2: lightGBMでの例実装3：閾値の最適化その他 sample 複数アルゴリズムの使用参考 Optunaとはざっくり書くと、良い感じのハイパーパラメーターを見つけてくれるライブラリ。ちゃんと書くと…

2021-06-08

Classを用いて、特徴量作成を仕組み化する@ぐるぐる

Python 機械学習トレース記事使い方メモ(ライブラリ)

これはなにか自作関数での処理との違い参考記事をトレスブロックを使った特徴量作成処理(コピペ) 内部状態が更新されるブロック例・ CountEncoding 内部状態更新が行われないブロック例・StringLength 各特徴量処理ブロックをまとめて処理内部状態更新が…

2021-05-28

特徴量作成を楽にするライブラリいくつかまとめて試す②xfeat

Python 機械学習使い方メモ(ライブラリ)

この記事はなにか何ができるか特徴量の変換特定型の特徴量のDFを作る特徴量の加工カテゴリカル変数 Label Encoding Count Encoding Target Encoding 列組み合わせ（文字列) 数値変数集約関数列組み合わせ(数値) Lambda処理この記事はなにか機械学習…

2021-05-28

特徴量作成を楽にするライブラリいくつかまとめて試す① featuretools

Python 使い方メモ(ライブラリ) 機械学習

この記事はなにか何を書かないか featuretools 複数テーブルのあるデモデータで試す 1. EntitysetというER的なデータとデータ関係が入ったオブジェクトを作成集計/変換処理をする 1テーブルのデータで試す参考この記事はなにか機械学習の特徴量を作ると…

2021-05-24

Shapashで機械学習モデルの挙動を可視化する

Python 機械学習使い方メモ(ライブラリ)

記事の目的前回の記事ではShapashと同様に機械学習モデルの挙動を楽に可視化するEvidentlyを紹介した。 knknkn.hatenablog.com 記事中でShapashについても軽く触れたが使用用途としては以下のような違いがある。 Evidentlyはモデルの振る舞いを、推定元デー…

2021-05-20

Evidentlyで機械学習モデルの挙動を可視化する

Python 使い方メモ(ライブラリ) 可視化機械学習

背景機械学習モデルは作成後にそのモデルがどのような振る舞いをするのか調べる必要がある。理由としては実運用上での注意点例えば、「このモデルは全体としてはそこそこの精度だが、20代では精度があまり良くない」といったことを把握しておくと実運用…

2020-06-04

テキトーに予測したベースラインを作成するDummyRegressorとDummyRegressorを試す

Python 機械学習

DummyClassifier/DummyRegressorとは過去記事(3. ベースラインを定める)にも書いたが、機械学習モデルを作成した際の評価は何かしらのベースラインと比較しなければその値が良いのか悪いのかわからない。単純な比較対象として、「テキトーに予測した」結果…

2020-06-02

sklearn.pipelineを試す

Python 使い方メモ(ライブラリ) 機械学習

sklearn.pipelineとは sklearn.pipeline とは、前処理用のScaler(変換器)や機械学習モデルを一括で処理するためのオブジェクトを生成する。これをおこなうことで、管理が容易になったり処理コード部分を簡潔に書くことができる。実装データはボストン住宅…

2020-05-07

Permutation Importanceについての俺俺メモ

トレース記事機械学習メモ

Permutation Importanceについて、以下のデータロボットさんの記事を改めて読んで、所見のときはちゃんと理解してなかった部分があったのでメモ。 blog.datarobot.com Permutation Importance自体の解説は上記記事もわかりやすいですが、以下の記事では更に…