CourseraのDeepLearningコース+αを使ってどうDeepLearningを勉強したか

機械学習

この記事はデータラーニングギルド Advent Calendar 2021です。この記事はなにか何を書かないかお前誰本記事の要約受講してみてどうだったか勉強の進め方どれくらいの時間を使ったか英語字幕の視聴方法プログラミング課題について日本語に関して …

2021-10-26

atmaCup #12に参加して覚えたことメモ②lightGBM関係

Kaggle Python トレース記事機械学習

これはなにか下準備 Cross Validationをいい感じに実行するカスタムメトリクスを使うこれはなにかデータ分析コンペのatmaCup #12に参加して、他の人のコードを読んで覚えたことのメモです。 atma.connpass.com コンペのdiscussionで公開されているコード…

2021-10-26

atmaCup #12に参加して覚えたことメモ①特徴量作成

トレース記事 Python Kaggle 機械学習

これはなにかよく使う項目グループを定数化特徴量の作成特徴量の処理の仕方まとめて一気に関数処理ひとつずつ処理集約関数のエレガントな処理これはなにかデータ分析コンペのatmaCup #12に参加して、他の人のコードを読んで覚えたことのメモです。 a…

2021-10-13

順序付き多値分類を回帰問題で解くときの閾値をoptunaで求める

Python 機械学習

目的データ分類問題として解く回帰問題として解く連続値の予測部分パターン1.Clipping+四捨五入でラベル化するパターン2. Optunaで閾値を探索してラベル化する計算時に変数を用いる対応策1.高階関数対応策2. Objective Class+call 最適化の実行目…

2021-09-14

pipeを用いてpythonを極力メソッドチェーンで書く

Python 使い方メモ(不便解決) トレース記事

この記事はなにかやりたいこと pipeを使わないで処理をする pipeを使って処理余談この記事はなにか可読性/保守性を上げるために、できる限りメソッドチェーンで書きたい。過去にメソッドチェーンについての記事は書いたが、どうしてもメソッドチェーン…

2021-09-03

Jupyter noebookでデバッグをする方法

Python 俺俺メモトレース記事

この記事はなにか以下のTweetを見て知らなかったので、自分で手を動かしたまじでマジックコマンドの"%debug"便利なのでjupyter使ってる人で知らない人いたら一度使ってみてほしい。。。「知らんかった！！」っていう人があまりにも多い。。。わざわざgif作…

2021-09-01

scikit-learnの機能を拡張/変更したscikit-learn準拠モデルを作る

Python 使い方メモ(ライブラリ) 機械学習

これはなにか scikit-learn準拠の自作予測モデルを作成する実例実際にリッジ回帰をおこなう場合のsklearn.linear_model.LinearRegression 自作のTransformerを使う実例外れ値の置き換え特徴量追加その他参考これはなにか scikit-learn APIにはない新…

2021-07-11

「ドメイン知識」という言葉の解像度を上げてインプットに活かす

書籍雑談

この記事はなにか要約背景ドメイン知識の要素分解問題設定のためのドメイン知識分析のためのドメイン知識活用のためのドメイン知識余談：クライアントを介さない自己学習が可能なこと前提知識データサイエンティストの要諦イシューからはじめよ「…

2021-06-30

「機械学習を解釈する技術」のここがすごい

書籍

はじめに弊社の森下が書籍を出版することになりました。「機械学習を解釈する技術 ~ 予測力と説明力を両立する実践テクニック」 gihyo.jp 本書のレビューに関わらせてもらったのでここが良かったぞ！という部分を書こうかなと思います。はじめに本書の特…

2021-06-29

GBDTのハイパーパラメータの意味を図で理解しつつチューニングを学ぶ

機械学習トレース記事俺俺メモ

この記事は何か lightGBMやXGboostといったGBDT(Gradient Boosting Decision Tree)系でのハイパーパラメータを意味ベースで理解する。その際に図があるとわかりやすいので図示する。なお、ハイパーパラメータ名はlightGBMの名前で記載する。XGboostとかで…

2021-06-14

Optunaを使ってみる

Python 機械学習使い方メモ(ライブラリ)

Optunaとは実装1: 簡単な例評価関数目的関数最適化実装2: lightGBMでの例実装3：閾値の最適化その他 sample 複数アルゴリズムの使用参考 Optunaとはざっくり書くと、良い感じのハイパーパラメーターを見つけてくれるライブラリ。ちゃんと書くと…

2021-06-08

Classを用いて、特徴量作成を仕組み化する@ぐるぐる

Python 機械学習トレース記事使い方メモ(ライブラリ)

これはなにか自作関数での処理との違い参考記事をトレスブロックを使った特徴量作成処理(コピペ) 内部状態が更新されるブロック例・ CountEncoding 内部状態更新が行われないブロック例・StringLength 各特徴量処理ブロックをまとめて処理内部状態更新が…

2021-06-06

自然言語処理を色々楽にするTextheroを使ってみる

Textheroでできること前処理前処理メソッド clean 解析ベクトル変換可視化散布図ワードランキングワードクラウドその他参考 Textheroでできること PythonライブラリTextheroでは、自然言語処理を簡単にできる。機能としては下記が可能。前処理・・…

2021-05-28

特徴量作成を楽にするライブラリいくつかまとめて試す②xfeat

Python 機械学習使い方メモ(ライブラリ)

この記事はなにか何ができるか特徴量の変換特定型の特徴量のDFを作る特徴量の加工カテゴリカル変数 Label Encoding Count Encoding Target Encoding 列組み合わせ（文字列) 数値変数集約関数列組み合わせ(数値) Lambda処理この記事はなにか機械学習…

2021-05-28

特徴量作成を楽にするライブラリいくつかまとめて試す① featuretools

Python 使い方メモ(ライブラリ) 機械学習

この記事はなにか何を書かないか featuretools 複数テーブルのあるデモデータで試す 1. EntitysetというER的なデータとデータ関係が入ったオブジェクトを作成集計/変換処理をする 1テーブルのデータで試す参考この記事はなにか機械学習の特徴量を作ると…

2021-05-24

楽にEDA初手ができそうなSweetvizメモ

使い方メモ(ライブラリ) 可視化メモ

EDA初手としてpandas_profilingが有名だがデータ数が多いとめちゃくちゃ時間がかかるのであまり好きではない。 Sweetvizが高速かつ、データ比較もできるようなので雑に試す。 github.com 1データの場合 import sweetviz as sv my_report = sv.analyze(df) my…