SQL
やりたいこと モデルを作成して、そのモデルをある値に適用したときの推定結果を作成したい。 今回は モデルの学習データの推定値 任意の値をモデルに適用したときの推定値 の2パターンについて書く。 共通処理 今回、モデルはdiamondsに対して線形モデルlog…
もともとSQLはSublime Textで書いて、クエリ投げるのはDataGripだったんですがいいかげん1つに完結させるためにDataGripをちゃんと使えるようにする。 ちなみにDataGripってどんなん?っていう部分は以下の記事が端的でわかりやすい qiita.com キーボードシ…
連番テーブルやカレンダーテーブルを作成する意義 SQLを使い、連番が入ったテーブルや、カレンダーとなるテーブルを使用したいという機会が往々にしてあります。 例えば、アクセスログに対して日付毎のPV数を求める場合、アクセスログ内である日付のアクセス…
SQLのコーディング規約を考えていたところ、Kickstarter のSQLスタイルガイドがあったのでテキトーに意訳してみる。 ※は私なりの補足や疑問を記載 Kickstarter SQL Style Guide · GitHub 目的 再現性・透明性を維持していくことは、Kickstarterデータチーム…
ユーザー毎の最長連続課金日数を求める。 Redshiftを想定。 データイメージ 「課金」列はその日課金した場合は1、課金してなかった場合は0となる。 『連続して○○した日数』をどうやってSQLで求めるか?がポイントとなります。 SQLなので、集約関数やWINDOW関…
弊社のDMT用SQLで謎な書き方があった。 謎SQL テーブルtbl1の中身はlogテーブルで以下のような感じだとする(ユーザーは複数セグメントに割り振られている)。 user_id segment log_time log_date log_hh log_mm 100 10代 2018-03-01 00:01:00 2018-03-01 00 0…
SQLにおいて、サブクエリは可読性下がるからWITH句を使えという話をしばしば聞く。 ただ、最近あえてサブクエリで記述している人がいたので WITH句とサブクエリで何が違うか について考えてみた。 同じ抽出内容だが片方はWITH句、片方はサブクエリで書いた以…