まずは蝋の翼から。

学んだことを書きながら確認・整理するためのメモブログ。こういうことなのかな?といったことをふわっと書いたりしていますが、理解が浅いゆえに的はずれなことも多々あると思うのでツッコミ歓迎

SQL

モデルに対して値の推定結果を作成する

やりたいこと モデルを作成して、そのモデルをある値に適用したときの推定結果を作成したい。 今回は モデルの学習データの推定値 任意の値をモデルに適用したときの推定値 の2パターンについて書く。 共通処理 今回、モデルはdiamondsに対して線形モデルlog…

DataGripのショートカットキーなど俺俺メモ

もともとSQLはSublime Textで書いて、クエリ投げるのはDataGripだったんですがいいかげん1つに完結させるためにDataGripをちゃんと使えるようにする。 ちなみにDataGripってどんなん?っていう部分は以下の記事が端的でわかりやすい qiita.com キーボードシ…

連番テーブル、カレンダーテーブルを作成する

SQL

連番テーブルやカレンダーテーブルを作成する意義 SQLを使い、連番が入ったテーブルや、カレンダーとなるテーブルを使用したいという機会が往々にしてあります。 例えば、アクセスログに対して日付毎のPV数を求める場合、アクセスログ内である日付のアクセス…

Kickstarter SQL Style Guide和訳

SQLのコーディング規約を考えていたところ、Kickstarter のSQLスタイルガイドがあったのでテキトーに意訳してみる。 ※は私なりの補足や疑問を記載 Kickstarter SQL Style Guide · GitHub 目的 再現性・透明性を維持していくことは、Kickstarterデータチーム…

SQLで連続課金日数を計算し、その最大値を求める

SQL

ユーザー毎の最長連続課金日数を求める。 Redshiftを想定。 データイメージ 「課金」列はその日課金した場合は1、課金してなかった場合は0となる。 『連続して○○した日数』をどうやってSQLで求めるか?がポイントとなります。 SQLなので、集約関数やWINDOW関…

フラグを用いたテクニカルなCOUNT DISTINCT

SQL

弊社のDMT用SQLで謎な書き方があった。 謎SQL テーブルtbl1の中身はlogテーブルで以下のような感じだとする(ユーザーは複数セグメントに割り振られている)。 user_id segment log_time log_date log_hh log_mm 100 10代 2018-03-01 00:01:00 2018-03-01 00 0…

WITH句かサブクエリか

SQL

SQLにおいて、サブクエリは可読性下がるからWITH句を使えという話をしばしば聞く。 ただ、最近あえてサブクエリで記述している人がいたので WITH句とサブクエリで何が違うか について考えてみた。 同じ抽出内容だが片方はWITH句、片方はサブクエリで書いた以…