まずは蝋の翼から。

学んだことを書きながら確認・整理するためのメモブログ。こういうことなのかな?といったことをふわっと書いたりしていますが、理解が浅いゆえに的はずれなことも多々あると思うのでツッコミ歓迎

2018-03-01から1ヶ月間の記事一覧

TabeauのカスタムSQLにカンマ区切りで複数値をパラメータに入れてデータ抽出をする

表題通り。TabeauのカスタムSQLにカンマ区切りで複数値をパラメータに入れてデータ抽出をする。 概要 カスタムSQLでパラメータに「1231, 132, 3124」のように','区切りで文字列を入れて SELECT * FROM user_table WHERE user_id IN (1231, 132, 3124) 的なこ…

実証分析のための計量経済学メモ①(最小二乗法のBLUE)

実証分析のための計量経済学 を読んで。 最小二乗法とは 真のモデルy = α + βx + εにおいて、α + βx の部分が真の関係。この真の関係に確率変動するε部分が加わることで観測値yが生じる。 そのため、観測値yを用いて説明できないε部分(推定式の場合残差e)…

フラグを用いたテクニカルなCOUNT DISTINCT

SQL

弊社のDMT用SQLで謎な書き方があった。 謎SQL テーブルtbl1の中身はlogテーブルで以下のような感じだとする(ユーザーは複数セグメントに割り振られている)。 user_id segment log_time log_date log_hh log_mm 100 10代 2018-03-01 00:01:00 2018-03-01 00 0…

検定の一般化した使い方

前の記事 knknkn.hatenablog.com を書きながら思ったのだけど、そもそも「どの統計モデル」に対して「どういうとき」「どの検定を使うか」が割と疑問。 使い分け 44の例題で学ぶ統計的検定と推定の解き方を読むとそのあたりが書かれていた。 パラメトリック…

WITH句かサブクエリか

SQL

SQLにおいて、サブクエリは可読性下がるからWITH句を使えという話をしばしば聞く。 ただ、最近あえてサブクエリで記述している人がいたので WITH句とサブクエリで何が違うか について考えてみた。 同じ抽出内容だが片方はWITH句、片方はサブクエリで書いた以…

p値覚書き①

統計的優位性は、実験が偶然によるとは言えない極端な結果を生み出したかどうかを測定するものだ。 結果が偶然による変動の範囲を超えるなら、統計的に優位と言える。 (データサイエンスのための統計学入門 P98) p値について、データサイエンスのための統…

本ブログの目的

本ブログは、そろそろ29歳というアラサーが0からデータサイエンティストとなるための備忘録です。 今までちょくちょく勉強はしてきたけれど、インプットのみでアウトプットがなされない。 なされないゆえに、なんとなくの理解で終わってしまう。 なればこそ…