Snowflake の SQL Tips

EQUAL_NULL

Snowflake では、= 演算子で値を比較できますが値が null の場合は結果も null になります。 null どうしなどを比較したい場合は、EQUAL_NULL 関数が便利です。

select 
    'hoge' = 'hoge'
    , 'hoge' = null
    , null = 'hoge'
    , null = null
    , equal_null('hoge', 'hoge')
    , equal_null('hoge', null)
    , equal_null(null, 'hoge')
    , equal_null(null, null)

結果は以下のようになります。

‘HOGE’ = ‘HOGE’	‘HOGE’ = NULL	NULL = ‘HOGE’	NULL = NULL	EQUAL_NULL(‘HOGE’, ‘HOGE’)	EQUAL_NULL(‘HOGE’, NULL)	EQUAL_NULL(NULL, ‘HOGE’)	EQUAL_NULL(NULL, NULL)
TRUE	null	null	null	TRUE	FALSE	FALSE	TRUE

‘HOGE’ = ‘HOGE’

‘HOGE’ = NULL

NULL = ‘HOGE’

NULL = NULL

EQUAL_NULL(‘HOGE’, ‘HOGE’)

EQUAL_NULL(‘HOGE’, NULL)

EQUAL_NULL(NULL, ‘HOGE’)

EQUAL_NULL(NULL, NULL)

TRUE

null

TRUE

FALSE

TRUE

null どうしの比較などを行うことができます。

ARRAY_UNIQUE_AGG

ARRAY_AGG 関数を使うと、グループ化した結果を配列で取得できますが、重複を取り除く ARRAY_UNIQUE_AGG 関数が便利です。

select
    group_key
    , array_agg(value) as non_unique_arr
    , array_distinct(array_agg(value)) as unique_arr
    , arrray_unique_agg(value) as unique_arr2
from table_name
group by 1

今まで ARRAY_UNIQUE_AGG 関数は存在を知らなかったので、ARRAY_DISTINCT も使っていましたがこちらの方が便利です。

MAP_CAT

Snowflake には Key Value の Map 型がありますが、MAP_CAT 関数を使うと、Map どうしを連結することができます。

前述の TRANSFORM, REDUCE と組み合わせると、URL のクエリパラメータをパースする処理が書けます。

select
    'https://example.com?hoge=1&fuga=2' as url
    , reduce(
        transform(
            -- ? で分割した後半部分を & で分割
            split(split(url, '?')[1], '&') 
            -- a=1 などの文字列を = で分割し OBJECT 型にする
            -- & で分割した配列のそれぞれの部分に対して処理を行うため transform
            , a VARCHAR -> object_construct(to_varchar(split(a, '=')[0]), split(a, '=')[1])
        )
        , {}::map(varchar, varchar)
        -- map_cat で map 同士を連結
        , (m1, m2) -> map_cat(m1, m2::map(varchar, varchar))
    ) as parsed
    , parsed['hoge'] as hoge -- => 1
    , parsed['fuga'] as hoge -- => 2

こんにちは、 @kz_morita です。今回は、Athena で LIKE 検索するときに検索したい文字列をエスケープする方法について調べたのでまとめます。対象のクエリ以下のようなクエリから % を持つテキストを探し出したいようなユースケースを考えます。 WITHdatasetAS(SELECT*FROM(VALUES'aaa_%aaa','bbbbbb','cccccc@#$%^&*()^cc')ast("text"))SELECT*FROMdataset text aaa_%aaa bbbbbb cccccc@#$%^&*()^cc ESCAPE characterを指定する普通に検索しようとすると、% が LIKE の Wildcard として予約されているので検索することができません。そのため、Presto には ESCAPE character を指定する構文が用意されています。以下は、# を ESCAPE character として使用する例です。 WITHdatasetAS(SELECT*FROM(VALUES'aaa_%aaa','bbbbbb','cccccc@#$%^&*()^cc')ast("text"))SELECT*FROMdatasetWHERE"text"LIKE'%#%%'ESCAPE'#'以下のように正しく実行することができます。 text aaa_%aaa cccccc@#$%^&*()^cc 全記号を検索したいなどの特殊ケース上記の方法で、大体のケースはカバーできると思いますが例えば、検索したい文字が複数あって他のテーブルに格納されているなどといったケースではもう少し考慮が必要です。 WITHdatasetAS(SELECT*FROM(VALUES'aaa_%aaa','bbbbbb','cccccc@#$%^&*()^cc')ast("text")),symbol_dataAS(SELECTARRAY['!','@','#','$','%','^','&','*','(',')']assymbols),data_with_symbolsAS(SELECT*,(SELECTsymbolsFROMsymbol_dataLIMIT1)assymbolsFROMdataset)SELECT*,filter(symbols,s->"text"LIKE'%'||s||'%')ashitFROMdata_with_symbolsWHEREcardinality(filter(symbols,s->"text"LIKE'%'||s||'%'))>0上記は symbol_data というテーブルに格納されている記号で検索するようなケースを想定しています。以下の部分は、配列に格納されている記号データを "text" フィールドに含まれているものだけ filter してその件数が 0 件以上という条件を WHERE 句で指定しています。

こんにちは、 @kz_morita です。 Redshift に溜まったユーザーの行動ログを分析しようとして Window 関数について調べてました． Window関数をある程度理解するとかなり分析の幅が増えるので，今回はWindow関数について学んだことをまとめます． PostgreSQL と Amazon Redshift について Window関数の前に，Redshift と PostgreSQL の関係性について述べておきます． Amazon Redshift の公式サイトに書いてありますが，Redshift は PostgreSQL に基づいています．基本的には共通しているところが多いですが，Amazon Redshift のほうがより分析ように特化しておりデータセットが巨大な場合や，SQLが複雑な場合に向いているようです．ただし，頻繁に更新されたり，同時に複数SQLが実行されるような環境には向いていないようです． Window 関数の書式それでは早速 Window 関数の書き方について見ていきます． Window 関数は主に SELECT 句などで使用でき以下のような書式になります． Window関数 OVER ( PARTITION BY パーティション ORDER BY 並び順 ROWS Windowフレーム ) 具体的な例を上げます． SELECTuser_id,action,datetime,-- 各ユーザーごとに取った行動の新しい順で2番めの値を取得 NTH_VALUE(action,2)OVER(PARTITIONBYuser_idORDERBYdatetimeDESCROWSBETWEENUNBOUNDEDPRECEDINGANDUNBOUNDEDFOLLOWING)-- ユーザーの行動ログ FROMuser_logs上記の例を用いながら Window関数, パーティション，並び順，Windowフレームの順に見ていきます． Window 関数 Window 関数は，Windowという区切られた区間についての処理を行う関数になります． NTH_VALUE(action,2)-- <- ココ OVER(PARTITIONBYuser_idORDERBYdatetimeDESCROWSBETWEENUNBOUNDEDPRECEDINGANDUNBOUNDEDFOLLOWING)上記の例で言うところの，NTH_VALUE(action, 2) という箇所が Window 関数になります．

blog.foresta.me

Snowflake の SQL Tips

EQUAL_NULL

ARRAY_UNIQUE_AGG

TRANSFORM, REDUCE

MAP_CAT

まとめ

Snowflake の SQL Tips

EQUAL_NULL

ARRAY_UNIQUE_AGG

TRANSFORM, REDUCE

MAP_CAT

まとめ

関連記事