もうすぐ最終試練。
自分用メモとして・・・・
各Ordでつまずいた問題、復習しておきたいポイント(&KTさんの動画リンク)を羅列しておきます。
動画見直しには下記のVizが便利。
==
Ord3:Intermediate I
- 間違えた問題:Q9、Q11
- Q9は要確認 ★
- 結合のパフォーマンス(Q1)
- 内部>左>右>外部
- クリックしたものを除外(Q1)
- フィルタ先のシートでフィルタ編集⇒除外に変更する
- tdsxファイル
- データ結合とブレンド ★復習ポイント
-
データ結合(JOIN):キーをつかって一行単位で結合する
-
行レベル結合
-
ファクトテーブル:いっぱい入ってくるデータ
-
マスターテーブル:一個のキーに一個のもの
-
JOIN後別の列が追加される⇒テーブルは大きくなる
-
一行一行がくっつく
-
-
- データブレンド:別々のデータソースを取り込み、鎖でつなぐ。
- 集計してから結合
-
LEFTとかRIGHTとかはなく、すべて左結合になる
-
プライマリにないものはでてこない
-
セカンダリにないものはでてくるがNULLになる ※
-
コメ問題がおきる
⇒複数以上のカテゴリが所属してしまっているので、一意になるまで列をつけるとか-
ブレンドする場合は文字も集計
-
カテゴリが二つあってしまう
-
どっちをだしたらいいかわからないから判断できずコメ問題
-
LODの中で一つに絞り切れない
-
プライマリデータソースに対してつながっていく
-
青いチェックマークがプライマリ、オレンジがセカンダリ
-
プライマリの項目でしか集計できない。セカンダリにしかない項目だと集計できない
-
-
- クロスデータベース結合
- 基本的にはJOIN
- 別のデータベース同士でも結合できる
-
粒度があっていないとできない。
-
売上は秒単位、仕入れは毎秒単位ではない。100個仕入れたものが全部くっついていってしまう
⇒ブレンドのほうがいい
-
- メリット
- すべてのディメンションで自由自在に分析できる
- LOD表現も
- どっちがプライマリ?とか考える必要がない
- 正しいデータをほかの人が利用できる
- [Tableau] データの結合がよく分からなくなったのでまとめる #Tableau - Qiita
- Tableauで結合、ブレンド、リレーションってどう違う?使い分けは?|Takumi Mouri | 毛利 匠 (note.com)
ごっちゃになってしまうので上記ページから抜粋。- ブレンドの方がリレーションよりも歴史が古く、ブレンドでできることの大半をリレーションでできるようになった
- ブレンドの利点は、異なるデータに対してどのキーを使ってデータの関係性を構築するかを分析の途中で変えることができること
- 方法
- 結合:テーブルをダブルクリックして、別のテーブルをキャンパスにドラッグすると結合できる
- リレーション:テーブルをつないでキーを設定する
- ブレンド:鎖でつなぐ
-
- 前年度分の描き方(Q3) ★二重軸は軸の同期わすれない!!
- リファレンスライン⇒分布で描くのも使える
- メジャーの集計は外せる(Q4)
- メジャー⇒ディメンションに変えるとバラバラにできる
- 共通のものがないとき、ランキングにする(Q5)★動画要復習
-
Top10&Worst10の結合セット、IN/OUTでわけると空欄ができる
⇒お互いの共通のものがないとき、ランキングにすると便利。 -
ポイント
-
「セット」 (フィルタから作成可能)
-
IN/OUT(二種類)にわけるもの
-
色にもフィルタにもできる、計算フィールドにもいれられるし、ディメンションになる
-
結合セットをつくるとORで作れる
- セットアクション
- 選択されたものでセットの値を変更できる
-
-
「属性」
-
自分より細かいLODが入ってくればわかるのでアスタリスクがきえる
-
集計単位として使われていないもの
-
切りたくないけど情報として入れたいときに使うと便利
-
-
-
- 解きなおしでのミス・・・(Q11)
- 二重軸にしたら軸の同期をチェック!
- ブレンドのときにはリレーションシップが全項目きっちりされているか確認

