もうすぐ最終試練。

自分用メモとして・・・・

各Ordでつまずいた問題、復習しておきたいポイント(&KTさんの動画リンク)を羅列しておきます。

 

動画見直しには下記のVizが便利。

https://public.tableau.com/app/profile/takahiro.yamanashi3736/viz/DataSaberYoutubePlayList_16331538421630/DATASaberBootCamp?publish=yes

 

 

==

Ord3:Intermediate I

  • 間違えた問題:Q9、Q11
    • Q9は要確認 ★
  • 結合のパフォーマンス(Q1)
    • 内部>左>右>外部
  • クリックしたものを除外(Q1)
    • フィルタ先のシートでフィルタ編集⇒除外に変更する
  • tdsxファイル
    • tdsの情報はメタデータが入っていて、別のデータ接続になる
    • 名前を揃えればリレーションシップ登録しなくてもデータブレンドできる
    • 弱い結合なので、データソースに仕込んでしまえる
      • プライマリグループの作成、でセカンダリデータソースの項目を持ってきたときに、プライマリの方に追加できる
  • データ結合とブレンド ★復習ポイント
    • データ結合(JOIN):キーをつかって一行単位で結合する

      • 行レベル結合

        • ファクトテーブル:いっぱい入ってくるデータ

        • マスターテーブル:一個のキーに一個のもの

        • JOIN後別の列が追加される⇒テーブルは大きくなる

        • 一行一行がくっつく

    • データブレンド:別々のデータソースを取り込み、鎖でつなぐ。
      • 集計してから結合
      • LEFTとかRIGHTとかはなく、すべて左結合になる

      • プライマリにないものはでてこない

      • セカンダリにないものはでてくるがNULLになる ※

      • コメ問題がおきる
        ⇒複数以上のカテゴリが所属してしまっているので、一意になるまで列をつけるとか

        • ブレンドする場合は文字も集計

        • カテゴリが二つあってしまう

        • どっちをだしたらいいかわからないから判断できずコメ問題

        • LODの中で一つに絞り切れない

        • プライマリデータソースに対してつながっていく

          • 青いチェックマークがプライマリ、オレンジがセカンダリ

          • プライマリの項目でしか集計できない。セカンダリにしかない項目だと集計できない

    • クロスデータベース結合
      • 基本的にはJOIN
      • 別のデータベース同士でも結合できる
      • 粒度があっていないとできない。

        • 売上は秒単位、仕入れは毎秒単位ではない。100個仕入れたものが全部くっついていってしまう
          ⇒ブレンドのほうがいい

      • メリット
        • すべてのディメンションで自由自在に分析できる
        • LOD表現も
        • どっちがプライマリ?とか考える必要がない
        • 正しいデータをほかの人が利用できる
    • [Tableau] データの結合がよく分からなくなったのでまとめる #Tableau - Qiita
    • Tableauで結合、ブレンド、リレーションってどう違う?使い分けは?|Takumi Mouri | 毛利 匠 (note.com)
      ごっちゃになってしまうので上記ページから抜粋。
      • ブレンドの方がリレーションよりも歴史が古く、ブレンドでできることの大半をリレーションでできるようになった
      • ブレンドの利点は、異なるデータに対してどのキーを使ってデータの関係性を構築するかを分析の途中で変えることができること
    • 方法
      • 結合:テーブルをダブルクリックして、別のテーブルをキャンパスにドラッグすると結合できる
      • リレーション:テーブルをつないでキーを設定する
      • ブレンド:鎖でつなぐ
  • 前年度分の描き方(Q3) ★二重軸は軸の同期わすれない!!
    • リファレンスライン⇒分布で描くのも使える
  • メジャーの集計は外せる(Q4)
    • メジャー⇒ディメンションに変えるとバラバラにできる
  • 共通のものがないとき、ランキングにする(Q5)★動画要復習
    • Top10&Worst10の結合セット、IN/OUTでわけると空欄ができる
      ⇒お互いの共通のものがないとき、ランキングにすると便利。

      • 利益をランキング、ランクを不連続にすればヘッダにできる

      • 製品名は詳細(わける)、カテゴリを属性にする

    • ポイント

      • 「セット」 (フィルタから作成可能)

        • IN/OUT(二種類)にわけるもの

        • 色にもフィルタにもできる、計算フィールドにもいれられるし、ディメンションになる

        • 結合セットをつくるとORで作れる

        • セットアクション
          • 選択されたものでセットの値を変更できる
      • 「属性」

        • 自分より細かいLODが入ってくればわかるのでアスタリスクがきえる

        • 集計単位として使われていないもの

        • 切りたくないけど情報として入れたいときに使うと便利

  • 解きなおしでのミス・・・(Q11)
    • 二重軸にしたら軸の同期をチェック!
    • ブレンドのときにはリレーションシップが全項目きっちりされているか確認