【重点要約】
分析という変化が激しい領域では環境を固定せず常に変化し続け新しいことを始められるようにすることが重要。
データレイクを中心としたシンプルなアーキテクチャとし、DiscoverとSubscribeのフローを意識し、セルフサービスで分析が行える環境を作る。
また、セキュリティ面においてはリスクのあるシーンを想定し、守るデータを考えそれに沿った対策を行う。
【その他メモ】
・データカタログによるデータ管理
⇒発見しやすさ、活用しやすさ、権限管理、監視・監査、通知
・S3の性能改善
⇒パーティション化、ファイルサイズ削減、圧縮アルゴリズム検討、ファイルフォーマット検討
・環境の更新
⇒古いバージョンを使い続け、ビックバン的に更新するのではなく定期的に新しい環境に小さく更新し続けサービスを活用できる環境にする
・決めたルールをずっと守るのでなく、ルール自体もニーズやデータの変化に合わせて変えていく必要がある