【重点要約】

レイクハウスはデータレイクとデータウェアハウスのいいとこどり。

データレイクに対しACIDトランザクションやIndex等データウェアハウスのようなデータマネジメント機能を提供するDALTA LAKEを介しアクセスすることで実現。

データブリックスとしては、データプレーンはユーザ環境に残すことでデータのオーナーシップをユーザに維持。

また、BI、ML、カタログ等の周辺機能も一括提供。

 

【その他メモ】

・DELTA LAKEの提供機能

 →ACIDトランザクション、スキーマエンフォースメント、スキーマエンリッチメント、タイムトラベル、ACL、高度なIO削減、Optimize、Index等

・システムとAI・機械学習モデルの違い→コードとデータの組み合わせによって挙動が異なるかどうか