【重 点要約】
レイクハウスはデータレイクとデータウェアハウスのいいとこどり。
データレイクに対しACIDトランザクションやIndex等データウェアハウスのようなデータマネジメント機能を提供するDALTA LAKEを介しアクセスすることで実現。
データブリックスとしては、データプレーンはユーザ環境に残すことでデータのオーナーシップをユーザに維持。
また、BI、ML、カタログ等の周辺機能も一括提供。
【その他メモ】
・DELTA LAKEの提供機能
→ACIDトランザクション、スキーマエンフォースメント、スキーマエンリッチメント、タイムトラベル、ACL、高度なIO削減、Optimize、Index等
・システムとAI・機械学習モデルの違い→コードとデータの組み合わせによって挙動が異なるかどうか