既にご存知の方も多いと思いますが、
今後AWSサービスのことも少しづつ紹介していけたらと思います。
1. Amazon Redshiftとは?
高速で完全マネージド型、ペタバイト規模のデータウェアハウスソリューションで
簡単にいうと蓄積された大量データの集計処理をしてくれるものです。
列指向(カラムナ)データベースであり、PostgreSQLをベースに作られています。
(でもPostgreSQLとは違うよ!)
■Amazon redshiftのご紹介
http://www.slideshare.net/AmazonWebServicesJapan/amazon-redshift?related=1
2. Amazon Redshift 使う メリット は?
Hadoop+Hiveを利用する方法が一般的だと思いますが
Amazon Redshiftを使うことにより以下のようなメリットがあります。
・クエリスピードが速い。
アドネットワークのような頻繁なクエリ実行環境では、コスト面でも非常に有利。
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
http://www.slideshare.net/Hapyrus/amazon-redshift-hadoop-hive10
全件処理するのが基本のHadoopと,圧縮されたカラムごとの処理のみでよいRedshift。
どちらを使った方がいいか明確ですよね!
3. Amazon Redshift 使う デメリット は?
データベース内のデータ量が少ない場合。(使う必要ない..)
レスポンスタイムが重要なオンライントランザクション処理を行う
データベースとしての利用には不向き。(こういう使い方はしないと思う...)
4. Redshift活用事例(参考)
・Amazon Redshiftによるリアルタイム分析サービスの構築
http://sssslide.com/www.slideshare.net/mineroaoki/at-aws-summit-tokyo-2014
・Sumallyにおける Amazon Redshift 導入事例
http://sssslide.com/speakerdeck.com/kataring/sumallyniokeru-amazon-redshift-dao-ru-shi-li
次は、DynamoDB について紹介したいと思います。