Amazon EMR 使用场景
1击流分析
Amazon EMR 可用于分析点击流数据,以便细分用户、了解各种用户偏好,并投放更有效的广告。
2实时分析
借助 Amazon EMR 上的 Spark Streaming,使用和处理来自 Amazon Kinesis、Apache Kafka 或其他数据流的实时数据。采用容错方式执行流分析,并将相应结果写入 Amazon S3 或 HDFS 中。
3日志分析
Amazon EMR 可用于处理 Web 和移动应用程序生成的各种日志。Amazon EMR 可帮助客户将数 PB 的非结构化或者半结构化数据转变为有用的应用程序或者用户洞察数据。
4提取、转换、加载 (ETL)
Amazon EMR 可用于在大型数据集上快速且经济高效地执行数据转换工作负载 (ETL),例如分类、聚合和合并。
5预测分析
Amazon EMR 上的 Apache Spark 包括适用于各种可扩展的机器学习算法的 MLlib,您也可以使用自己的库。通过将数据集存储在内存中,Spark 可以为常见的机器学习工作负载提供出色的性能。
6基因组学
Amazon EMR 可迅速高效地处理大量的基因组数据及其他大型科学数据集。研究人员可以访问 AWS 上托管的免费基因组数据。