一个公司有几个团队,每个团队都有自己的Amazon RDS数据库,总计100TB.该公司正在为商业智能分析师构建数据查询平台,以生成每周业务报告:新系统必须运行临时SQL查询.什么是最具成本效益的解决方案()
A.创建一个新的Amazon Redshift集群.创建一个AWS GlueETL作业以将数据从RDS数据库复制到Amazon Redshift集群.使用AmazonRedshift运行查询
B.创建具有足够核心节点的Amazon EMR集群.运行ApacheSpark作业,将数据从RDS数据库复制到Hadoop分布式文件系统(HDFS).使用本地ApacheHive元存储来维护表定义.使用Spark SQL运行查询
C.使用AWS Glue ETL作业将所有RDS数据库复制到单个Amazon AuroraPostgreSQL数据库.在Aurora PostgreSQL数据库上运行SQL查询
D.使用AWS Glue搜寻器对所有数据库进行爬网并在AWSGlue数据目录中创建表.使用AWS Glue ETL作业将数据从RDS数据库加载到AmazonS3,然后使用Amazon Athena运行查询
D、使用AWS Glue搜寻器对所有数据库进行爬网并在AWSGlue数据目录中创建表.使用AWS Glue ETL作业将数据从RDS数据库加载到AmazonS3,然后使用Amazon Athena运行查询
解析:Glue搜寻器是一个关键组件,可以扫描各种回购中的数据,对其进行分类,从中提取架构信息并将元数据自动存储在glu数据目录中.S3的存储成本低于其余选项.临时SQL也经常与Athena的使用相关联