什么是 Athena
Amazon Athena 是一种交互式查询服务,让您可以轻松使用标准 SQL 语言来分析 Amazon S3 中的数据。Athena 属于无服务器服务,因此不需要管理基础设施,且您仅需为您运行的查询付费。
Athena 易于使用。只需指向您存储在 Amazon S3 中的数据,定义架构并使用标准 SQL 开始查询。便可在数秒内获取最多结果。使用 Athena,无需进行复杂的 ETL 作业来为分析准备您的数据。这便于任何具备 SQL 技能的人快速分析大规模数据集。
Athena 与 Amazon Glue Data Catalog 集成,即开即用,可使您跨各种服务创建统一的元数据存储库,抓取数据源以发现架构并在您的 Catalog 中填充新表格和修改的表格以及分区定义,并维持架构版本控制。您还可以使用 Glue 的完全托管型 ETL 功能变换数据或将数据转换为列式格式,以优化成本并提高性能。

优势
即使对于大型数据集,也能实现交互式性能
使用 Amazon Athena,您不必担心没有足够的计算资源来获取快速、交互式查询性能。Amazon Athena 会自动并行执行查询,因此,大多数结果在数秒钟内便可返回。
构建于 Presto,运行标准 SQL
Amazon Athena 使用 ANSI SQL 支持的 Presto,可处理 CSV、JSON、ORC、Avro 和 Parquet 等各种标准数据格式。Athena 不仅是快速、临时查询的理想选择,还能处理复杂的分析,包括大型联接、开窗函数和数组。Amazon Athena 具有高度可用性;它使用计算资源跨多个设施和每个设施的多个设备执行查询工作。Amazon Athena 使用 Amazon S3 作为其底层数据存储,从而使您的数据可用性高、持久性强。
无服务器,无 ETL
Athena 属于无服务器服务。您可以快速查询数据,而无需设置和管理任何服务器或数据仓库。只需指向您存储在 Amazon S3 中的数据,定义架构并使用内置的查询编辑器开始查询。借助 Amazon Athena,您可以挖掘 S3 中存储的所有数据,而无需设置复杂的过程来提取、转换和加载数据 (ETL)。
仅为扫描的数据付费
使用 Amazon Athena,您只需为您运行的查询付费。将按查询扫描的每 TB 数据 ¥41.20 向您收费。您可以通过压缩、分区和将数据转换为列式格式将每次查询成本节省 30% 到 90%,并提高性能。Athena 直接在 Amazon S3 中查询数据。除 S3 之外,没有额外的存储费用。