如果云计算有个核心逻辑的话,那就是:免费且好用!当然,这里免费的意思是:几乎免费。
在阿里云大数据体系里,最重要的产品就是MaxCompute,甚至可以说是整个阿里云最重要的产品,因为从 2009 年 9 月阿里云成立起,愿景就是做运算/分享数据的第一平台。
MaxCompute原来叫做ODPS,在2016年9月推出2.0版本时更名为MaxCompute。
强调了去IOE之后,还特别提到了阿里金融,难道说估值千亿美金的金服每年49%的税前利润给阿里巴巴买的是这个?
有意思的是,在研发阶段,这个产品在内部还有一个名字叫做上云梯,有上云梯,自然还有下云梯,下云梯是基于hadoop的,在上云梯成熟后,下云梯就停止开发了。
大数据计算服务(MaxCompute,原名 ODPS)是一种快速、完全托管的 GB/TB/PB 级数据仓库解决方案。MaxCompute 为您提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决海量数据计算问题,有效降低企业成本,并保障数据安全。
MaxCompute按照实际资源的消耗量进行计费:
存储量、以小时为单位进行采集,以此为基础再求出一天的平均使用量,每天按平均量进行计费。MaxCompute会对数据进行压缩存储,一般可以到达5倍的压缩比,计费是以压缩后的实际占用量进行计算。每GB每天单价简单的说就是从1分钱到6厘 (100GB以上部分1分,100TB以上6厘)。
计算量、针对计算量有两种计费模式:预付费和后付费;预付费是指提前预定资源并支付费用,资源的预定以CU为单位,一个CU为1核心CPU以及4GB内存,价格为一个月150块。后付费是指根据实际的计算资源使用情况进行计费,价格计算相对复杂一些,要根据SQL语句的复杂度及扫描的数据量或者MapReduce任务占用的CPU时间进行计费。实际扫描的数据量通过合理的分区过滤和数据列裁剪将远远小于源表数据。
下载量、外网下载0.8元/GB,内网访问、数据上传不收费,大数据分析应用,原始数据和中间结果通常用不着下载,而结果数据量通常很小。
通常情况下,大数据系统最大的成本支出都在数据存储成本上,而考虑到3副本、5倍压缩比、再考虑到日常运维成本(机房、人员、电费、制冷)、阿里云的这个价格对于一般行业客户来说其实相当于免费。
以下和MaxCompute相关的这些产品都是真的免费:
数据工场、数据工场DataWorks是工作流可视化开发、调度运维托管的一站式海量数据离线加工分析平台。在阿里云大数据体系中,DataWorks是MaxCompute的控制台和前端系统。通过DataWorks,既可直接编写并运行 MaxCompute SQL,又能可视化配置工作流并定时调度运行MaxCompute SQL、MR 等任务。通过DataWorks的数据血缘管理功能可实现数据的资产化、通过可视化工作流和任务管理系统可以建立可靠的大数据运维体系。
数据集成、通过数据集成加载不同数据源数据,同样也可以通过数据集成把 MaxCompute 的数据导出到各种业务数据库。
机器学习、MaxCompute上的数据可以直接在机器学习PAI中使用,通过机器学习服务上提供的分析挖掘算法可以让数据发挥更大价值,而机器学习PAI服务除了华北2区域的深度学习服务外,在其他区域或者使用其他服务目前都是0折优惠。