当前位置: 首页 > 新闻资讯 > qlik获得亚马逊关系型数据库服务就绪认证

qlik获得亚马逊关系型数据库服务就绪认证

发布时间:2024-01-28 5:03:12

  1. 五大数据库理念,读懂亚马逊云科技的数据库布局
  2. 亚马逊云数据库是一个怎样的存在?
  3. 亚马逊十大物流技术是什么以及它们的特点

一、五大数据库理念,读懂亚马逊云科技的数据库布局

1970 年,关系型数据库之父 e.f.codd 发表《用于大型共享数据库的关系数据模型》论文,正式拉开数据库技术发展序幕。以 oracle、db2、sql server 为代表的三大商业数据库产品独占鳌头,随后涌现出 mysql、postgresql 等为代表的开源数据库 ,和以 amazon rds 等为代表的云数据库,拉开百花齐放的数据库新序幕。

我们知道,云计算十年为产业转型升级提供了 历史 性契机,但变革仍在进行,随着云计算的普及,数据库市场发生根本性改变,云厂商打破传统商业数据库的堡垒,成为数据库领域全新力量。其中以连续六年入选 gartner 领导者象限的亚马逊云 科技 为代表,我们一起探讨:为什么亚马逊云 科技 能始终保持其创新性?纵观云原生时代下,亚马逊云 科技 数据库未来还有哪些更多的可能性?

01 面对四大数据库发展趋势,亚马逊云 科技 打造五大数据库理念

后疫情时代下,加速了不少行业的业务在线化和数字化运营,企业对数据价值挖掘的需求越发强烈,亚马逊云 科技 大中华区产品部总经理顾凡详细介绍其中四大趋势:

一是伴随互联网、移动互联网的发展,电商、视频、社交、出行等新应用场景的兴起,不仅数据量大,对数据实时性要求极高,传统关系型数据库无法满足需求,因此驱动云原生数据库的出现。

二是开源数据库的广泛应用。

三是应用程序现代化对数据库提出更高要求,期待数据库拥有更高的性能、可扩展性、可用性以及降低成本,让开发人员专注于核心业务的应用开发,不用关注和核心业务无关的代码。

四是软件架构历经 pc、互联网、移动互联网,再到如今的万物互联时代,其中的迭代和转型正在驱动数据库选型的变化。

在此四大趋势下,伴随企业的业务量越来越大、越来越复杂,对数据库的要求越来越高。亚马逊云 科技 洞察客户需求,在打造云上数据库产品时提出五大理念:

一是专库专用,极致性能;二是无服务器,敏捷创新;第三是全球架构,一键部署;第四是平滑迁移,加速上云;第五是 ai 赋能,深度集成。

02 历经真实锤炼,五大数据库理念,持续赋能企业数智转型

顾凡表示,随着数据爆炸式增长,微服务架构与 devops 愈发流行的今天,一个数据库打天下的时代已然过去。我们需要在不同的应用场景下,针对不同的数据类型和不同的数据访问特点,为开发者和企业提供专门构建的工具。

所以亚马逊云 科技 提出 第一个核心数据库理念:专库专用 。在此理念下,推出针对关系数据、键值数据、文档数据、内存数据、图数据、时许数据、分类账数据、宽列等专门构建数据库的产品家族。

这些数据库产品均经历过亚马逊内部核心业务的真实锤炼,成绩斐然:

亚马逊电商当年是 oracle 的客户之一,随着亚马逊电商的应用重构和业务体量发展,亚马逊电商决定将业务迁移到亚马逊云 科技 里。100 多个团队参与这庞大的迁移工作中,将亚马逊电商采购、目录管理、订单执行、广告、财务系统、钱包、视频流等关键系统全部从 oracle 迁出来。2019 年,亚马逊将存储近 7500 个oracle 数据库中的 75 pb 内部数据迁移到多项亚马逊云 科技 的数据库服务中,包括 amazon dynamodb、amazon aurora、amazon elasticache,于是亚马逊电商成为亚马逊云 科技 在全球的“第一大客户”。

从 oracle 切换到亚马逊云 科技 后,亚马逊电商节省了 60% 成本,面向消费者端的应用程序延迟降低 40%,数据库管理支出减少 70%。

以被誉为“亚马逊云 科技 历史 上用户数量增速最快的云服务”amazon aurora 为例,其拥有科媲美高端商业数据库的速度和可用性,还拥有开源数据库的简单性与成本效益,amazon aurora 让客户满足“鱼和熊掌兼得”需求。

据顾凡介绍,amazon aurora 可提供 5 倍于标准 mysql 性能,3 倍于 postgresql 吞吐量。同时提供高可用,可用区(az)+1的高可用,global databases 可完成跨区域灾备。可扩展到 15 个只读副本,成本只有商业数据库的 1/10。

医药企业九州通为药厂、供应商,搭建药厂、供应商、消费者提供供应链链条。其 b2b 系统的业务特点是读多写少,受促销活动、工作时间等影响,经常会出现波峰波谷落差较大的情况,读写比例在 7:2 或者 8:3。九州通采用 amazon aurora 后实现读写分离和按需扩展,整体数据库性能提升 5 倍,tco 降低 50%。实现了跨可用区部署、负载均衡、自动故障转移、精细监控、按需自动伸缩等。

据权威机构预测,到 2022 年,75% 数据库将被部署或迁移至云平台。在这个过程中,亚马逊云 科技 是如何通过技术来帮助客户加速应用上云的?这离不开除了上述的“专库专用”外,以下四大理念:

第二个理念是无服务器、敏捷创新。 亚马逊云 科技 大中华区产品部数据类产品高级经理王晓野表示,企业业务总有波峰波谷之时,如何按照企业 80-90% 的业务峰值来规划数据库的存储容量和计算资源的话,将给应用带来一定的业务连续性的妥协和挑战。因此大多数企业都是按照峰值留有余地来选择数据库的计算资源,这将造成成本上的浪费。而 serverless 数据库服务可完成无差别的繁复工作和自动化扩展。

amazon dynamodb 是亚马逊云 科技 自研 serverless 数据库,其诞生最早可追溯到 2004 年,当时亚马逊电商作为 oracle 的客户,尽管对于关系型数据库在零售场景的需求并不频繁,70% 均是键值类操作,此时倒逼亚马逊电商思考:为什么要把关系型数据库这么重得使用?我们可以设计一款支持读写、可横向扩展的分布式数据库吗?后来的故事大家都知道了,这款数据库就是 amazon dynamodb,并在 2007 年发表论文,掀起业界 nosql 分布式数据库技术创新大潮。

amazon dynamodb 可为大规模应用提供支持,支撑亚马逊自身多个高流量网站和系统,如亚马逊电商网站、亚马逊全球 442 个物流中心等。在亚马逊电商一年一度 prime day,光是针对dynamodb api 的调用达到数万亿次,最高峰值请求达到每秒 8920 万次。由此可见,dynamodb 拥有高吞吐、扩展性、一致性、可预测响应延迟、高可用等优势。

智能可穿戴设备厂商华米 科技 ,在全球 70 多个国家拥有近 1 亿用户。仅 2020 年上半年,其手表出货量超 174 万台,截止到 2021 年 2 月,华米 科技 的可穿戴设备累计记录步数是 151 万步,累计记录的睡眠时间是 128 亿个夜晚,记录心率总时长达 1208 亿个小时。如此庞大的数据同时必须保证极高的安全性和低延迟相应,如何保证稳定性是巨大的挑战。

dynamodb 帮助华米 科技 在任何规模下都能提供延迟不超过 10 毫秒的一致响应时间。华米 科技 健康 云的 p0 和 p1 级别故障减少了约 30%,总体服务可用性提升了 0.25%,系统可用性指标达到 99.99%,为华为 科技 全球化扩展提供了有力的支撑。

最新无服务数据库产品是 amazon aurora serverless v2 提供瞬间扩展能力,真正把扩展能力发挥到极致,在不到一秒的时间内,将几百个事务扩展到数十万的级别。同时在扩展时每一次调整的增量都是非常精细化的去管理,如果按照峰值来规划数据库资源,可实现大概90%的成本节省。目前 amazon aurora serverless v2 在全球实现预览。

第三个理念是全球架构、一键部署。 在全球化的今天,如何支撑全球客户的业务扩展连续性、一致性、以最低延迟带给到终端客户上,对数据库提出新的挑战。

亚马逊云 科技 提供 amazon aurora 关系型数据库global database、amazon dynamodb、amazon elasticache 内存数据库、amazon documentdb 文档数据库都能利用亚马逊云 科技 的骨干网络提供比互联网更稳定的网络支撑,以一键部署的方式,帮助客户实现几千公里跨区域数据库灾备,故障恢复大概能在一分钟之内完成,同时跨区域的数据复制延迟通常小于一秒。

第四个理念是平滑迁移、加速上云。 目前,450000+ 数据库通过亚马逊云 科技 数据库迁移服务迁移到亚马逊云 科技 中,这个数字每年都在不断增长。亚马逊云 科技 提供 amazon dms、amazon database migration service 等工具让开发者和企业进行自助式云迁移。另外,对于迁移过程中可能会需要的支持,可通过专业服务团队和合作伙伴网络成员,为客户提供专业支持,还通过 database freedom 项目帮助客户降低他们的顾虑。

今年 11 月,最新产品 babelfish for amazon aurora postgresql 在全球和中国两个区域正式可用,可加速企业上云的迁移,实现让企业可以利用原有的技术栈、原有的 sql server t-sql的人员可以利用到云数据库进行创新。

第五个理念是 ai赋能,深度集成。 我们观察到,ml 技术赋能数据库开发者,开发者无需具备机器学习专业知识,就可进行机器学习操作。在此潮流下,亚马逊云 科技 推出 amazon neptune,借由 deep graph library 和 amazon sagemaker 驱动图神经网络。

今年 8 月,neptune ml 在中国正式可用,允许数据工程师不需要掌握机器学习的技能直接从图数据库里导出数据、转换格式、训练模型并发布,用 gremlin 语句调用训练成的模型在数据库里实现推理,进行欺诈检测,推荐物品。

目前,亚马逊云 科技 加速在中国区域服务落地,2021年至今新发布 60 多个数据库服务与功能。亚马逊云 科技 正是通过上述五大数据库理念,打造丰富的数据库产品家族,在全球智能化发展趋势下,为企业提供更快更好的数智服务,释放数据价值,并连续六年入选 gartner 领导者象限,得到业界和客户的深度认可。

二、亚马逊云数据库是一个怎样的存在?

属于亚马逊的云数据库服务。

云数据库 mysql(tencentdb for mysql)是腾讯云基于开源数据库 mysql 专业打造的高性能分布式数据存储服务,让用户能够在云中更轻松地设置、操作和扩展关系数据库。

云数据库 mysql 主要特点如下:

云存储服务,是腾讯云平台提供的面向互联网应用的数据存储服务。

完全兼容 mysql 协议,适用于面向表结构的场景;适用 mysql 的地方都可以使用云数据库。

提供高性能、高可靠、易用、便捷的 mysql 集群服务。

整合了备份、扩容、迁移等功能,同时提供新一代数据库工具dmc,用户可以方便的进行数据库的管理。

三、亚马逊十大物流技术是什么以及它们的特点

  1、亚马逊的智能机器人kiva技术

机器人作业颠覆传统电商物流中心作业“人找货、人找货位”模式,通过作业计划调动机器人,实现“货找人、货位找人”的模式,整个物流中心库区无人化,各个库位在kiva机器人驱动下自动排序到作业岗位。

2、无人机送货

顾客在网上下单,如果重量在5磅以下,可以选择无人机配送,在30分钟内把快递送到家。整个过程无人化,无人机在物流中心流水线末端自动取件,直接飞向顾客。

3、订单与客户服务中的大数据应用

电商完整端到端的服务可分为五大类,即浏览、购物、仓配、送货和客户服务等。

1)用户浏览:亚马逊有一套基于大数据分析的技术来帮助精准分析客户的需求。具体方法是,后台系统会记录客户的浏览历史,后台会随之把顾客感兴趣的库存放在离他们最近的运营中心,这样方便客户下单。

2)购物便捷下单:在这方面可以帮助客户不管在哪个角落,都可以快速下单,也可以很快知道他们的喜欢的选品。

3)仓储运营:大数据驱动的仓储订单运营非常高效,在中国亚马逊运营中心最快可以在30分钟之内完成整个订单处理,也就是下单之后30分钟内可以把订单处理完出库,从订单处理、快速拣选、快速包装、分拣等一切都由大数据驱动,且全程可视化。由于亚马逊后台的系统分析能力非常强大,因此能够实现快速分解和处理订单。

4)配送:精准送达是对于当前电商物流来说,绝对是一个技术活,电商物流的快物流不是本事,真正高技术的电商物流服务,是精准的物流配送,亚马逊的物流体系会根据客户的具体需求时间进行科学配载,调整配送计划,实现用户定义的时间范围的精准送达,美国亚马逊还可以根据大数据的预测,提前发货,实现与线下零售pk赢得绝对的竞争力。

5)crm客服:大数据驱动的亚马逊客户服务,据悉亚马逊中国提供的是7x24小时不间断的客户服务,首次创建了技术系统识别和预测客户需求,根据用户的浏览记录、订单信息、来电问题,定制化地向用户推送不同的自助服务工具,大数据可以保证客户可以随时随地电话联系对应的客户服务团队。

4、智能入库管理技术

1)在入库方面:采用独特的采购入库监控策略,亚马逊基于自己过去的经验和所有历史数据的收集,了解什么样的品类容易坏,坏在哪里,然后给他进行预包装。这都是在收货环节提供的增值服务。

2)商品测量:亚马逊的cubi scan仪器会对新入库的中小体积商品测量长宽高和体积,根据这些商品信息优化入库。例如鞋服类、百货,新的爆款等等,都可以直接送过来通过cubi 测量直接入库。

这给供应商提供了很大方便。客户不需要自己测量新品,这样能够大大提升他的新品上升速度;同时有了这个尺寸之后,亚马逊数据库可以存储下这些数据,在全国范围内共享,这样其他库房就可以直接利用这些后台数据,再把这些数据放到合适的货物里就可以收集信息,有利于后续的优化、设计和区域规划。

5、大数据驱动的智能拣货和智能算法

1)智能算法驱动物流作业,保障最优路径:在亚马逊的运营中心,不管是什么时间点,基本上在任何一个区域、任何一个通道里面,你不太会看到很多人围在一起,为什么?因为亚马逊的后台有一套数据算法,它会给每个人随机地优化他的拣货路径。拣货的员工直接朝前走,不要走回头路。系统会给推荐下一个要拣的货在哪儿,永远不要走回头路。而且确保全部拣选完了之后,路径最少,通过这种智能的计算和智能的推荐,可以把传统作业模式的拣货行走路径减少至少60%。

实现方式:拣货的时候,系统会告诉员工,拿着扫描枪,下一个应该去到哪个货位去检,走的路是最少的,效率最高。

2)图书仓的复杂的作业方法:图书仓采用的是加强版监控,会限制那些相似品尽量不要放在同一个货位。图书穿插摆放,批量的图书,它的进货量很大,因为它的需求很大。所以这样一来,亚马逊通过数据的分析发现,这样穿插摆放,就可以保证每个员工出去拣货的任务比较平均。

3)畅销品的运营策略:比如奶粉,有些是放在货架上的,有些是放在托拍位上的。像这些离的发货区会比较近,亚马逊根据后台的大数据,知道它的需求量也比较高,所以它进来的时候都是整批整批的进,然后就会把它放在离发货区比较近的地方,这样可以减少员工的负重行走路程。

6、随机存储

1)随机存储的运营原则:随机存储是亚马逊运营的重要技术,但要说明的是,亚马逊的随机存储不是随便存储,是有一定的原则性的,特别是畅销商品与非畅销商品,要考虑先进先出的原则,同时随机存储还与最佳路径也有重要关系。

2)随机存储与系统管理:亚马逊的随机存储核心是系统bin,将货品、货位、数量绑定关系发挥极致。收货:把订单看成一个货位,运货车是另一个货位,收货即货位移动;上架:bin绑定货位与货品后随意存放;盘点:与bin同步,不影响作业;拣货:bin生成批次,指定库位,给出作业路径;出货:订单生成包裹。

3)随机存储运营特色:亚马逊的运营中心有两大特色,第一个特色就是随机上架,实现的是见缝插针的最佳存储方式。看似杂乱,实则乱中有序。实际上这个乱不是真正的乱,乱就是说可以打品类和品类之间的界线,可以把它放在一起。有序是说,库位的标签就是它的gps,然后这个货位里面所有的商品其实在系统里面都是各就其位,非常精准地被记录在它所在的区域。

7、智能分仓和智能调拨

亚马逊作为全球大云仓平台 ,智能分仓和智能调拨拥有独特的技术含量。在亚马逊中国,全国10多个平行仓的调拨完全是在精准的供应链计划的驱动下进行的。

1)通过亚马逊独特的供应链智能大数据管理体系,亚马逊实现了智能分仓、就近备货和预测式调拨。这不仅仅是用在自营电商平台,在开放的“亚马逊物流+”平台中应用的更加有效果。

2)智能化调拨库存:全国各个省市包括各大运营中心之间有干线的运输调配,以确保库存已经提前调拨到离客户最近的运营中心。以整个智能化全国调拨运输网络很好地支持了平行仓的概念,全国范围内只要有货就可以下单购买,这是大数据体系支持全国运输调拨网络的充分表现。

8、精准预测、二维码精准定位技术

1)精准的库存信息:亚马逊的智能仓储管理技术能够实现连续动态盘点,库存精准率达到99.99%。

2)精准预测库存,分配库存:在业务高峰期,亚马逊通过大数据分析可以做到对库存需求精准预测,从配货规划、运力调配,以及末端配送等方面做好准备,平衡了订单运营能力,大大降低爆仓的风险。

3)亚马逊全球运营中心中,每一个库位都一个独特的编码:二维码是每一个货位的身份证,就是一个gps,可以在系统里查出商品定位,亚马逊的精准的库位管理可以实现全球库存精准定位。

9、可视化订单作业、包裹追踪

跨境电商方面:

从今年8月13日亚马逊发布了海外购?闪购,这是依托保税区/自贸区发货的创新模式。亚马逊海外购的商品非常有价格优势,同质同价。

1)全球云仓库存共享:在中国就能看到来自大洋彼岸库存,亚马逊实现全球百货,直供中国,这是全球电商供应链可视化中,亚马逊独特的运营能力。在中国独一无二地实现了全球可视化的供应链管理。

国内运作方面:

亚马逊平台可以让消费者、合作商和亚马逊的工作人员全程监控货物、包裹位置和订单状态。比如:昆山运营中心品类包罗万象,任何客户的订单执行,从前端的预约到收货;内部存储管理、库存调拨,拣货、包装;以及配送发货,送到客户手中,整个过程环环相扣,每个流程都有数据的支持,并通过系统实现全订单的可视化管理。

10、亚马逊独特发货拣货技术

作业人员像八爪鱼,像千手观音一样。会根据客户的送货地址,然后设计出来不同的送货路线。不同时间点经过不同的线路,分配到不同的流水线方向。在八爪鱼这边的作业台操作的员工,主要是负责把在前面已经运作完的货品,分配到专门的路由上去。

这种运营模式一个员工站在分拣线的末端就可以非常高效地将所有包裹通过八爪鱼工作台分配到各个路由上面,八爪鱼是非常高效的,据说这是亚马逊员工自己设计的。站在中间那个位置,一个人可以眼观六路,这个作业可以通达八方,非常的高效,没有人员的冗余。而且,八爪鱼上全部是滚珠式的琉璃架,没有任何的板台,员工的作业很轻松。

其他重要的技术应用

1)物联网技术:在亚马逊的运营中心, 安全标准设定很高,人和车物要分开,所以会有镜子帮助工作人员了解周围路况,有人就停下来。

另外,司机有安全带,员工有安全帽,安全帽里有芯片,如果探测到一定范围内有人,也会停下来,镜子的用途即是同理。

2)双库联动模式:亚马逊昆山运营中心有一个类似于天桥的传送带,全封闭式,其作用是完成不同品类的合单,可以通过传送带将一个库的货物转到另一个库中,这个又叫双库联动。而这里又是超大库,在两个超大库之间进行双库联动对效率有非常高的要求,对时间点的把控也很严格。

Top