大数据Flink进阶(二):数据架构的演变-最新
2023-03-19 02:22:31 来源:腾讯云

数据架构的演变

近年来随着越来越多的大数据技术被开源,例如:HDFS、Spark等,伴随这些技术的发展与普及, 促使企业数据架构的演进——从传统的关系型数据存储架构逐步演化为分布式处理和存储的架构。我们通过数据架构的演变角度来了解下为什么今天Flink实时计算引擎会爆火起来。


(资料图)

一、业务处理-单体架构

传统单体架构最大的特点是集中式数据存储,一个企业中可能有很多业务系统,例如:订单系统、CRM系统、ERP系统等,这些系统的数据一般存储在关系型数据库中,这些存储的数据一般反应当前的业务状态,也就是存储的是支撑业务正常运转的事务数据,例如:系统订单交易量、网站活跃用户数、每个用户在线的状态等,针对这些数据库的操作也主要是增删改查操作,单体架构如下:

单体架构初期的效率很高,但是随着时间的推移,业务越来越多,业务系统逐渐变得庞大,越来越难维护与升级,并且不同的业务系统之间可能有一些共同的业务模块,并且一单业务系统依赖的数据库有问题会导致整个业务系统变的不可用,为了解决以上问题,企业开始逐渐采用微服务架构作为企业业务系统的架构体系。

二、业务处理-微服务架构

微服务架构的核心思想是一个应用由多个小的、相互独立的微服务组成,这些服务运行在自己的进程中,开发和发布都没有依赖,不同的服务能依据不同的业务需求,构建不同的技术架构之上,组成不同的业务系统应用。

微服务架构将系统拆解成不同独立的服务模块,每个模块分别使用各自独立的数据库,这种模式解决了业务系统的扩展问题,也带来了新的问题——业务交易数据过于分散在不同的系统中,很难将数据进行集中化管理。微服务架构如下:

无论是单体架构还是微服务架构主要针对的还是企业的业务系统,也就是业务平台,对应的数据库存储的数据也是增删改查的事务型数据,这些业务系统上主要进行的也是OLTP业务操作,对于企业内部进行数据分析(OLAP分析)或者数据挖掘之类的应用,则需要通过从不同的数据库中进行数据抽取,将数据从不同的数据库中进行周期性同步到数据仓库中,然后在数据仓库中进行统一规范的清洗分析处理,最终结果提供给不同的数据集市和应用。

三、数据分析-大数据Lambda架构

最初很多公司构建分析系统对应的数据仓库都是基于关系型数据库之上,例如:MySQL、Oracle数据库,但是随着企业数据量的增长,关系型数据库已经无法支撑海量数据集的存储与分析,这时随着大数据相关技术的兴起,很多企业基于大数据相关技术构建数据分析对应的数据仓库,例如: Hadoop中的HDFS 、Hive。

基于大数据平台构建数据仓库的过程,数据往往都是周期性的从业务系统中同步到大数据平台,完成一系列ETL转换操作后,最终形成报表数据提供给数据集市展示使用,这就是通常我们说的离线数据分析。但是对于一些实时性要求比较高的应用,例如:实时报表系统,则必须有非常低的延时展示统计结果,这就是我们说的实时数据分析。企业中这个时期采用Lambda架构来处理离线数据和实时数据的分析,大数据Lambda架构如下:

Lambda架构在一定程度上解决了不同计算场景问题,但是带来的问题是框架太多导致平台复杂度过高、运维成本高,例如,在这个时期要完成离线计算需要使用Hive、MapReduce离线计算框架,完成实时计算需要使用Storm实时计算框架,对相应的开发和维度带来很高的成本。

后来随着Apache Spark分布式计算框架的出现,Spark可以处理离线数据,同时可以将实时数据作为微批处理来应对实时处理场景,总之,Spark可以让Lambda架构使用一套计算框架完成批处理和实时处理计算,但是Spark本身是基于批数据处理模式处理流式数据,并不能完美高效的处理实时要求非常高的场景。

关于大数据分析架构演变过程中在大数据中除了有Lambda架构之外,还有Kappa架构、混合架构及湖仓一体架构,以上各个架构都是在大数据不同时期针对公司业务数据分析场景提出的,都是解决企业数据分析过程中业务痛点问题的架构。

四、有状态流计算架构

Lambda架构中针对实时数据处理我们可以使用Spark计算框架进行分析,Spark针对实时数据进行分析本质是将实时流数据看成微批进行处理,数据产生的本质是一条条真实的事件,这种处理实际上针对实时流事件分析有一定的延迟,很难在实时计算过程中进行实时计算并直接产生统计结果,因为这需要计算框架满足高性能、高吞吐、低延时等目标。随着有状态流计算架构的提出,从一定程度上满足了企业对实时流数据处理的高性能、高吞吐、低延时目标,企业可以基于实时的流式数据,维护所有计算过程的状态,所谓状态就是计算过程中产生的中间计算结果,每次计算新的数据进入到流式系统中都是基于中间状态结果的基础上进行运算,最终产生正确的统计结果。

基于有状态计算的方式最大的优势是不需要将原始数据重新从外部存储中拿出来,从而进行全量计算,因为这种计算方式的代价可能是非常高的。从另一个角度讲,用户无须通过调度和协调各种批量计算工具,从数据仓库中获取数据统计结果,然后再落地存储,这些操作全部都可以基于流式计算完成,可以极大地减轻系统对其他框架的依赖,减少数据计算过程中的时间损耗以及硬件存储。有状态计算架构如下:

可以看出有状态流计算架构将会逐步成为企业作为构建数据平台的架构模式,Apache Flink 就是有状态的流计算架构,通过实现Google Dataflow流式计算模型实现了高吞吐、低延迟、高性能兼具的实时流式计算框架,同时Flink支持高度容错的状态管理,防止状态在计算过程中因为系统异常而 出现数据丢失,Flink周期性地通过分布式快照技术Checkpoints实现状态的持久化维护,即使在系统停机或者异常情况下都能正确的计算出来结果。

大数据Flink进阶(二):数据架构的演变-最新

2023-03-19

今日诛仙手游长生界篇第一章_诛仙之长生入道

2023-03-18

天天通讯!抽象数据类型是什么_抽象数据类型

2023-03-18

环球快消息!意甲名宿:国米对阵本菲卡会很困难,若进决赛小因扎吉应该留下来

2023-03-18

合肥市房产局首次发布!

2023-03-18

每日关注!九年级听力材料人教版(九年级听力mp3人教版)

2023-03-18

焦点播报:胜利者的圣洁印记有什么用_胜利者的圣洁印记

2023-03-18

全球今亮点!重磅!《宜荆荆都市圈发展规划》发布

2023-03-17

奥飞数据控股股东昊盟科技终止协议转让事项

2023-03-17

江西樟树:春游梨花海 美景入画来

2023-03-17

麦趣尔(002719)3月17日主力资金净卖出1108.16万元

2023-03-17

3月17日山东利华益集团油品报价暂稳

2023-03-17

2023深圳大学传播学院招聘项目助理一名 全球视点

2023-03-17

【独家】中国化学3月17日快速回调

2023-03-17

葡体是自1991年的本菲卡以来,首支在欧战淘汰阿森纳的葡萄牙球队-天天微资讯

2023-03-17

3月16日基金净值:招商产业精选股票A最新净值0.775,跌0.76% 环球快报

2023-03-17

km8kw.xyz_km8kw xyz_环球视点

2023-03-16

R语言基础笔记-01(数据类型与向量)

2023-03-16

2023年郑州市宏河路社区老年人健康体检通知 每日简讯

2023-03-16

2023年3月16日全国无水氯化钙价格最新行情预测_快报

2023-03-16

【全球时快讯】太原全程马拉松起点设在哪?终点是在哪?

2023-03-16

当前速读:观察日记300字四年级_观察日记300字

2023-03-16

提师能 修师表 铸师魂

2023-03-16

当前热点-天津周边二日自驾游_天津周边两日自驾游

2023-03-16

揭阳高铁站和揭阳机场站的区别(揭阳高铁站)

2023-03-16

天天微动态丨劳动权保障具体体现为_劳动权

2023-03-15

商业场|四川省儿童社会实践公益活动示范基地落地成都商场 今日关注

2023-03-15

【环球播资讯】鬼曼童的来历_鬼曼童

2023-03-15

美媒:越来越多中国人开始喜欢冲浪

2023-03-15

【世界播资讯】毒液百度云txt_毒液百度云

2023-03-15

上奉专线每个站点时间_上奉专线

2023-03-15

最新资讯:池上古诗_说一说池上古诗的简介

2023-03-15

环球热推荐:邮储银行鹤壁市分行积极开展金融知识普及活动

2023-03-15

眭在姓氏中念什么_眭在姓氏中的读法

2023-03-15

隔夜洋葱可以吃吗?-环球快播报

2023-03-14

【全球独家】美国:签名银行被当地监管机构关闭

2023-03-14

段厅长性贿赂了多少人,她睡过的人都有谁?背后还有“大老虎”吗

2023-03-14

2月车企排名:乱套的不止价格|最新消息

2023-03-14

公积金提前还贷不收违约金

2023-03-14

您发现了吗?近6年来,北京“多”出13个“奥森”

2023-03-14

环球观天下!同花村_tonghuacun

2023-03-14

微头条丨中铁787号助力东莞地铁1号线富民南路站—黄江北站区间顺利贯通

2023-03-14

研究团队发现了一种导致赫赛汀抗性的机制

2023-03-13

全球速看:高邮湖上花海停车收费标准

2023-03-13

海能实业(300787)3月13日主力资金净卖出856.86万元

2023-03-13

中国红_说一说中国红的简介

2023-03-13

每日观点:巴尔韦德:我们对VAR判罚感到生气,焦点总是在裁判身上

2023-03-13

《流浪地球2》40亿!“太空玫瑰”成王智新标签

2023-03-13

环球简讯:海晏河清的典故(海晏河清)

2023-03-13

世界观热点:A股:得知3个消息出炉,周一股市或将大幅上涨?

2023-03-12

【环球热闻】应届毕业生做程序员8个月后改行送外卖,当事人:我的状态比以前更好

2023-03-12

火影忍者佐助vs团藏是多少级_火影忍者佐助vs团藏是哪一集?

2023-03-12

【天天热闻】工伤鉴定要多久鉴定才有效

2023-03-12

世界短讯!五年级英语上教学设计_五年级英语上教学计划

2023-03-12

丹东大鹿岛旅游攻略 自驾游_丹东大鹿岛旅游攻略

2023-03-12

外婆桥任然免费听(外婆桥任然)

2023-03-11

全球简讯:强化普法宣传 提升法治意识——毕节农商银行开展普法知识抢答竞赛活动

2023-03-11

短讯!微信视频下载到u盘_微信视频下载

2023-03-11

参政消息

2023-03-11

电源风扇朝向(电源风扇)-全球聚焦

2023-03-11

天天速读:什么样的季节填空词语一年级_什么的季节填空一年级

2023-03-11

医疗器械生产许可证办理流程_医疗器械生产许可证|全球头条

2023-03-11

B站考虑全面取消播放量数据的显示|环球视讯

2023-03-10

全球新资讯:首钢股份(000959.SZ):北京新能源拟实施存续分立

2023-03-10

建安区城管局积极开展“文明实践周”活动

2023-03-10

塞娅公主扮演者_塞娅

2023-03-10

观天下!生意宝3月10日盘中跌幅达5%

2023-03-10

老凤祥回收黄金多少钱一克(2023年3月10日)-环球焦点

2023-03-10

汽车股早盘集体大跌,长城汽车(02333.HK)一度跌超8%

2023-03-10

每日快讯!圣安地列斯完美通关无限金币_圣安地列斯完美通关存档

2023-03-10

男孩沉迷手机被迫连玩17小时 父亲:不建议其他家长尝试-环球新视野

2023-03-10

实时焦点:宝宝双肺纹理增重是什么意思_双肺纹理增重是什么意思

2023-03-10

头条焦点:二传手的职责_二传手是什么意思

2023-03-09

蝙蝠的寓意和象征风水_蝙蝠的寓意

2023-03-09

排名前十的基因检测公司_国内基因检测十大公司_当前时讯

2023-03-09

京东物流年营收1374亿:外部客户收入占比近7成 经调整利润8.7亿 全球视讯

2023-03-09

【快播报】黑椒猪排的做法_猪排的做法

2023-03-09

每日速看!Spotify 的新设计看起来像 TikTok

2023-03-09

a4尺寸是几寸_a4尺寸是几寸照片 世界微动态

2023-03-09

MWC23观察:中兴通讯“硬核”产品展现“硬实力” 全球最资讯

2023-03-09

根据规定临时存款账户的有效期最长不超过 世界时快讯

2023-03-09

天津:打造高技能人才留“滨”计划

2023-03-09

线上线下同步监管 化妆品行业迎“紧箍”

2023-03-09

女生短发卷发教程_短发卷发教程

2023-03-09

天天速递!病退和正式退休的工资待遇有区别吗?

2023-03-09

阳了应该怎么办-阳性感染者如何用药 03月08日20时山西忻州疫情数据

2023-03-08

超长待机智能手机推荐_超长待机智能手机_环球报资讯

2023-03-08

世界时讯:佛山工伤保险长期待遇自助认证办理指南

2023-03-08

每日快报!是谁的心孤单的留下是什么歌

2023-03-08

全球时讯:思美传媒(002712):关于召开2023年第一次临时股东大会,审议3项议案

2023-03-08

简讯:力源信息:与Ampleon代理的相关产品可用于6G

2023-03-08

纸老虎指的是什么人-世界最新

2023-03-08

灵活就业养老保险和职工养老保险一样吗?灵活就业养老保险怎么交?

2023-03-08

参数估计-焦点快报

2023-03-08

前沿热点:vivos7e有哪些特色功能

2023-03-08

天天消息!女歌手大全 名单 中国十大殿堂级女歌手,华语乐坛最具代表性歌手

2023-03-08

火烧云的资料有什么

2023-03-08

数字乡村板块3月7日跌2.45%,创意信息领跌,主力资金净流出8.68亿元

2023-03-08

马赛飞 每日热文

2023-03-08

天天热推荐:英吉利_关于英吉利的简介

2023-03-07