问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

实时数据仓库如何做?

发布网友 发布时间:2023-05-03 06:33

我来回答

1个回答

热心网友 时间:2023-11-06 12:09

3.1.1Lambda架构

来自ApacheFlink中文学习网站ververica.cn侵权告知立删

3.1.2Kappa架构

来自ApacheFlink中文学习网站ververica.cn侵权告知立删

3.1.3实时olap变体架构

来自ApacheFlink中文学习网站ververica.cn侵权告知立删

3.1.4常见架构对比

来自ApacheFlink中文学习网站ververica.cn侵权告知立删

ps:lambda架构

开发割裂感:

表结构不同

sql语法不同

资源浪费:

重复计算

重复存储

集群维护:

组件不同

计算引擎不同

数据一致性

3.2实时数仓架构

3.2.1方案一

优点:

便于数据回溯、重算和数据质量验证。

缺点:

通过批处理重算,需要维护两套代码,开发和维护成本高。

需要两套计算资源

适用场景:

超大规模历史数据计算,且这种场景比较频繁。

对数据质量要求极高,需要比对实时和离线的计算结果,甚至利用离线去修正实时的计算结果。

3.2.2方案二

优点:

无需维护两套代码,开发迭代速度快。

数据回溯和重算方便,重算时间根据需求回溯的时间范围定。

只需流计算资源,资源占用小

缺点:

ODSDWD部分数据“不可见”,原始数据和中间数据不便于查询(解决方案:可通过重新消费指定时间范围的数据查询,或导入需要的数据到olap引擎)

依赖业务端反馈问题(解决方案:设计数据质量监控指标,实时监控报警)

适用场景:

ODSDWD查询不频繁等

3.2.3方案三

相对于方案二:

增加ODS层落地hive,排查分析原始数据比较方便,恢复历史数据的时候可获取hive数据写入kafka,然后按原流处理的逻辑重新处理即可,只需修改数据源为历史数据对应的topic。

需新增kafka写入hive逻辑

需新增从hive读取数据写入kafka

需新增整条链路历史数据对应的topic

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
华润微申购什么时候上市? 老公不带避孕套导致老婆两次打胎说明什么 男友不爱戴套套怎么办? ...中的男人都那么自私自利,只顾自己享受,不用避孕套保护女友,而是经常... 剪下一断苹果枝会长出根来吗 和平精英 和平精英循环脸怎么解决? 和平精英什么情况下弹人脸识别 如何避免触发人脸 Winxp sp2 英文版如何安装补丁 xp64位英文版怎么安装?因为网上只有英文版在64位win7系统运行下有共有... 关于安装英文版XP操作系统 浙江华光电器集团有限公司的企业介绍 华光的结构华光的结构是什么 华光电器基本功能 华光电器产品特征 华廷酒窖华光电器的品牌 中国好声音2022优酷播放量 心情不好忧伤的心情文案短句 抑郁崩溃的文案 让人伤感落泪的短句 与同学之间的集体关系是什么 今,和令多一点是什么意思? 个体和群体的关系是什么? qq号能注册吗 如果没有量角器只有一副三角板怎样利用三角板画出十五的角 怎样用一副三角板画出15°的角 用QQ号可以注册吗 QQ号可以注册吗? qq号可以注册吗 能用qq号申请吗 qq号可以注册吗 价格的单词是什么? ie9升级到ie11ie11以下载好但提示获取更新后才能安装怎么获取啊 精彩回顾和精彩回放的区别 反复回忆电影情节是什么意思呀 回顾展的意思回顾展的意思是什么 电影昔日情人结尾什么意思啊 23年北京银行定期存款利率 怎样用剩饭做好吃的 经常喝红茶有什么好处或害处 淘淘倒了一杯纯牛奶,先喝了二分之一,加满水后,又喝了二分之一,再加满水喝完。淘淘喝的牛奶多还是水多 梦见别人给我倒了杯水的预兆 君王倒了杯毒酒说:祝弟弟活千岁,弟弟说了什么,竟救自己一命? 车抵押贷款几天下款? 电影《永远止境》结局到底是什么意思? 不准忘了我电影结局什么意思 致命吸引结局什么意思 电影神话结局是什么? 谈谈小说文体杂糅的好处? 整蛊老公的方法大全 四川一女子故意喂酸话梅整蛊丈夫,你如何看待女子这一行为? 整蛊是什么意思,来人哦,谢谢