问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

为什么storm的数据来自于消息队列

发布网友 发布时间:2022-05-06 00:20

我来回答

1个回答

热心网友 时间:2022-06-28 09:28

Storm的解决问题的scope主要在于流计算,说流计算之前我们先简单的说下一般数据处理系统的过程。一般数据处理简单说要有几个环节:数据采集,数据计算,结果输出。题主的问题主要是在数据采集和计算之间的对接。
一般来说计算系统(storm)不会自己产生业务数据,业务数据一般来自页面的埋点,或者对数据库log的解析,对于storm来说采集系统是个外部系统。 采集系统是数据的生产者,流计算(storm)是数据的消费者。二者的速度并不是时时刻刻匹配的,中间就需要需要一个缓冲,这个模型下消息队列在适合不过了。当然为什么一般用kafka,这个超出了这个问题,我们暂不讨论。如果题主要处理的数据不是实时产生的而是静态数据那就没必要使用消息队列了,当然也没必要使用storm,使用Hadoop MR更合适。
关于spout会不会重复读取数据的问题,简单来说消息队列中数据会分partition支持多并发。 题主可以看看kafka的文档,一般消息队列,对一份数据(一个topic,对应离线系统的表)会分不同的parition,不同的spout并发可以读取不同的parition,当然一个并发可以读取多个parition,但是多个并发读取一个parition会引起混乱这就是题主的问题。也就是实际应用中一个parition只会有一个并发读取。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
高考为什么不能补报志愿? 帮我翻译一句话“不管多久以后,不管世界变成什么样子,我都是哪个最骄傲... 温州到周口的大巴车经过台州路桥客运中心那里吗? 微信怎么设置看不到微信号 不想让微信号显示出来怎么办 2021年大学教师资格证报名费用 大埔教师资格证报名网 大埔县教育局办教师资格证需要准备哪些资料? 深情触摸2016百度云链接 求深情触摸百度云分享 昌平住房公积金管理处的位置在哪? 昌平公积金贷款交易需要多长时间 昌平单位怎么办理住房公积金,对单位有什么要求 昌平公积金管理中心在哪里 昌平住房公积金中心在哪里? 想知道: 北京市昌平区住房公积金管理处 在哪 电话是多少 网上怎么没有咨询电话啊 老公不在家我发现一遇到异性我就乱想我会不会出轨? 老公常年不在家,我该怎么样,出轨 因为老公经常不在家所以我出轨了,好像迷恋上了这种感觉,怎么办 按五行求张姓女孩名字 属虎1998年生姓张改名 98年属虎的女孩姓张叫什么名字好 女孩张姓2010年6月11日2点55分生属虎起名 2011年张姓女孩起名带国字属虎 姓张属虎女孩取名字 姓张属虎女孩起名 东湖新技术开发区光谷软件园E3在哪,从光谷图书城到那怎么坐车? 怎么去武汉东湖开发区光谷软件园C6栋401 从武昌火车站下车后, 怎么坐公车去"东湖新技术开发区关山大道1号光谷软件园"? 大约要多长时间? 武汉市东湖新技术开发区关山一路1号光谷软件园 北京市西城区怎么坐车到昌平区昌平区东关南里北京住房公积金管理中心昌平管理部 北京昌平元旦当天住房公积金管理中心能办业务吗? 回龙观坐几号地铁能到昌平区住房公积金管理中心 最大隔音系数能达50db是什么意思1 维修空调里的“一般在50db一下”是什么意思,谢谢帮忙 法律上是怎么定义噪音的?是分贝大小?是否要干扰到很多人后才算噪音? 抗干扰噪声能力50dB啥意思 平常所说的环境噪声值或者噪声级多少分贝(dB)是指的声功率级Lw还是A声级? 中国有哪些高校开设了ACCA方向班 温度杯,这款touch温度杯有用过的吗,就是触碰可以显示温度的保温杯。值得入手吗? 中国哪些大学开设ACCA专业 国内有哪些高校与楷博合作开设了ACCA方向班? 《尼罗河的男儿》雾容电子书txt全集下载 尼罗河的男儿by雾容免费小说在线观看 东莞理工学院城市学院目前国内有哪些已经举办了ACCA成建制班? 求小说 《火影之天天大王》全本txt by雾容 《《慕春》雾容》最新txt全集下载 《供不应裘》雾容小说txt全集免费下载 acca专业方向班怎么样 《《幸灾乐祸》雾容》txt全集下载