问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

Hadoop相比是否有优势

发布网友 发布时间:2022-05-25 14:31

我来回答

1个回答

热心网友 时间:2023-11-04 19:47

Storm优势就在于Storm是实时的连续性的分布式的计算框架,一旦运行起来,除非你将它杀掉,否则它一直处理计算或等待计算的状态.Spark和hadoop都做不到.
当然它们各自都有其应用场景,各有各的优势.可以配合使用.
下面我转一份别人的资料,讲的很清楚.
Storm与Spark、Hadoop这三种框架,各有各的优点,每个框架都有自己的最佳应用场景。
所以,在不同的应用场景下,应该选择不同的框架。
Storm是最佳的流式计算框架,Storm由Java和Clojure写成,Storm的优点是全内存计算,所以它的定位是分布式实时计算系统,按照Storm作者的说法,Storm对于实时计算的意义类似于Hadoop对于批处理的意义。
Storm的适用场景:
1)流数据处理
Storm可以用来处理源源不断流进来的消息,处理之后将结果写入到某个存储中去。
2)分布式RPC。由于Storm的处理组件是分布式的,而且处理延迟极低,所以可以作为一个通用的分布式RPC框架来使用。
SparkSpark是一个基于内存计算的开源集群计算系统,目的是更快速的进行数据分析。Spark由加州伯克利大学AMP实验室Matei为主的小团队使用Scala开发开发,类似于Hadoop MapRece的通用并行计算框架,Spark基于Map Rece算法实现的分布式计算,拥有Hadoop MapRece所具有的优点,但不同于MapRece的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的Map Rece的算法。
Spark的适用场景:
1)多次操作特定数据集的应用场合
Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小。
2)粗粒度更新状态的应用
由于RDD的特性,Spark不适用那种异步细粒度更新状态的应用,例如Web服务的存储或者是增量的Web爬虫和索引。就是对于那种增量修改的应用模型不适合。
总的来说Spark的适用面比较广泛且比较通用。
Hadoop是实现了MapRece的思想,将数据切片计算来处理大量的离线数据数据。Hadoop处理的数据必须是已经存放在HDFS上或者类似HBase的数据库中,所以Hadoop实现的时候是通过移动计算到这些存放数据的机器上来提高效率。
Hadoop的适用场景:
1)海量数据的离线分析处理
2)大规模Web信息搜索
3)数据密集型并行计算
简单来说:
Hadoop适合于离线的批量数据处理适用于对实时性要求极低的场景
Storm适合于实时流数据处理,实时性方面做得极好
Spark是内存分布式计算框架,试图吞并Hadoop的Map-Rece批处理框架和Storm的流处理框架,但是Spark已经做得很不错了,批处理方面性能优于Map-Rece,但是流处理目前还是弱于Storm,产品仍在改进之中
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
索尼爱立信Lt22i的狂野飙车的数据包该怎么删掉 小熊的音 飙风二重唱我怎么找不到 河南飙风信息科技有限公司怎么样 散粉和粉饼哪个定妆效果好 新手适合用散粉还是粉饼 手机端PokemonHome ...宝剑出匣耀光明 在匣全然不惹尘 今得贵人携出现 有威有势众人钦 奚惆怅而独悲的上一句是什么 贵州茂兰国家级自然保护区-荷花池地址在哪里? 请问一下拍出来的视频偏绿色,怎么用prcs6调回来呢? Premiere怎么去色处理-Premiere去色处理教程 win10系统怎么wifi密码 需要一款局域网聊天软件,能实现文件群发,并有短信通知功能 不知道哪种软件能这些功能? 局域网邮件群发问题? 局域网共享用户文件发送 如何实现局域网文件集体传输和删除? 怎么在局域网里群发信息? 人生规划论文怎么写?范文 手机百度网盘提示可能由于您设备时间有误,导致网络证书失效,获取文件失败,请设置正确时间后重试 百度网盘获取个人分享列表失败是怎么回事? 百度网盘列表加载失败 百度网盘里边的东西都在,但是app登陆每次都显示获取文件列表失败?怎么回事啊 为什么百度云盘总显示“获取分享列表失败”,删了重新下载也没用。 百度网盘获取个人列表失败怎么解决 百度网盘获取个人分享列表失败,求解 戴尔笔记本,连不上网络,适配器出问题,求解决 DELL的D620网络适配器设置问题 戴尔笔记本win7网络适配器问题 【车主点评:大气磅礴的大众途观L】 戴尔电脑网络适配器跟网络要求不匹配。连不上wifi 戴尔电脑连不上网怎么办 诊断说是网络适配器的问题 spark与mongodb这样的框架怎么样?还是说在一些应用场景比较适合 青岛长途汽车总站到底指的哪个站?另外哪几个青岛车站有到沂南的汽车 胶州汽车站在哪? 在三视图中,机件的每一个尺寸,只需标注一次是对的吗? 一部电影一个男的用钱给一个女的点烟,然后另一个男的用钱把咖啡热了是那部电影? QQ号2代保护怎么设置才最安全 通过华为光伏道变器案例我们应该明白什么 王靖阳这名字咋样,属马十月初七中午一点十四分生帮忙看 QQ号码怎样才能最安全? 新QQ号如何保护才安全? 怎么才能让QQ号,更安全? 怎么和身份证绑定? qq号码怎样才能最安全 QQ号怎么最安全,我一天被盗一次 600万人民币在东京买多大的房子 新乡何老二水煎包做法 在58同城上投简历后,在简历投递记录中,投递反馈有的标明待反馈,有的标明企业以查看是什么意思 58上已经向招聘方投递了简历,为啥微聊时还要简历? 在58上投招聘简历,申请后一直显示保存中为什么? 怀化茶油批发市场在哪里? 怀化茶油收购价格