问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

Spark为什么要在Hadoop基础之上搭建

发布网友 发布时间:2022-04-22 04:23

我来回答

1个回答

热心网友 时间:2022-04-15 01:22

这个问题让我想起来之前看到的一篇关于spark和hadoop区别的文章,从二者的区别上基本可以分析为spark为何要在hadoop基础上搭建。看一下下面的几点:
1、目的:首先需要明确一点,hadoophe spark 这二者都是大数据框架,即便如此二者各自存在的目的是不同的。Hadoop是一个分布式的数据基础设施,它是将庞大的数据集分派到由若干台计算机组成的集群中的多个节点进行存储。Spark是一个专门用来对那些分布式存储的大数据进行处理的工具,spark本身并不会进行分布式数据的存储。
2、两者的部署:Hadoop的框架最核心的设计就是:HDFS和MapRece。HDFS为海量的数据提供了存储,则MapRece为海量的数据提供了计算。所以使用Hadoop则可以抛开spark,而直接使用Hadoop自身的maprece完成数据的处理。Spark是不提供文件管理系统的,但也不是只能依附在Hadoop上,它同样可以选择其他的基于云的数据系统平台,但spark默认的一般选择的还是hadoop。
3、数据处理速度:Spark,拥有Hadoop、 MapRece所具有能更好地适用于数据挖掘与机器学习等需要迭代的的优点;但不同于MapRece的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
4、数据安全恢复:Hadoop每次处理的后的数据是写入到磁盘上,所以其天生就能很有弹性的对系统错误进行处理;spark的数据对象存储在分布于数据集群中的叫做弹性分布式数据集中,这些数据对象既可以放在内存,也可以放在磁盘,所以spark同样可以完成数据的安全恢复。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
如何在win10下安装docker? windows(win10)上的docker使用:安装(国内镜像)、操作 win10安装dockerWin10下Docker安装和使用 关于安装配置docker,找不到Hyper-V(win10 家庭版需要配置,专业版不需要... 怎么把微信上的聊天记录转到新手机 怎么把聊天记录转到另一个手机 快递被别人冒领,快递公司有没有责任 洋葱汤洋葱汤 一颗洋葱汤怎么做 一颗洋葱汤怎么做好吃 spark 中 设置日志级别 有什么用 大数据时代,为什么使用Spark框架 2分钟读懂Hadoop和Spark的异同 hadoop和spark的区别 Spark SQL CLI的元数据库和数据默认情况下分别存在... Spark中cache和persist的区别 spark javardd怎么设置的存储级别 到底spark 缓存机制怎么用 spark是不是要求内存足够大 装Windows RT的平板电脑Surface,怎么看它的Mac地址... Tableau、PowerBI和永洪这些厂商怎么样? spark处理数据如何用服务器内存 平板电脑MAC 地址怎么老变,怎么解决 国内主流的BI工具有哪些,公司最近接个项目做数据可... 平板电脑MAC地址会变么,变了怎么解决? 用友BI一般报价是多少?用友BI哪家好呀? win8.1平板电脑怎样修改MAC地址? 光纤中兴f420进入192.168.1.1后怎么设置 从事财务方面,Excel基础一般,想报网课学习Power ... 台电平板电脑mac地址谁知道怎么才能找到 spark 默认是用sbt 还是用maven Hadoop与分布式数据处理 Spark VS Hadoop有哪些异同点 Linux里面spark作用是什么? 如何使spark默认支持解析csv文件 spark默认master是什么意思 Spark应用是用来做什么的? 笔记本电脑如何重装系统 华为手机如何查看已连接wifi密码显示不出二维码 vivoy93解不开锁屏想自己清除数据额还需要解锁密码... vivo y93开机显示两种锁屏,一个是系统锁屏,一个... vivoy93如何用面部解锁手机隐私应用? h3c s5100 series交换机上mode下面有一个按钮有什... h3c交换机上面switch-mode standard这个命令是什么... H3C上端口切换按钮是干什么用的 交换机启动的时候按mode键会怎么样 华为交换s5700长按mode键6秒,无法进入不了配置模式 catalyst 2900交换机上面有个 MODE的按钮 这个是调... H3C交换机配置无法执行port link-mode route指令 cisco交换机MODE按键是什么意思 思科交换机按住mode键30秒有什么后果?