问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

hadoop 1.x计算架构叫什么

发布网友 发布时间:2022-04-29 15:48

我来回答

1个回答

热心网友 时间:2022-04-14 07:38

1. HDFS中的一些概念

HDFS(Hadoop Distributed File System):分布式文件系统,将一个文件分成多个块,分别存储(拷贝)到不同的节点上,它是Hadoop体系中数据存储管理的基础。它是一个高度容错的系统,能检测和应对硬件故障,用于在低成本的通用硬件上运行。HDFS简化了文件的一致性模型,通过流式数据访问,提供高吞吐量应用程序数据访问功能,适合带有大型数据集的应用程序。

1.1 数据块

每个磁盘都有数据块的概念,在HDFS中也有数据块的概念,HDFS中的所有文件都是分割成块存储在Datanode上的,每个块默认64M。。每个块都有多个副本存储在不同的机器上:默认有3个副本,3个副本不可能存放在同一个机器上。 
HDFS副本存放策略 

以下是HDFS文件存储架构图 
*:表示每台机器 
绿色:文件被分割出的块 

例如: 
上图中part-0文件,有2个块。块1和块3只在2个机器上分别出现过2次。 
上图中part-1文件,有3个块。块2,4,5分别在不同的机器上各出现3次

HDFS中也可以显示块信息,使用fsck命令 
例如:下面的命令将列出文件系统中各个文件由哪些块构成

$ hadoop fsck / -files -blocks

1.2 NameNode和DataNode

HDFS的设计是主(Master)从(Slave)结构的。也就是,一个管理者(NameNode)和多个工作者(DataNode)组成。

1.2.1 管理者:Namenode

NameNode是主节点,它是一个中心服务器,负责管理整个文件系统的命名空间和控制着客户端对文件的访问。它不保存文件的内容,而是保存着文件的元数据(文件名称,所在目录,文件权限,文件拥有者,文件有多少块,每个块有多少副本,块都存在哪些节点上)。 
Namenode负责文件的元数据操作,Datanode处理文件内容的读写请求。 
跟文件相关的流不经过Namenode,只会询问该文件跟哪个Datanode有关系。 
副本存放在哪些Datanode上是由Namenode来控制。读取文件时,Namenode尽量让用户先读取最近的副本。 
Namenode全权管理数据块的复制,周期性的从集群中的每个Datanode接收心跳信号和块状态报告。 
Namenode和Datanode就是通过这两种方式来进行通信: 
心跳信号:意味着该Datanode节点工作正常 
块状态报告:包含了一个该Datanode上所有数据块的列表

元数据保存在内存中 
Namenode维护着整个文件系统树以及树内的所有文件。这些信息以两个文件的形式永久保存在磁盘上。命名空间镜像文件(fsimage)和操作日志(fsedits)文件 
1. fsimage是什么? 
fsimage是元数据镜像文件:Namenode启动后,文件的元数据被加载到内存中,加载到内存后也会把这些元数据写入到本地的磁盘中,这个文件就是fsimage文件。 
元数据镜像在内存中保存一份最新的,内存中的镜像=fsimage+fsedit 
2. fsedits是什么? 
fsedits是元数据操作日志文件:客户端要对文件进行读写操作,在这些操作产生的日志就存在了fsedit文件中。

1.2.1 工作者:Datanode

DataNode是从节点,它的作用很简单,就是存储文件的块数据。以及块数据的校验和。 
一个数据块在Ddtanode以文件存储在磁盘上,包括两个文件:数据本身和元数据(数据块的长度,块数据的校验和,时间戳) 
Datanode启动后向Namenode注册,通过后,周期性(1小时)的向Namenode上报所有块信息。 
心跳是3秒一次,如果超过10分钟没有收到某个Datanode的心跳。则认为该节点不可用。

1.3 Secondary Namenode

Secondary Namenode:Secondary表示助手的意思,也就是说Secondary Namenode表示NameNode的助手,辅助NameNode工作的一个节点。要了解Secondary Namenode节点都辅助NameNode做了哪些工作,我们需要先回顾下NameNode是做什么的? 
NameNode是HDFS中的一个主节点,主要是来管理其他DataNode从节点。它存储了HDFS系统的namespace和控制着客户端对HDFS文件系统的访问。NameNode在维护整个文件系统树的时候是以两个文件的形式永久保存在磁盘上。镜像文件(fsimage)和操作日志文件(fsedits)。考虑以下,这两个文件一直这样运行存在着有什么问题?

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
5等于1什么 为什么家里会有楼道跑来的猫? 为什么猫咪在屋里会叫呢 我家刚买了个小猫,但一买回来就没影了,今晚在2楼的杂物房听到它的叫声... 猫咪为什么在楼道里哭 唐柳公权书金刚经图书信息 金刚经导读内容简介 诺基亚6120c的飞行模式是什么意思 诺基亚5230 飞行模式是什么意思 张艺薰媒体专访 hadoop 1.x版本支持断点续传吗 巅峰托雷斯什么水平 比得上现在的苏牙吗 冬季北京周边自驾游去古北水镇怎么样?北京春节旅游除了市里郊区有好的选择吗? hadoop2和hadoop1的区别 自制果酱大概可以存放多久?邮寄的话要注意什么才不会变质? 北京自驾游有什么必去的地方吗? 北京自驾游 冬季 什么地方好玩? 量子力学的基本内容 量子力学的基本内容是什么? 说明经典力学,量子力学和相对论力学之间的区别和联系 量子力学和经典力学的区别与联系 经典力学与量子力学的区别 量子力学与混沌理论 量子力学的通俗解释是什么? 量子力学是讲什么的? 量子力学研究是对象是什么? 量子力学主要是研究什么的? 申请信用卡的电子邮箱怎么写 玩手游吃鸡,入耳式耳机怎样? 信用卡邮箱怎么写 六必查内容 汽车驾驶员要进行"六查",是哪六查? 我写的程序用的hadoop1可以在hadoop2的集群上运行吗 东方红yt4b2z-2于东方红yt4b2-2四有什么区别瓢壳一吗? hadoop1里/current/version文件在哪个目录下 hadoop 1个管理节点 支持多少节点 《Reconciliation》txt下载在线阅读全文,求百度网盘云资源 hadoop配置出现问题 hadoop 1.2.1 是多少位编译的 hadoop1和2能同时搭建么 兵马俑的历史沿革 “开了灯眼前的模样,寂寞的…诺大的床,关了灯都一个样”这歌词是哪首歌的? “开了灯,眼前的模样;偌大的房,”下一句是什么? 苏打绿《小时代》主题曲《我好想你》歌词 小时代4最后一点有一首插曲,好像歌词有一句开了灯眼前的模样,,关了灯全都一个样。歌名叫什么 我好想你,好想你这句歌词歌名字叫什么 小时代主题曲歌词 我好想你 苏打绿 歌词 这句歌词是哪首歌的歌词:生命 随年月流去 随白发老去 生命随岁月流逝是什么歌的歌词吧