Hadoop-HDFS的NameNode工作机制

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: Hadoop-HDFS的NameNode工作机制

image.png

NameNode工作机制

1、NameNode启动,加载编辑日志和镜像文件;(每个Block元数据约150B),获取最新元数据。
2、HDFS客户端进行增删改操作
3、NameNode记录编辑日志,之后修改内存中的元数据。
4、SecondaryNameNode请求NameNode是否需要CheckPoint。触发条件(定时1小时,编辑日志满100w)
5、SecondaryNameNode向NameNode请求执行CheckPoint
6、NameNode将编辑日志打标签,滚动生成另外的编辑日志文件。
7、SecondaryNameNode拷贝NameNode的编辑日志和镜像文件到自己的内存中,合并并生成新的镜像文件。
8、将新的镜像文件,拷贝到NameNode并重新命名。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
4月前
|
存储 分布式计算 Hadoop
Hadoop数据块分散存储NameNode管理
【4月更文挑战第17天】Hadoop是一个开源的分布式计算框架,依赖HDFS进行分布式存储。文件被分割成数据块分散在DataNode上,NameNode负责元数据管理和协调,确保数据可靠性。NameNode的高可用性配置能防止单点故障,保证系统稳定性。这套机制支持高效、可靠和可扩展的大数据存储与访问。
59 3
|
22天前
|
存储 机器学习/深度学习 分布式计算
HDFS NameNode元数据管理
HDFS NameNode元数据管理
|
22天前
|
分布式计算 安全 Hadoop
HDFS NAMENODE 安全模式
HDFS NAMENODE 安全模式
|
1月前
|
存储 分布式计算 Hadoop
|
1月前
|
存储 分布式计算 Hadoop
Hadoop 中 NameNode 和 DataNode 的角色
【8月更文挑战第12天】
55 4
|
20天前
|
存储 分布式计算 资源调度
|
2月前
|
分布式计算 Hadoop
Hadoop中NameNode故障
【7月更文挑战第11天】
47 3
|
3月前
|
存储 分布式计算 Hadoop
|
4月前
|
存储 分布式计算 Hadoop
Hadoop节点名称节点(NameNode)
【5月更文挑战第17天】
96 3
|
4月前
|
存储 分布式计算 监控
Hadoop的NameNode的监控与副本管理
【4月更文挑战第15天】NameNode是Hadoop HDFS的关键组件,负责元数据管理和监控,确保数据安全、可靠和性能。监控包括NameNode的状态、资源使用和性能,以保证集群稳定性。NameNode在副本管理中负责副本创建、分布、维护和删除,确保数据冗余和容错性。有效的监控和副本管理策略对Hadoop集群的高效运行至关重要。
75 2

相关实验场景

更多