利用glusterfs构建网站分布集群存储

简介: 利用glusterfs构建网站分布集群存储 一、前言 GlusterFS是一个开源的分布式集群文件系统,于2011年被红帽收购。它具有高扩展性、高性能、高可用性、可横向扩展(scale-out)的弹性特点,借助tcp/ip或infiniBand RDMA(remote direct memory access)网络将物理分布的存储资源聚集一起,使用单一全局命名空间来管理数据,无元数据服务器设计使glusterfs没有单点故障隐患(通过有的弹性Hash算法),详细介绍请查看官网:www.gluster.org 。
利用glusterfs构建网站分布集群存储

一、前言
GlusterFS是一个开源的分布式集群文件系统,于2011年被红帽收购。它具有高扩展性、高性能、高可用性、可横向扩展(scale-out)的弹性特点,借助tcp/ip或infiniBand RDMA(remote direct memory access)网络将物理分布的存储资源聚集一起,使用单一全局命名空间来管理数据,无元数据服务器设计使glusterfs没有单点故障隐患(通过有的弹性Hash算法),详细介绍请查看官网:www.gluster.org 。
典型架构:存储服务器(Brick Server)、客户端(运行glusterfs客户端)、NFS/Samba存储网关(为没有运行glusterfs客户端提供访问)。

二、环境
三个虚拟机
操作系统:最小化安装CentOS6.5

2、部署说明
存储节点:
IP 主机名 Brick
172.16.2.165 node1 /home/rfs
172.16.2.166 node2 /home/rfs

客户端:
172.16.2.167

三、部署

三台机器都要作
# vi /etc/selinux/config
SELINUX=disabled
# chkconfig iptables off
# chkconfig iptables off


1、存储端安装(所有安装包打包在glusterfs.tar.gz中):
# yum -y install device-mapper device-mapper-libs device-mapper-event device-mapper-event-libs libaio libgssglue libtirpc libudev lvm2-libs rpcbind (目前centos默认已经安装这些包)

#tar zxvf  glusterfs.tar.gz
#cd glusterfs
#yum -y install *.rpm
# chkconfig glusterd on
# service glusterd start 

2、服务端配置:
ssh密钥登录(172.16.2.166上操作)[//如果所有服务器的root密码一样,此步骤不需要]:
# ssh-keygen
#mv .ssh/id_rsa.pub .ssh/authorized_keys
#scp -r .ssh root@172.16.2.XX:~/
其他节点做相同操作,除自身ip

建立peer关系(172.16.2.166上操作):
将2个存储节点组成一集群,本文在第一个节点执行,只需要在任意节点执行就OK。
[root@rfs-161 ~]# gluster peer probe node2
Probe successful

如果node2在peer表中被识别为ip地址,可能后面集群过程中会出现通讯问题, 
我们可以使用ip来进行修复: 

查看集群的节点信息:
[root@rfs-161 ~]# gluster peer status
Number of Peers: 1

Hostname: node2
Uuid: 7301f9e5-ba9e-4095-a78c-4741f801a715
State: Peer in Cluster (Connected)

建立卷(172.16.2.165与172.16.2.166其中一台上操作):
以/data/gluster为共享目录,创建名为datavol的卷,副本数为2:
mkdir /home/rfs
[root@rfs-161 ~]#  gluster volume create datavol replica 2 node1:/home/rfs node2:/home/rfs
Creation of volume img has been successful. Please start the volume to access data. 
建立卷时有三种模式:Stripe(RAID0)、Replicate(RAID1)和DHT(分布式Hash),默认是DHT,后边跟的数字意思是几个为1组,此示例中为2个为一组建立replica卷,类似RAID1。
配置文件:/etc/glusterfs/glusterfsd.vol

启动卷:
[root@rfs-161 ~]# gluster volume start datavol
Starting volume datavol has been successful 
查看卷状态:
[root@rfs-161 ~]# gluster volume info
Volume Name: datavol
Type: Replicate
Volume ID: b7863e25-2f26-4af9-b2bc-908b594ae900
Status: Started
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: 172.16.2.165:/home/rfs
Brick2: 172.16.2.166:/home/rfs

此时,文件系统就准备就绪了,可以像挂载nfs分区一样挂载它了

3、客户端安装配置:
安装:
rpm -ivh glusterfs-3.5.0-2.el6.x86_64.rpm glusterfs-libs-3.5.0-2.el6.x86_64.rpm glusterfs-fuse-3.5.0-2.el6.x86_64.rpm

挂载:
mount -t glusterfs 172.16.2.165:/datavol /share/ (挂载任意一个节点即可)
mount -t nfs -o mountproto=tcp,vers=3 172.16.4.161:/datavol /share/ (使用NFS挂载,注意远端的rpcbind服务必须开启)
mount -t nfs -o rw,nfsvers=3,proto=tcp,port=38465,nolock,noacl,nocto,noatime,nodiratime,rsize=131072,wsize=524288,async,soft,bg,acregmin=3,acregmax=10,acdirmin=1,acdirmax=5 172.16.2.165:datavol /share
mount.nfs 172.16.2.165:/datavol /share/ -o nfsvers=3,proto=tcp 




相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
阿里云实时数仓实战 - 用户行为数仓搭建
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求:熟练掌握 SQL 语法熟悉 Linux 命令,对 Hadoop 大数据体系有一定的了解   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
目录
相关文章
|
3月前
|
人工智能 安全 调度
AI工程vs传统工程 —「道法术」中的变与不变
本文从“道、法、术”三个层面对比AI工程与传统软件工程的异同,指出AI工程并非推倒重来,而是在传统工程坚实基础上,为应对大模型带来的不确定性(如概率性输出、幻觉、高延迟等)所进行的架构升级:在“道”上,从追求绝对正确转向管理概率预期;在“法”上,延续分层解耦、高可用等原则,但建模重心转向上下文工程与不确定性边界控制;在“术”上,融合传统工程基本功与AI新工具(如Context Engineering、轨迹可视化、多维评估体系),最终以确定性架构驾驭不确定性智能,实现可靠价值交付。
611 41
AI工程vs传统工程 —「道法术」中的变与不变
|
2月前
|
机器学习/深度学习 数据采集 人工智能
给AI模型“加外挂”:LoRA技术详解,让小白也能定制自己的大模型
LoRA是一种高效轻量的大模型微调技术,如同为万能咖啡机加装“智能香料盒”——不改动原模型(冻结参数),仅训练少量低秩矩阵(参数量降千倍),显著降低成本、保留通用能力,并支持插件式灵活部署。现已成为AI定制化普惠落地的核心方案。(239字)
851 8
|
2月前
|
存储 人工智能 测试技术
基于 VectorDBBench 的性能评测与架构解析:Lindorm 向量引擎的优化实践
阿里云Lindorm向量检索服务重磅升级,依托CBO/RBO混合优化器与自适应混合索引,实测QPS达5.6万(百万级)、2.4万+(千万级),P99延迟低至2ms,融合检索性能行业领先,全面支撑AI时代高并发、低延迟、强一致的生产级向量应用。
383 4
|
Kubernetes 容器
kubeadm 部署的 k8s 增加 ip 并重新生成证书
kubeadm 部署的 k8s 增加 ip 并重新生成证书
1651 0
|
2月前
|
人工智能 数据可视化 物联网
[大模型实战 06] 我的模型我做主:在 Kaggle 上用 Unsloth 极速微调 Qwen3
本文介绍如何用Unsloth+QLoRA高效微调Qwen3-4B模型,仅需Kaggle免费T4显卡,速度提升2–5倍、显存节省60%;三步实现“灵魂认主”,让模型自认“AlgiebaLLM AI”,全程代码简洁,零基础可上手。
[大模型实战 06] 我的模型我做主:在 Kaggle 上用 Unsloth 极速微调 Qwen3
|
7月前
|
人工智能 自然语言处理 监控
构建可观测、可治理的企业智能体:平台核心能力解析
在人工智能快速发展的背景下,企业智能体已成为推动数字化转型的重要力量。然而,其复杂性和不可预测性也带来了可靠性、透明性和可控性等挑战。构建具备全景可观测性、多层治理框架、智能体协同与知识管理、人类监督机制的智能体体系,成为企业实现安全、合规、高效运营的关键。通过系统化实施路径,企业可全面提升智能体的透明度与治理能力,把握智能时代发展机遇。
|
存储 监控 数据安全/隐私保护
GlusterFS存储卷创建
GlusterFS存储卷创建
341 7
|
12月前
|
分布式计算 监控 安全
产品评测|从数据标准到实时监控,深度解析Dataphin如何以智能提效与安全合规驱动企业数据价值释放
Dataphin是阿里巴巴基于OneData方法论打造的一站式数据治理与建设平台,帮助企业实现数据全生命周期管理。本文详细记录了使用Dataphin搭建离线数仓的全流程,包括环境准备、数仓规划、数据引入、处理、周期任务补数据、数据验证与分析等环节。体验中发现其离线管道任务、周期调度、补数据功能便捷高效,但也存在系统稳定性不足、文档更新滞后等问题。建议增强对JSON文件支持、优化资源推荐机制并完善脱敏操作功能,进一步提升用户体验。
|
Arthas 监控 Java
监控线程池的内存使用情况以预防内存泄漏
监控线程池的内存使用情况以预防内存泄漏
|
监控 API 持续交付
深入理解微服务架构:优势与挑战
【10月更文挑战第6天】深入理解微服务架构:优势与挑战
670 0