怕麻烦
在执行了 ceph 扩容之前, 发现长时间内都具有下面的状态存在 参考下面信息 # ceph -s cluster dc4f91c1-8792-4948-b68f-2fcea75f53b9 health HEALTH_WARN 13 pgs backfill_toofull; 1 pgs degraded; 1 pgs stuck degraded
1. logstash 无法连接 kafka logstash 版本: logstash-1.5.4-1.noarch.rpm logstash.log 错误信息: {:timestamp=>"2015-11-16T18:41:00.365000+0800", :message=>"The error reported is: \n uninitialized
1 确认故障磁盘 dmesg [6061566.878131] sd 0:2:2:0: [sdc] [6061566.878141] sd 0:2:2:0: [sdc] [6061566.878147] sd 0:2:2:0: [sdc] [6061566.878152] sd 0:2:2:0: [sdc] CDB: [6061566.878162] end_request:
故障发生时间: 2015-11-05 20.30 故障解决时间: 2015-11-05 20:52:33 故障现象: 由于 hh-yun-ceph-cinder016-128056.vclound.com 硬盘故障, 导致 ceph 集群产生异常报警 故障处理: ceph 集群自动进行数据迁移, 没有产生数据丢失, 待 IDC 同
详细正则规则参考: 正则语法规则 例: 日志格式如下 [vclound][2015-11-03 03:35:50,283][INFO][/usr/lib/python2.6/site-packages/urllib3/connectionpool.py:203][_new_conn][-][140192616544000]=[Starting new HTTP connecti
场景 防止由于停电后大规模 HV 启动, 导致 OPENSTACK NEUTRON SERVER 服务由于 HV 并发注册量太大而拒绝服务 思路 1. 数据库中创建表, COUNT, 列 id int 表中定义并发量, (例如 30) 2. 当 HV 启动时候, 假如需要启动 NEUTRON 服务, 则先要向 COUNT 表中获得信息, 假如 cou
当前使用 vlan 网络架构 默认状态下创建 VM 利用 DHCP 进行 IP 地址分配 由于某些原因需要指定某些 VM 的 IP 地址, 那么可以参考下面方法执行操作 先获得 TENANT, NETWORK 信息, 然后创建对应的 PORT, PORT 可以指定使用某个 IP 地址, 之后在创建 VM 时候指定对应的 PORT就可以 获得 tenant id
1. 创建的 volumes 是否可以导出数据 查询当前池 [root@tt-ceph-048146 ~]# ceph osd lspools 0 rbd,1 volumes, 查询 volumes 池中的卷 [root@tt-ceph-048144 ceph]# rbd -p volumes ls volume-be34745e-165f-4fc6-86c4-6
参考当前表结构 mysql> desc vm_info; +------------+-------------+------+-----+---------+----------------+ | Field | Type | Null | Key | Default | Extra | +------------+----------
目标 管理 ceph 中的存储池, 保留 rbd 池, 创建 volumes 池, 删除其他存储池, 增加 pg_num 数量 查询当前池方法 [root@hh-yun-ceph-cinder015-128055 ~]# ceph osd lspools 0 data,1 metadata,2 rbd, 删除 data, metadata 池 [roo
当 monitor 运行后, 你需要添加 OSD, 你的集群只有在获得足够的 OSD 数量用于复制对象时候才可能获得 active + clean 状态 例如 osd pool size = 2, 那么至少需要 2 个 OSD, 在启动 MONITOR 后,你的集群具有默认的 CURSH MAP, 当前 CURSH MAP 并没有 CEPH OSD 进程映射到 CEPH
Monitor 节点初始化 执行下面步骤 操作系统初始化 当前环境中, ceph 存储集群统一部署 centos 7.1 操作系统, 并在 /etc/hosts 中登记集群中的服务器主机名, 并完成时间同步 主机名验证 [root@hh-yun-ceph-cinder015-128055 ~]# hostname hh-yun-ceph-cinde
参考架构 硬件配置 ceph 由 7 台 华为 RH2288A 组成, 硬件信息: 硬件 型号 数量 统计 cpu Intel(R) Xeon(R) CPU E5-2630 v2 @ 2.60GHz 2 24核 内存 16GB 4条 64GB 硬盘 4.0 TB 12 48TB 网卡 千
前提 本文用于针对云平台下的 VM 中的 vclound 用户利用 ssh 密钥登录进行的测试 测试目标 vclound 用户需要利用 ssh key 进行登录 ssh key 验证时需要输入 passphrase 进行校验 在脚本中需要对多台电脑进行 vclound 用户登录测试时候, 进行 key 校验过程中, 只需要输入一次 passphrase 即可
当前 DNS 服务器环境如上图描述 说明: pdns master 当前负责解析 vclound.com 域名, 并同步数据至 pdns slave 及 bind slave 中, 只对 vclound.com 域名进行解析, 其他域名解析转发至 10.199.129.21 pdns slave 主要为 vlcound.cm 作用备用从服务器, 其他域名解析转发
1. 云主机当前常规并发比较大, 约有 1900 个常规连接 [root@chao-data07 ~]# netstat -nt | grep EST | wc -l 1867 2. 当前出现 arp 表不正常现象 见到下面错误信息 Mar 24 14:06:31 chao-data07 dhclient[1112]: DHCPREQUEST on eth0 to 10.
因业务需要, 添加了新的磁盘, 因此需要把磁盘重新整合为 RAID10 参考当前磁盘 [root@hh-yun-compute-131104 ~]# megacli -PDList -aALL | grep 'Inquiry Data:' Inquiry Data: HITACHI HUC109060CSS600 A440KWKR7GHX Inquiry Data: HIT
环境, 多网卡, 多 bond 设备, 需要使用不同的工作方式, 如下: eth0 eth1 -> bond0 -> mode 0 ( active-backup ) eth2, eth3 -> bond1 -> mode 1 (balance-rr) 参考: [root@hh-yun-puppet-129021 kickstarts
一个不错的监控说明 附带一个 IO 说明
参考日志错误信息: [root@hh-yun-compute-130125 ~]# cat /var/log/messages | grep -i error Mar 1 04:58:05 hh-yun-compute-130125 kernel: sbridge: HANDLING MCE MEMORY ERROR Mar 1 04:58:06 hh-yun-compute-130
当前计划使用 intel x540-at2 (万兆网卡) 建立 bonding, 然后转换 (ovs) 桥接, 再为数据包进行 vlan tag 标记 故障现象: 完成配置后, 发现严重丢包 故障分析, 利用 intel x540-at2 纯建立 bonding 故障消失 利用 intel x540-at2 纯建立 bonding + bridge 故障消失 利
参见日志: pdns (master) server /var/log/messages 错误信息提示: Jan 30 10:08:08 kylezhuang-hh-qa-dns-crguy pdns[6363]: AXFR of domain '199.10.in-addr.arpa' initiated by 10.199.132.168 Jan 30 10:08:08 ky
当前环境 a.v.com 1.1.1.1 b.v.com 2.2.2.2 希望绑域名 y.v.com 能够嗟系 1.1.1.1 及 2.2.2.2 以实现 DNS 负载均衡 错误做法 mysql> insert into records (domain_id, name, type, content, ttl) values ( 1,'y.v.com',
1. 查询网络信息 [root@kf-test-pinyun-048228 ~(keystone_admin)]# neutron net-list | grep w2 | 01a7ab13-65a8-4300-a53b-d6a774414c2a | w2 | 67f3da0b-a513-4857-8ad7-2283494a3b
参考下面图例说明 |-- br-ex.11 em1, em2 --建立绑定-> bond0 --建立ovs桥接-> br-ex --建立 vlan 虚拟网卡->|
ext3 的不稳定一直比较头痛, 常见问题会在断电, 非正常条件下关机会造成 文件系统损坏, 修复文件系统也比较费时费力, 也不见得一定能够把数据找回 虽然 rhel5 已是一个很老版本, 但生产上还有不少 rhel5 系统任然使用. 备忘一下, 利用 KICKSTART 部署时候, 利用 ext4 作为默认的 / 分区方法, (注 rhel5 使用的 GRUB 无法
测试机器 10.199.128.69 dmdecode 常用命令 机器型号 [root@test_raid ~]# dmidecode | grep "Product" Product Name: PowerEdge R720xd Product Name: 068CDY 厂商 [root@test_raid ~]# dmidecode|
1. vcapple.com dev.vpapple.com qa.vpapple.com 10.199 反向解析 上述 DNS 数据修改时候, 只能够修改 master ( 10.199.132.152 ) 2. 当上述域名数据修改后, 数据会自动同步至 10.199.132.168 (slave) 与 10.199.129.21 (slave) 3. 10.199
需求: 对 mysql 输出进行 groug by 排序并执行 top 10 返回 前提: 当前需对 zabbix 执行自定义监控数据返回. 涉及到的表比较多, 下面作出简单的说明 hosts_groups 用于记录主机与组的 id 关系 mysql> desc hosts_groups; +-------------+-----------------
假如需要在 rpmbuild 生成软件包, 在安装时候忽略依赖关系 请在 spec 文件中添加下面参数 AutoReqProv: no
分析¶ 变量类型常见三种 1. 内建变量, 如 $title, $name 等, 针对类固定的格式而进行调用 2. 自定义变量, 如 myname = tttttt, 等, 但需要在每个类中进行独立定义, 不能够在类之间进行传递, 3. facter , 公共变量, 可以在每个类中共同使用, 当前打算使用 facter 作为变量的调用 测试1.¶ 修改
参考下面命令, 可以把市区重新设定为英文. alias cp='cp' echo 'ZONE="Asia/Shanghai"' > /etc/sysconfig/clock cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime ntpdate stdtime.gov.hk > /dev/null 参考修改后结果
puppet 变态语法自检测方法 <pre> git clone https://github.com/ricciocri/vimrc .vim cd .vim git pull && git submodule init && git submodule update && git submodule status
条件 文件内容如下 host1 h1v1 h1v2 h1v3 h1v4 h1v5 host2 h2v1 h2v2 h2v3 h2v4 h2v5 host3 h3v1 h3v2 h3v3 h3v4 h3v5 host4 h4v1 h4v2 h4v3 h4v4 h4v5 host5 h5
python 比较提倡使用空格而不使用制表符作为结构划分的方法 个人比较习惯使用制表符. 利用下面命令, 可以轻松吧制表符转换成为空格, MARK 一下. 方法1. 替换已经完成的 py 脚本 sed -i 's/\t/ /g' *.py 方法2. 为方便以后编写脚本 vim /etc/vimrc set ts=2 autocmd BufNewFile,Buf
python 具有 argarse 模块, 专门针对命令行下的参数传递 参见执行例子: [root@gd02-zabbix-db-research python_api]# ./app.py usage: ./app.py --help [root@gd02-zabbix-db-research python_api]# ./app.py --help usage: app.py [
zabbix 由于历史数据过大, 因此导致磁盘空间暴涨, 下面是结局方法步骤 1. 停止 ZABBIX SERER 操作 [root@gd02-qa-plxt2-nodomain-web-95 ~]# killall zabbix_server [root@gd02-qa-plxt2-nodomain-web-95 ~]# lsof -i:10051 2. 停止 mysql
参见下面 RPM 编译信息 warning: Installed (but unpackaged) file(s) found: /.channels/.alias/pear.txt /.channels/.alias/pecl.txt /.channels/.alias/phpdocs.txt /.channels/__uri.reg /.channels
查询实例访问方法[root@station140 nova(keystone_admin)]# nova get-vnc-console terry_instance1 novnc +-------+-------------------------------------------------------------------------------------+ | Type |
instance 终端以日志方式输出方法 [root@station140 ~(network_admin)]# nova console-log --length 80 terry_instance1 | tail Starting atd: [ OK ][ OK ] Starting yum-updatesd: [ OK ] Failed to retrieve ho
Openstak 中, 常用 nova 命令对实例进行管理 常见管理方法有, 创建, 删除, 更改(resize flavor, 冷/热迁移), 查询 等 列出当前 tenant 中的实例 首先需要载入 keystone 验证信息 [root@gz-controller-209131 ~(keystone_admin)]# cat keystonerc_admin
帮助信息 [root@station140 ~(keystone_admin)]# nova help | grep hyper hypervisor-list List hypervisors. hypervisor-servers List instances belonging to specific hypervisors. hypervisor
注: 192.168.48.142 为 floating ip ping 测试 [root@station140 ~(keystone_admin)]# ping 192.168.48.142 PING 192.168.48.142 (192.168.48.142) 56(84) bytes of data. 64 bytes from 192.168.48.142: icmp
帮助[root@station140 ~(keystone_admin)]# nova help | grep float add-floating-ip Add a floating IP address to a server. floating-ip-bulk-create Bulk create floatin
帮助 [root@station140 ~(network_admin)]# neutron help | grep route l3-agent-list-hosting-router List L3 agents hosting a router. l3-agent-router-add Add a router to a L3 agent.
创建公网 [root@station140 ~(network_admin)]# neutron net-create --router:external=true pub1 Created a new network: +---------------------------+--------------------------------------+ | Field
参考官方资料 You must modify the rules for the default security group because users cannot access instances that use the default group from any IP address outside the cloud. You can modify the rul
帮助 [root@station140 ~(keystone_admin)]# nova help | grep key flavor-key Set or unset extra_spec for a flavor. keypair-add Create a new key pair for use with instances.
帮助 [root@station140 tmp(keystone_admin)]# nova help | grep flavor flavor-access-add Add flavor access for the given tenant. flavor-access-list Print access information about the giv
帮助 [root@station140 tmp(keystone_admin)]# keystone help | grep service service-create Add service to Service Catalog. service-delete Delete service from Service Catalog.