介绍一些ceph中用到的命令及相关配置
写在前面
松鼠哥的ceph专业课程上线啦!
面向新手同学,从0实战,全面入门ceph安装部署与运维,有需要的同学赶紧扫码订购吧:
ceph集群运维的常用命令不多,针对具体场景使用不同命令
具体命令及说明
1 | ceph osd df - 可以查看每个osd的用量,每个osd的pg数,权重 |
内存剖析:
安装google-perftools
然后启动要监视的osd的剖析器:
1 | ceph osd tell 'osd.0' heap start_profiler |
然后查看该osd的内存情况:
1 | [xxx@ceph-c43 ~]$ sudo ceph tell 'osd.0' heap stats |
系统相关:
命令
1 | 查看ib卡属于那个numa node,使用命令: |
ntp
当集群有clock skew detected on mon.xxx的提示,是因为节点间时间差别太大,使用ntpd并降低同步间隔
1、修改ntpd的更新间隔:在/etc/ntp.conf中加入如下字段:server 172.25.52.51 minpoll 3 maxpoll 4 prefer iburst
这表示优先使用这个ntp server并且在最少2^3=8s,最大2^4=16s内进行同步,每次同步发送8个同步报文,间隔为1s
2、重启ntp服务systemctl restart ntpd.service
查看ntp服务是否正常工作:ntpq -pn
网卡
开启ib卡的connected模式:
1 | echo "connected" > /sys/class/net/ib0/mode |
使用下面的配置作为ib卡的ifcfg-ib配置文件
1 | DEVICE=ib0 |
这样配置的ib卡在启动后默认开启connected模式
使用下列步骤优化网卡中断:
1、关闭系统的自带中断平衡:
1 | systemctl stop irqbalance.service |
2、禁用掉内核自带的numa均衡器:sysctl.conf中设置kernel.numa_balancing=0
3、使用下列方式绑定指定的中断号到特定的cpu:
1 | for k in $( seq 0 255 ) |
查看本节点的osd绑定cpu的情况:
1 | for x in `sudo ls -l /var/lib/ceph/osd/|grep 'ceph-'|awk '{print $9}'|awk -F '-' '{print $2}'`;do sudo systemctl cat ceph-osd@$x.service |grep 'CPUAffinity';done |
磁盘多路径
解决multipath导致的多盘符重复问题,osd创建失败后,在/etc/lvm/lvm.conf中加入
1 | global_filter = [ "a|/dev/disk/by-id/.*|", "r|.*/|" ] |
让lvm只在by-id中的目录寻找即可,因为在此目录下的磁盘都是根据磁盘的wwn来进行识别的,没有多路径参与
- 本文作者: 奋斗的松鼠
- 本文链接: http://www.strugglesquirrel.com/2018/03/09/ceph运维常用命令/
- 版权声明: 本博客所有文章除特别声明外,创作版权均为作者个人所有,未经允许禁止转载!