Ceph学习笔记（二） -- 集群部署和相关命令

Ceph集群部署和相关命令。

Posted May 5, 2025 Updated Jun 3, 2025

By xiaodongQ

views 32 min read

1. 引言

上篇梳理了Ceph的基本架构和流程，本篇进行集群部署，并梳理学习Ceph相关的命令和状态、进行实践印证。

部分操作基于Quincy的文档。系统重装为了Rocky Linux release 9.5 (Blue Onyx)，后续使用Ceph v19.2.2新版本：Squid。
内核版本：5.14.0-503.14.1；容器：默认使用podman，yum install docker会安装一个能使用docker的适配脚本，实际还是调用到podman。

说明：本博客作为个人学习实践笔记，可供参考但非系统教程，可能存在错误或遗漏，欢迎指正。若需系统学习，建议参考原链接。

2. 安装和部署

见：Installing Ceph。

有多种方式可以安装Ceph，官方推荐的方式：

1、cephadm。

cephadm可以安装和管理Ceph集群。
需要容器支持：Podman或者Docker，以及Python3。

2、Rook

Rook用于Kubernetes环境下部署、管理Ceph

此处选择cephadm。先安装cephadm：

2.1. 安装cephadm

  
# 看下面网站中17.2.8 el8下没有包，暂时下载17.2.7
[CentOS-root@xdlinux ➜ ~ ]$ curl --silent --remote-name --location https://download.ceph.com/rpm-17.2.7/el8/noarch/cephadm
# 下载下来是个python脚本
[CentOS-root@xdlinux ➜ ~ ]$ chmod +x cephadm

# 支持的选项
[CentOS-root@xdlinux ➜ ~ ]$ ./cephadm --help
usage: cephadm [-h] [--image IMAGE] [--docker] [--data-dir DATA_DIR]
               [--log-dir LOG_DIR] [--logrotate-dir LOGROTATE_DIR]
               [--sysctl-dir SYSCTL_DIR] [--unit-dir UNIT_DIR] [--verbose]
               [--timeout TIMEOUT] [--retry RETRY] [--env ENV]
               [--no-container-init] [--no-cgroups-split]
               {version,pull,inspect-image,ls,list-networks,adopt,rm-daemon,rm-cluster,run,shell,enter,ceph-volume,zap-osds,unit,logs,bootstrap,deploy,check-host,prepare-host,add-repo,rm-repo,install,registry-login,gather-facts,host-maintenance,agent,disk-rescan}
               ...

cephadm中集成了编排接口（orchestration interface）来管理Ceph集群。

具体Python脚本内容可见：cephadm。

更新Rocky Linux系统后，获取一些资源就比较丝滑了，直接安装cephadm对应的包即可。

  
[root@xdlinux ➜ workspace ]$ dnf search release-ceph
Last metadata expiration check: 0:58:54 ago on Thu 08 May 2025 08:12:24 PM CST.
================================= Name Matched: release-ceph ==================================
centos-release-ceph-pacific.noarch : Ceph Pacific packages from the CentOS Storage SIG
                                   : repository
centos-release-ceph-quincy.noarch : Ceph Quincy packages from the CentOS Storage SIG repository
centos-release-ceph-reef.noarch : Ceph Reef packages from the CentOS Storage SIG repository
centos-release-ceph-squid.noarch : Ceph Squid packages from the CentOS Storage SIG repository


[root@xdlinux ➜ workspace ]$ dnf install centos-release-ceph-squid.noarch
Last metadata expiration check: 2:44:54 ago on Thu 08 May 2025 08:12:24 PM CST.
Dependencies resolved.
===============================================================================================
 Package                               Architecture   Version             Repository      Size
===============================================================================================
Installing:
 centos-release-ceph-squid             noarch         1.0-1.el9           extras         7.3 k
Installing dependencies:
 centos-release-storage-common         noarch         2-5.el9             extras         8.4 k
...

[root@xdlinux ➜ workspace ]$ dnf install --assumeyes cephadm
CentOS-9-stream - Ceph Squid                                   138 kB/s |  95 kB     00:00    
Dependencies resolved.
===============================================================================================
 Package          Architecture    Version                     Repository                  Size
===============================================================================================
Installing:
 cephadm          noarch          2:19.2.2-1.el9s             centos-ceph-squid          346 k

Transaction Summary
===============================================================================================
Install  1 Package
...
Installed:
  cephadm-2:19.2.2-1.el9s.noarch                                                               

Complete!

cephadm -h执行报错ModuleNotFoundError: No module named 'jinja2'，另外需要再安装下yum install python-jinja2。

而后可以用了：

  
[root@xdlinux ➜ ~ ]$ cephadm -h
usage: cephadm [-h] [--image IMAGE] [--docker] [--data-dir DATA_DIR] [--log-dir LOG_DIR]
               [--logrotate-dir LOGROTATE_DIR] [--sysctl-dir SYSCTL_DIR]
               [--unit-dir UNIT_DIR] [--verbose] [--log-dest {file,syslog}]
               [--timeout TIMEOUT] [--retry RETRY] [--env ENV] [--no-container-init]
               [--no-cgroups-split]
...

2.2. 部署Ceph集群

使用cephadm部署集群，命令：cephadm bootstrap --mon-ip *<mon-ip>*。

需要依赖时间同步：chrony或者传统的ntpd，CentOS8默认使用chrony
命令会在本地主机创建一个monitor和manager、生成一个ssh key、创建一个配置文件/etc/ceph/ceph.conf、创建/etc/ceph/ceph.client.admin.keyring
具体操作内容和进一步的选项功能，可见：running-the-bootstrap-command

  
[CentOS-root@xdlinux ➜ ~ ]$ ./cephadm --verbose bootstrap --mon-ip 192.168.1.150 
--------------------------------------------------------------------------------
cephadm ['--verbose', 'bootstrap', '--mon-ip', '192.168.1.150']
Verifying podman|docker is present...
Verifying lvm2 is present...
Verifying time synchronization is in place...
...
/usr/bin/docker: stdout Status: Downloaded newer image for quay.io/ceph/ceph:v17
/usr/bin/docker: stdout quay.io/ceph/ceph:v17
# 下载的是17.2.8的镜像
ceph: stdout ceph version 17.2.8 (f817ceb7f187defb1d021d6328fa833eb8e943b3) quincy (stable)
...
Generating a dashboard self-signed certificate...
/usr/bin/ceph: stdout Self-signed certificate created
Creating initial admin user...
/usr/bin/ceph: stdout {"username": "admin", "password": "$2b$12$T/9S/pFZWpiAhd1DneOI4O1eA.qN8Lqs6cLpaT5bHeRE0PTX8FoUS", "roles": ["administrator"], "name": null, "email": null, "lastUpdate": 1746487677, "enabled": true, "pwdExpirationDate": null, "pwdUpdateRequired": true}
...
# dashboard面板页面，由于是在自己另一台Linux PC安装的，替换成 https://192.168.1.150:8443/
Ceph Dashboard is now available at:
   
         URL: https://xdlinux:8443/
        User: admin
    Password: c7y70jlyad
...
You can access the Ceph CLI as following in case of multi-cluster or non-default config:       
    sudo ./cephadm shell --fsid 616bc616-2a08-11f0-86a6-1c697af53932 -c /etc/ceph/ceph.conf -k /etc/ceph/ceph.client.admin.keyring
Or, if you are only running a single cluster on this host:
    sudo ./cephadm shell 
Please consider enabling telemetry to help improve Ceph:
    ceph telemetry on

上面部署过程的完整输出，可见：cephadm_bootstrap.log。

docker ps可看到部署的集群中：

包含一个monitor和一个manager，
同时还部署了node_exporter、prometheus和grafana进行状态收集展示。
还可以选择开启telemetry分布式链路跟踪。

  
[CentOS-root@xdlinux ➜ ~ ]$ docker ps
CONTAINER ID   IMAGE                                     COMMAND                  CREATED          STATUS          PORTS     NAMES
e0c15d412d77   quay.io/ceph/ceph-grafana:9.4.7           "/bin/sh -c 'grafana…"   18 minutes ago   Up 18 minutes             ceph-616bc616-2a08-11f0-86a6-1c697af53932-grafana-xdlinux
b3399062f6fb   quay.io/prometheus/alertmanager:v0.25.0   "/bin/alertmanager -…"   19 minutes ago   Up 19 minutes             ceph-616bc616-2a08-11f0-86a6-1c697af53932-alertmanager-xdlinux
23cb28d71524   quay.io/prometheus/prometheus:v2.43.0     "/bin/prometheus --c…"   19 minutes ago   Up 19 minutes             ceph-616bc616-2a08-11f0-86a6-1c697af53932-prometheus-xdlinux
cbbdea5e241b   quay.io/prometheus/node-exporter:v1.5.0   "/bin/node_exporter …"   20 minutes ago   Up 20 minutes             ceph-616bc616-2a08-11f0-86a6-1c697af53932-node-exporter-xdlinux
8776543913da   quay.io/ceph/ceph                         "/usr/bin/ceph-crash…"   20 minutes ago   Up 20 minutes             ceph-616bc616-2a08-11f0-86a6-1c697af53932-crash-xdlinux
ec87bf5e542b   quay.io/ceph/ceph:v17                     "/usr/bin/ceph-mgr -…"   21 minutes ago   Up 21 minutes             ceph-616bc616-2a08-11f0-86a6-1c697af53932-mgr-xdlinux-wfcgil
955ad744813e   quay.io/ceph/ceph:v17                     "/usr/bin/ceph-mon -…"   21 minutes ago   Up 21 minutes             ceph-616bc616-2a08-11f0-86a6-1c697af53932-mon-xdlinux

2.3. Dashboard 和 Grafana

上面部署完成后，可登录对应的Dashboard，账号信息打印在上面的部署过程当中。

另外还部署了Grafana，包含了默认的一些面板：

主机详情面板：

2.4. Ceph Cli 命令操作

开启 ceph 客户端命令操作，有几种方法。

方式1、使用 cephadm shell 命令进入容器，而后执行客户端命令
- 也可以直接：cephadm shell -- ceph -s，但是每次会很慢
方式2、安装ceph-common
- 添加源cephadm add-repo --release quincy，而后cephadm install ceph-common

一些命令：

确认ceph命令已安装：ceph -v
确认ceph命令连接到了集群并查看状态：ceph status
Adding Hosts：ceph orch host label add *<host>* _admin
Adding additional MONs：ceph orch daemon add mon *<host1:ip-or-network1>
- 具体见Deploying additional monitors
Adding Storage：ceph orch apply osd --all-available-devices

2.4.1. cephadm shell方式

  
# 执行cephadm shell，此处加--verbose显示详情
[CentOS-root@xdlinux ➜ ~ ]$ ./cephadm --verbose shell
--------------------------------------------------------------------------------
cephadm ['--verbose', 'shell']
Using default config /etc/ceph/ceph.conf
...
Using container info for daemon 'mon'
Using ceph image with id '259b35566514' and tag 'v17' created on 2024-11-26 08:45:38 +0800 CST
quay.io/ceph/ceph@sha256:a0f373aaaf5a5ca5c4379c09da24c771b8266a09dc9e2181f90eacf423d7326f
...
# 最后会创建并进入一个容器
[ceph: root@xdlinux /]#

# 在容器里可以使用ceph客户端命令
[ceph: root@xdlinux /]# ceph -v
ceph version 17.2.8 (f817ceb7f187defb1d021d6328fa833eb8e943b3) quincy (stable)
[ceph: root@xdlinux /]# ceph -s
  cluster:
    id:     616bc616-2a08-11f0-86a6-1c697af53932
    health: HEALTH_WARN
            OSD count 0 < osd_pool_default_size 3
 
  services:
    mon: 1 daemons, quorum xdlinux (age 13h)
    mgr: xdlinux.wfcgil(active, since 13h)
    osd: 0 osds: 0 up, 0 in
 
  data:
    pools:   0 pools, 0 pgs
    objects: 0 objects, 0 B
    usage:   0 B used, 0 B / 0 B avail
    pgs:
# -h 可看到支持很多命令
[ceph: root@xdlinux /]# ceph -h
...

2.4.2. 安装ceph-common

cephadm shell每次进入容器再使用ceph客户端相关命令，比较麻烦，且宿主机目录和容器中存在隔离，还是在宿主机安装一下ceph-common。

CentOS已经不再维护了，之前也已经更改为了阿里云的yum源，但是cephadm add-repo --release quincy还是报错了。后面还是得把系统重装一下，换成其他系统。

  
[CentOS-root@xdlinux ➜ ~ ]$ ./cephadm add-repo --release quincy
unable to fetch repo metadata: <HTTPError 404: 'Not Found'>
ERROR: failed to fetch repository metadata. please check the provided parameters are correct and try again

简单调研了下，初步选择是：Rocky Linux或Ubuntu LTS，包先都下载了，先试试Rocky Linux。

更新Rocky Linux系统后，安装ceph-common。参考 enable-ceph-cli。

  
[root@xdlinux ➜ prog-playground git:(main) ]$ cephadm add-repo --release squid
Writing repo to /etc/yum.repos.d/ceph.repo...
Enabling EPEL...
Completed adding repo.

[root@xdlinux ➜ prog-playground git:(main) ]$ cephadm install ceph-common
Installing packages ['ceph-common']...

宿主机可以直接执行ceph客户端命令了：

  
[root@xdlinux ➜ prog-playground git:(main) ]$ ceph -s  
  cluster:
    id:     75ab91f2-2c23-11f0-8e6f-1c697af53932
    health: HEALTH_WARN
            OSD count 0 < osd_pool_default_size 3
 
  services:
    mon: 1 daemons, quorum xdlinux (age 16m)
    mgr: xdlinux.qnvoyl(active, since 14m)
    osd: 0 osds: 0 up, 0 in
 
  data:
    pools:   0 pools, 0 pgs
    objects: 0 objects, 0 B
    usage:   0 B used, 0 B / 0 B avail
    pgs: 

3. 使用Ceph

见：using-ceph

3.1. 创建OSD（单机实验失败）

由于自己的PC环境是在一块SSD上装了双系统，暂时无法使用单独的硬盘或分区来创建OSD，此处使用目录作为OSD（无需分区），参考LLM给的思路：

创建专用目录
- mkdir /var/lib/ceph/osd/ceph-0
挂载目录（可选）
- mount –bind /path/to/storage /var/lib/ceph/osd/ceph-0
部署OSD
- ceph-volume lvm prepare –data /var/lib/ceph/osd/ceph-0
- ceph-volume lvm activate 0 # 根据生成的OSD ID调整

~~TODO：等换了系统再来。~~

更新Rocky Linux系统后操作，安装一下ceph-volume。

  
[root@xdlinux ➜ ~ ]$ dnf install ceph-volume
Last metadata expiration check: 0:14:15 ago on Fri 09 May 2025 12:02:03 AM CST.
Dependencies resolved.
========================================================================================================
 Package                         Architecture      Version             Repository                  Size
========================================================================================================
Installing:
 ceph-volume                     noarch            2:19.2.2-1.el9s     centos-ceph-squid          292 k
Installing dependencies:
 ceph-base                       x86_64            2:19.2.2-1.el9s     centos-ceph-squid          5.2 M
 ceph-osd                        x86_64            2:19.2.2-1.el9s     centos-ceph-squid           16 M
 ceph-selinux                    x86_64            2:19.2.2-1.el9s     centos-ceph-squid           26 k
 python3-packaging               noarch            20.9-5.el9          appstream                   69 k
 python3-pyparsing               noarch            2.4.7-9.el9         baseos                     150 k
 qatlib                          x86_64            24.02.0-1.el9_4     appstream                  220 k
 qatzip-libs                     x86_64            1.2.0-1.el9_4       appstream                   46 k
Installing weak dependencies:
 qatlib-service                  x86_64            24.02.0-1.el9_4     appstream                   35 k

Transaction Summary
========================================================================================================
Install  9 Packages

Total download size: 22 M
Installed size: 81 M
Is this ok [y/N]:

创建目录而后用ceph-volume部署OSD，还是报错了：

  
[root@xdlinux ➜ ~ ]$ ceph-volume lvm prepare --data /var/lib/ceph/osd/ceph-0
 stderr: blkid: error: /var/lib/ceph/osd/ceph-0: Invalid argument
 stderr: Unknown device "/var/lib/ceph/osd/ceph-0": No such device
Running command: /usr/bin/ceph-authtool --gen-print-key
Running command: /usr/bin/ceph-authtool --gen-print-key
Running command: /usr/bin/ceph --cluster ceph --name client.bootstrap-osd --keyring /var/lib/ceph/bootstrap-osd/ceph.keyring -i - osd new 4b37544e-c2f2-432f-9d87-a4a843bf28d0
...

调整方式：通过文件虚拟块设备

创建虚拟磁盘文件，truncate -s 200M /ceph-osd.img # 大小根据需求调整
挂载为 Loop 设备，losetup /dev/loop0 /ceph-osd.img
使用 LVM 模式部署
- ceph-volume lvm prepare –data /dev/loop0
- ceph-volume lvm activate 0

第3步报错：

  
[root@xdlinux ➜ ~ ]$ ceph-volume lvm prepare --data /dev/loop0
Running command: /usr/bin/ceph-authtool --gen-print-key
Running command: /usr/bin/ceph-authtool --gen-print-key
Running command: /usr/bin/ceph --cluster ceph --name client.bootstrap-osd --keyring /var/lib/ceph/bootstrap-osd/ceph.keyring -i - osd new a1fce513-b3c9-4d76-9555-68c4d3cec23b
 stderr: 2025-05-09T00:26:50.493+0800 7f4d6b23d640 -1 auth: unable to find a keyring on /var/lib/ceph/bootstrap-osd/ceph.keyring: (2) No such file or directory
 ...
 stderr: 2025-05-09T00:26:50.495+0800 7f4d68fb2640 -1 monclient(hunting): handle_auth_bad_method server allowed_methods [2] but i only support [1]
 stderr: 2025-05-09T00:26:50.495+0800 7f4d6b23d640 -1 monclient: authenticate NOTE: no keyring found; disabled cephx authentication
 stderr: [errno 13] RADOS permission denied (error connecting to the cluster)
-->  RuntimeError: Unable to create a new OSD id

  
[root@xdlinux ➜ ~ ]$ ceph auth get-or-create client.bootstrap-osd mon 'allow profile bootstrap-osd' \
  -o /var/lib/ceph/bootstrap-osd/ceph.keyring
[root@xdlinux ➜ ~ ]$ chown ceph:ceph /var/lib/ceph/bootstrap-osd/ceph.keyring
[root@xdlinux ➜ ~ ]$ chmod 0600 /var/lib/ceph/bootstrap-osd/ceph.keyring
[root@xdlinux ➜ ~ ]$ 
[root@xdlinux ➜ ~ ]$ ceph-volume lvm prepare --data /dev/loop0 --cluster ceph
Running command: /usr/bin/ceph-authtool --gen-print-key
Running command: /usr/bin/ceph-authtool --gen-print-key
Running command: /usr/bin/ceph --cluster ceph --name client.bootstrap-osd --keyring /var/lib/ceph/bootstrap-osd/ceph.keyring -i - osd new 2f3d84e3-4559-4f8a-916c-7323c96ab908
--> Was unable to complete a new OSD, will rollback changes
Running command: /usr/bin/ceph --cluster ceph --name client.bootstrap-osd --keyring /var/lib/ceph/bootstrap-osd/ceph.keyring osd purge-new osd.0 --yes-i-really-mean-it
 stderr: purged osd.0
-->  RuntimeError: Unable to find any LV for zapping OSD: 0

好吧，折腾几次都不行，单台PC机器不带盘想骚操作部署OSD有点费劲。~~暂时不折腾了（TODO）~~ 下面小节在ECS里申请网盘进行实验，另外一个思路是插U盘/移动硬盘是否能在本地做为块设备部署OSD。

20250603更新：尝试插U盘起OSD，可以拉起来，不过还是会reject。下面做下记录。

  
# 查看设备提示拒绝，下面进行清理
# 3个原因：已经包含BlueStore设备标签、已有文件系统、设备总线类型不符合要求，比如是USB设备
[root@xdlinux ➜ ceph ]$ ceph orch device ls
HOST     PATH      TYPE  DEVICE ID                             SIZE  AVAILABLE  REFRESHED  REJECT REASONS
xdlinux  /dev/sda  hdd   SanDisk_3.2Gen1_01018cxxx1074aac1ca1  57.3G  No         12m ago   Has BlueStore device label, Has a FileSystem, id_bus

# 清理遗留数据
# 擦除 BlueStore 标签和分区
ceph-volume lvm zap /dev/sda --destroy
# 确保所有残留被清除
wipefs -a /dev/sda
# 清除文件系统签名
dd if=/dev/zero of=/dev/sda bs=1M count=100
# 强制重新扫描设备。刷新设备状态
ceph orch device zap xdlinux /dev/sda --force
# 自动检测还是会拦截总线类型。貌似ceph里没有设置支持usb的选项，后面手动添加。
[root@xdlinux ➜ ~ ]$ ceph orch device ls
HOST     PATH      TYPE  DEVICE ID                            SIZE  AVAILABLE  REFRESHED  REJECT REASONS  
xdlinux  /dev/sda  hdd   SanDisk_3.2Gen1_010185581074aac1ca1  57.3G  No         3m ago     id_bus

# 手动添加osd。
    # 如果提示bootstrap-osd密钥环认证失败，则创建keyring并设置权限后再执行手动添加
    # ceph auth get-or-create client.bootstrap-osd mon 'allow profile bootstrap-osd' -o /var/lib/ceph/bootstrap-osd/ceph.keyring
ceph-volume raw prepare --bluestore --data /dev/sda
# ceph orch daemon add osd xdlinux:/dev/sda

# 创建成功，查看：
[root@xdlinux ➜ ceph ]$ ceph osd tree
ID  CLASS  WEIGHT  TYPE NAME     STATUS  REWEIGHT  PRI-AFF
-1              0  root default                           
 0              0  osd.0           down   1.00000  1.00000
# ceph osd rm osd.0 可删除osd

  
# 调整池副本数
ceph osd pool ls detail
ceph osd pool set $pool size 1
ceph osd pool set $pool min_size 1
# 确保 osd.0 正常运行
systemctl restart ceph-osd@0
# 验证 OSD 状态
ceph osd tree

[root@xdlinux ➜ ceph ]$ ceph -s
  cluster:
    id:     75ab91f2-2c23-11f0-8e6f-1c697af53932
    health: HEALTH_WARN
            cephadm background work is paused
            1 stray daemon(s) not managed by cephadm
            Reduced data availability: 33 pgs inactive
            1 pool(s) have no replicas configured
 
  services:
    mon: 1 daemons, quorum xdlinux (age 26m)
    mgr: xdlinux.qnvoyl(active, since 26m)
    osd: 1 osds: 1 up (since 60m), 1 in (since 32m)
 
  data:
    pools:   2 pools, 33 pgs
    objects: 0 objects, 0 B
    usage:   0 B used, 0 B / 0 B avail
    pgs:     100.000% pgs unknown
             33 unknown

3.2. 对象存储

具体见：cephadm-deploy-rgw

继续在上述cephadm shell进入的客户端容器里，使用ceph客户端命令进行集群操作。

简单创建名为foo的rgw对象网关（默认会创建2个daemon守护进程）：ceph orch apply rgw foo

# ceph客户端对应的容器中
[ceph: root@xdlinux /]# ceph orch apply rgw foo
Scheduled rgw.foo update...

可看到宿主机上创建的2个radosgw容器：

  
# 宿主机上
[CentOS-root@xdlinux ➜ ceph git:(main) ]$ docker ps
CONTAINER ID   IMAGE                                     COMMAND                  CREATED          STATUS          PORTS     NAMES
18a1c01bf48d   quay.io/ceph/ceph                         "/usr/bin/radosgw -n…"   4 minutes ago    Up 4 minutes              ceph-616bc616-2a08-11f0-86a6-1c697af53932-rgw-foo-xdlinux-yeqiep
c124e7c56c48   quay.io/ceph/ceph                         "/usr/bin/radosgw -n…"   4 minutes ago    Up 4 minutes              ceph-616bc616-2a08-11f0-86a6-1c697af53932-rgw-foo-xdlinux-bsojzq
...

3.3. 一些管理命令

具体见：cephadm/host-management、cephadm/services，此处仅试用下少数命令。

1、主机管理：

ceph orch host ls 查看主机信息

  
[ceph: root@xdlinux /]# ceph orch host ls --detail
HOST     ADDR           LABELS  STATUS  VENDOR/MODEL                            CPU      RAM     HDD  SSD        NIC  
xdlinux  192.168.1.150  _admin          LENOVO TianYi510Pro-14ACN (90RX0051CD)  8C/128T  31 GiB  -    1/512.1GB  2    
1 hosts in cluster

2、服务管理：

ceph orch ls 查看编排器（orchestrator）已知的服务列表
- ceph orch ls --export 导出yaml格式，可以用于ceph orch apply -i
查看daemons状态：ceph orch ps

  
[ceph: root@xdlinux /]# ceph orch ls
NAME                       PORTS        RUNNING  REFRESHED  AGE  PLACEMENT  
alertmanager               ?:9093,9094      1/1  17s ago    23h  count:1    
crash                                       1/1  17s ago    23h  *          
grafana                    ?:3000           1/1  17s ago    23h  count:1    
mgr                                         1/2  17s ago    23h  count:2    
mon                                         1/5  17s ago    23h  count:5    
node-exporter              ?:9100           1/1  17s ago    23h  *          
osd.all-available-devices                     0  -          9h   *          
prometheus                 ?:9095           1/1  17s ago    23h  count:1    
rgw.foo                    ?:80             0/2  17s ago    9h   count:2

部署daemon：ceph orch apply <service-name> 或 ceph orch apply -i file.yaml
- 部署服务是，需要知道到哪些主机部署daemons，以及部署几个。比如：
  - ceph orch apply mon "host1,host2,host3"
  - ceph orch apply prometheus --placement="host1 host2 host3" 显式指定
- 为了避免混淆，建议使用yaml指定放置规则（placement specification）

file.yaml 示例：

  
service_type: mon
placement:
  hosts:
   - host1
   - host2
   - host3

不同服务命令示例
- monitor：ceph orch daemon add mon newhost1:10.1.2.123
- osd：ceph orch device ls
- rgw：ceph orch apply rgw foo
- cephfs：ceph fs status
  - ceph fs volume create xdfs 创建文件系统
- nfs：ceph nfs cluster ls
- …

  
# `ceph fs volume create xdfs` 创建文件系统后，编排器会自动创建MDS
[CentOS-root@xdlinux ➜ ~ ]$ docker ps
CONTAINER ID   IMAGE                                     COMMAND                  CREATED          STATUS          PORTS     NAMES
8af21cee0bc4   quay.io/ceph/ceph                         "/usr/bin/ceph-mds -…"   2 minutes ago    Up 2 minutes              ceph-616bc616-2a08-11f0-86a6-1c697af53932-mds-xdfs-xdlinux-enyulk
7d02ba5f4146   quay.io/ceph/ceph                         "/usr/bin/ceph-mds -…"   2 minutes ago    Up 2 minutes              ceph-616bc616-2a08-11f0-86a6-1c697af53932-mds-xdfs-xdlinux-rrgraq

3、跟踪cephadm日志打印

  
# 设置日志等级，默认是info
[ceph: root@xdlinux /]# ceph config set mgr mgr/cephadm/log_to_cluster_level debugug
[ceph: root@xdlinux /]# ceph -W cephadm --watch-debug
cluster:
    id:     616bc616-2a08-11f0-86a6-1c697af53932
    health: HEALTH_WARN
            2 failed cephadm daemon(s)
            Reduced data availability: 1 pg inactive
            OSD count 0 < osd_pool_default_size 3
...
2025-05-06T23:34:28.445677+0000 mgr.xdlinux.wfcgil [DBG]  mgr option ssh_config_file = None
2025-05-06T23:34:28.446521+0000 mgr.xdlinux.wfcgil [DBG]  mgr option device_cache_timeout = 1800
...

4、cephadm命令

  
# 查看服务
[CentOS-root@xdlinux ➜ ~ ]$ ./cephadm ls
[
    {
        "style": "cephadm:v1",
        "name": "mon.xdlinux",
        "fsid": "616bc616-2a08-11f0-86a6-1c697af53932",
        "systemd_unit": "ceph-616bc616-2a08-11f0-86a6-1c697af53932@mon.xdlinux",
        "enabled": true,
        "state": "running",
        "service_name": "mon",
        "memory_request": null,
        "memory_limit": null,
        "ports": [],
        "container_id": "955ad744813e3f6fa4ceebb98b4ff7b12e7c7eff0aa15f33aae47c175ab96895",
        "container_image_name": "quay.io/ceph/ceph:v17",
        "container_image_id": "259b3556651452e4de35111bd226d7a17fe902360c7e9e49a4e5da686ffb71c1",
        "container_image_digests": [
            "quay.io/ceph/ceph@sha256:a0f373aaaf5a5ca5c4379c09da24c771b8266a09dc9e2181f90eacf423d7326f"
        ],
        "memory_usage": 380423372,
        "cpu_percentage": "0.32%",
        "version": "17.2.8",
        "started": "2025-05-05T23:27:25.733655Z",
        "created": "2025-05-05T23:27:23.127578Z",
        "deployed": "2025-05-05T23:27:22.769568Z",
        "configured": "2025-05-05T23:29:29.845014Z"
    },
    {
        "style": "cephadm:v1",
        "name": "mgr.xdlinux.wfcgil",
        ...
    },
    ...
]

# 查看具体服务日志
[CentOS-root@xdlinux ➜ ~ ]$ ./cephadm logs --name mon.xdlinux
Inferring fsid 616bc616-2a08-11f0-86a6-1c697af53932
-- Logs begin at Sat 2025-04-19 08:02:16 CST, end at Wed 2025-05-07 07:41:36 CST. --
May 06 07:27:23 xdlinux systemd[1]: Started Ceph mon.xdlinux for 616bc616-2a08-11f0-86a6-1c697>
May 06 07:27:23 xdlinux bash[105457]: debug 2025-05-05T23:27:23.287+0000 7f1dace9c8c0  0 set u>
May 06 07:27:23 xdlinux bash[105457]: debug 2025-05-05T23:27:23.287+0000 7f1dace9c8c0  0 ceph >
...

4. cephadm集群环境信息

cephadm bootstrap部署集群时：

若不指定--data-dir，则数据目录默认在/var/lib/ceph
若不指定--log-dir，则日志目录在/var/log/ceph
若不指定--unit-dir，则systemd的unit文件在/etc/systemd/system
也可以通过添加--docker选项（不加则默认false），表示用docker替换podman
（可man cephadm查看）

基于上述部署好的集群（没包含OSD），来看下一些环境细节信息。

4.1. 配置文件

上面cephadm部署时提到过，默认会创建/etc/ceph/ceph.conf配置文件，当前集群中的内容如下：

  
[root@xdlinux ➜ ceph ]$ cat /etc/ceph/ceph.conf 
# minimal ceph.conf for 75ab91f2-2c23-11f0-8e6f-1c697af53932
[global]
	fsid = 75ab91f2-2c23-11f0-8e6f-1c697af53932
	mon_host = [v2:192.168.1.150:3300/0,v1:192.168.1.150:6789/0]

fsid（File System Identifier）是ceph集群的全局唯一标识符（UUID）。每个集群有唯一的fdid，用于区分同一网络中的不同集群，所有集群组件（monitor、）都通过fsid确认集群归属。

ceph -s也可看到该fsid：

  
[root@xdlinux ➜ ceph ]$ ceph -s
  cluster:
    id:     75ab91f2-2c23-11f0-8e6f-1c697af53932
    health: HEALTH_WARN
            cephadm background work is paused
            OSD count 0 < osd_pool_default_size 3
  ...

cephadm部署一个daemon（守护/后台进程）时，会按下述优先级顺序匹配配置文件，使用第一个匹配到的文件：

-c显式指定
如果用--name指定了具体的daemon服务名称，则会找/var/lib/ceph/<fsid>/<daemon-name>/config文件
- 比如： /var/lib/ceph/75ab91f2-2c23-11f0-8e6f-1c697af53932/mon.xdlinux/config，内容见下面的cat。

  
# man cephadm
    When starting the shell, cephadm looks for configuration in the following order.  Only the first values found are used:

An explicit, user provided path to a config file (-c/--config option)

Config file for daemon specified with --name parameter (/var/lib/ceph/<fsid>/<daemon-name>/config)

/var/lib/ceph/<fsid>/config/ceph.conf if it exists

The config file for a mon daemon (/var/lib/ceph/<fsid>/mon.<mon-id>/config) if it exists

Finally: fallback to the default file /etc/ceph/ceph.conf

  
[root@xdlinux ➜ ceph ]$ cat /var/lib/ceph/75ab91f2-2c23-11f0-8e6f-1c697af53932/mon.xdlinux/config
# minimal ceph.conf for 75ab91f2-2c23-11f0-8e6f-1c697af53932
[global]
	fsid = 75ab91f2-2c23-11f0-8e6f-1c697af53932
	mon_host = [v2:192.168.1.150:3300/0,v1:192.168.1.150:6789/0]
[mon.xdlinux]
public network = 192.168.1.0/24

4.2. 数据目录

查看数据目录：

  
[root@xdlinux ➜ ceph ]$ ll /var/lib/ceph
total 4.0K
drwx------. 14  472 root 4.0K May  8 23:58 75ab91f2-2c23-11f0-8e6f-1c697af53932
drwxr-x---.  2 ceph ceph    6 Apr 11 23:46 bootstrap-mds
drwxr-x---.  2 ceph ceph    6 Apr 11 23:46 bootstrap-mgr
drwxr-x---.  2 ceph ceph   26 May  9 00:30 bootstrap-osd
drwxr-x---.  2 ceph ceph    6 Apr 11 23:46 bootstrap-rbd
drwxr-x---.  2 ceph ceph    6 Apr 11 23:46 bootstrap-rbd-mirror
drwxr-x---.  2 ceph ceph    6 Apr 11 23:46 bootstrap-rgw
drwxr-x---.  3 ceph ceph   20 May  9 00:18 crash
drwxr-x---.  3 ceph ceph   20 Apr 11 23:46 osd
drwxr-x---.  2 ceph ceph    6 Apr 11 23:46 tmp

4.3. 代码container目录

Ceph代码中，container目录用于构建容器，可看到当前版本默认使用podman来构建容器。

  
# ceph-v19.2.2/container/build.sh
...
podman build --pull=newer --squash -f $CFILE -t build.sh.output \
    --build-arg FROM_IMAGE=${FROM_IMAGE:-quay.io/centos/centos:stream9} \
    --build-arg CEPH_SHA1=${CEPH_SHA1} \
    --build-arg CEPH_GIT_REPO=${CEPH_GIT_REPO} \
    --build-arg CEPH_REF=${BRANCH:-main} \
    --build-arg OSD_FLAVOR=${FLAVOR:-default} \
    --build-arg CI_CONTAINER=${CI_CONTAINER:-default} \
    --secret=id=prerelease_creds,src=./prerelease.secret.txt \
    2>&1 
image_id=$(podman image ls localhost/build.sh.output --format '')
vars="$(podman inspect -f '' ${image_id})
...

默认容器镜像则基于centos:stream9。

  
# ceph-v19.2.2/container/Containerfile
ARG FROM_IMAGE="quay.io/centos/centos:stream9"
FROM $FROM_IMAGE
...
dnf install -y --setopt=install_weak_deps=False --setopt=skip_missing_names_on_install=False --enablerepo=crb $(cat packages.txt)
...

5. 删除集群（危险操作）

注意：仅限测试环境。

  
# 暂停 cephadm 以避免部署新的守护进程
ceph orch pause
# 获取集群 FSID
ceph fsid
# 到每个主机上，清除集群中所有主机的 ceph 守护进程
# --zap-osds 擦除所有 OSD 设备上的数据
cephadm rm-cluster --force --zap-osds --fsid <fsid>

# 验证
# 尝试运行 ceph 命令（应该失败）
ceph -s
# 检查 Ceph 进程
ps aux | grep ceph

# 部分残留，自行选择是否清理
ll /var/log/ceph/*
# 容器镜像，或者podman images
docker images

# 清理 Systemd 服务
systemctl disable ceph.target
# 禁用并删除 Ceph 服务
# sudo systemctl disable ceph.target
# 删除fsid相关的unit
# sudo rm -f /etc/systemd/system/ceph-xxx.target.wants/*
# sudo rm -f /etc/systemd/system/ceph-xxx.service
# 注意不要删除 /usr/lib/systemd/system/下的 ceph 相关unit，会影响osd、volumn等后续创建使用。
# 重新加载 systemd
sudo systemctl daemon-reload
sudo systemctl reset-failed

6. ECS部署Ceph OSD

上面在自己的PC单机上简单部署Ceph环境，但是没有硬盘，没法起OSD，此处用阿里云ECS搭建下环境。

6.1. ECS Ceph源配置

ECS中默认的Ceph yum源无法访问，切换源到阿里镜像站的Ceph源：Ceph镜像。注意：需要将公网地址转换为ECS VPC网络访问地址

将Ceph 官方安装教程里面的https://download.ceph.com替换为http://mirrors.cloud.aliyuncs.com（ECS内部网络访问，如果是公网则是https的mirrors.aliyun.com/ceph）。替换且设置相应版本后配置如下，后续ECS可复用。

  
# ceph.repo
[ceph]
name=Ceph packages for x86_64
baseurl=http://mirrors.cloud.aliyuncs.com/ceph/rpm-19.2.2/el9/x86_64
enabled=1
priority=2
gpgcheck=1
gpgkey=http://mirrors.cloud.aliyuncs.com/ceph/keys/release.asc

[ceph-noarch]
name=Ceph noarch packages
baseurl=http://mirrors.cloud.aliyuncs.com/ceph/rpm-19.2.2/el9/noarch
enabled=1
priority=2
gpgcheck=1
gpgkey=http://mirrors.cloud.aliyuncs.com/ceph/keys/release.asc

[ceph-source]
name=Ceph source packages
baseurl=http://mirrors.cloud.aliyuncs.com/ceph/rpm-19.2.2/el9/SRPMS
enabled=0
priority=2
gpgcheck=1
gpgkey=http://mirrors.cloud.aliyuncs.com/ceph/keys/release.asc

而后：

  
# 不使用下述方式，其安装的Ceph源无法在ECS里访问
# dnf search release-ceph
# dnf install centos-release-ceph-squid.noarch

# 而是使用上述阿里Ceph源
dnf makecache
# 而后就可以安装cephadm
dnf install cephadm

6.2. ECS部署Ceph及OSD

上面安装了cephadm，而后跟本地机器步骤一样进行部署。

碰到问题：容器镜像仓库无法访问。给ECS分配一个公网地址。

  
# 部署集群
cephadm bootstrap --verbose --mon-ip 172.16.58.146

# 安装ceph-common
[root@iZbp1220m9p46a8lph9nzqZ ~]# cephadm add-repo --release squid
Writing repo to /etc/yum.repos.d/ceph.repo...
Enabling EPEL...
Completed adding repo.
[root@iZbp1220m9p46a8lph9nzqZ ~]# cephadm install ceph-common
Installing packages ['ceph-common']...

使用ceph shell，查看集群信息：

  
[ceph: root@iZbp1220m9p46a8lph9nzqZ /]# ceph -s
  cluster:
    id:     7250d0b6-3584-11f0-b128-00163e1bd532
    health: HEALTH_WARN
            OSD count 0 < osd_pool_default_size 3
 
  services:
    mon: 1 daemons, quorum iZbp1220m9p46a8lph9nzqZ (age 68s)
    mgr: iZbp1220m9p46a8lph9nzqZ.pjmagh(active, since 44s)
    osd: 0 osds: 0 up, 0 in
 
  data:
    pools:   0 pools, 0 pgs
    objects: 0 objects, 0 B
    usage:   0 B used, 0 B / 0 B avail
    pgs:

对可用的设备自动创建OSD：

  
# 
[ceph: root@iZbp1220m9p46a8lph9nzqZ /]# ceph orch apply osd --all-available-devices
Scheduled osd.all-available-devices update...

# 可看到OSD已经起来了
[ceph: root@iZbp1220m9p46a8lph9nzqZ /]# ceph orch ls
NAME                       PORTS        RUNNING  REFRESHED  AGE  PLACEMENT  
alertmanager               ?:9093,9094      1/1  19s ago    23m  count:1    
ceph-exporter                               1/1  19s ago    23m  *          
crash                                       1/1  19s ago    23m  *          
grafana                    ?:3000           1/1  19s ago    23m  count:1    
mgr                                         1/2  19s ago    23m  count:2    
mon                                         1/5  19s ago    23m  count:5    
node-exporter              ?:9100           1/1  19s ago    23m  *          
osd.all-available-devices                     1  19s ago    41s  *          
prometheus                 ?:9095           1/1  19s ago    23m  count:1

# 查看设备，只是提示容量不够（配了20GB网盘）
[ceph: root@iZbp1220m9p46a8lph9nzqZ /]# ceph orch device ls
HOST                     PATH      TYPE  DEVICE ID              SIZE  AVAILABLE  REFRESHED  REJECT REASONS                                                           
iZbp1220m9p46a8lph9nzqZ  /dev/vdb  hdd   bp1dtgg3k4srphwzy12x  20.0G  No         3m ago     Has a FileSystem, Insufficient space (<10 extents) on vgs, LVM detected 

提示容量不够，扩容到40G，可看到OSD已经自动对其成功创建了lvm：

[root@iZbp1220m9p46a8lph9nzqZ ~]# lsblk
NAME          MAJ:MIN RM  SIZE RO TYPE MOUNTPOINTS
vda           253:0    0   20G  0 disk 
├─vda1        253:1    0    1M  0 part 
├─vda2        253:2    0  100M  0 part /boot/efi
└─vda3        253:3    0 19.9G  0 part /var/lib/containers/storage/overlay
                                       /
vdb           253:16   0   40G  0 disk 
└─ceph--4247718d--2e18--48cf--ae0e--28eefcfeea83-osd--block--a21b0a4e--bb1c--4a47--ac65--91cc8f99624d
              252:0    0   20G  0 lvm 

7. 小结

基于cephadm安装部署ceph集群。使用CentOS 8.5有些资源无法获取了，所以自己PC的Linux切换为了Rocky Linux 9.5，效率提升不少。

8. 参考

存储和数据库, Ceph

存储 Ceph

This post is licensed under CC BY 4.0 by the author.