Skip to main content

进程管理

基础概念

  • 在Linux中,每个执行的程序(代码)都称为一个进程。每个进程都有一个唯一的进程标识符(PID),并且它们之间可以相互通信。
  • 每一个进程,都会对应一个父进程,而这个父进程可以复制多个子进程。例如www服务器。
  • 每个进程都可能以两种方式存在。前台和后台。
    • 前台进程:用户目前的屏幕上可以进行操作的。
    • 后台进程:实际在操作,但由于屏幕上无法看到的进程,通常使用后台方式执行。
  • 一般系统的服务都是以后台进程的方式存在,而且都会常驻在系统中,直到关机才结束。

进程的状态

Linux 进程具有不同的状态,主要有:

  • 运行(Running): 进程正在运行或者准备运行。
  • 等待(Waiting): 进程正在等待某个条件的发生,例如等待 I/O 完成。
  • 停止(Stopped): 进程被暂停,一般由用户发送 SIGSTOP 信号。
  • 僵尸(Zombie): 进程已经终止,但其父进程还没有收到退出状态码。
  • 睡眠(Sleeping): 进程正在休眠,等待某个事件的发生。

进程查看和管理

服务(Service)

服务(Service)本质就是进程,但是是运行在后台的,通常都会监听某个端口,等待其它程序的请求,比如(mysql,sshd 防火墙等),因此我们又称为守护进程。

在 Systemd 管理的现代 Linux 发行版中,服务是由 Systemd 进程来管理的。Systemd 使用配置文件(例如 .service 文件)来定义服务的行为和属性。通过 systemctl 命令,你可以启动、停止、重启、查看状态等。

在centos6及旧版本系统中,Linux 的启动一直采用init进程。

init启动方法有两个缺点:

  • 启动时间长。init进程是串行启动,只有前一个进程启动完,才会启动下一个进程。
  • 启动脚本复杂。init进程只是执行启动脚本,不管其他事情。脚本需要自己处理各种情况,这往往使得脚本变得很长。

Systemd解决了上面的问题,Systemd 取代了 initd,成为系统的第一个进程(PID 等于 1),其他进程都是它的子进程。Systemd启动服务的方式是并行启动。

守护进程

  • 后台运行: 守护进程是在后台运行的进程,通常不与终端交互。这使得它们适用于执行长期运行的任务,而不受用户登录和注销的影响。
  • 无用户界面: 守护进程通常没有用户界面,因为它们不与终端直接交互。它们在后台默默执行任务。
  • 长期运行: 守护进程是设计为在系统启动时启动,并一直运行,等待事件的发生或执行特定的周期性任务。它们通常是系统服务的一部分。
  • 独立于用户会话: 守护进程独立于任何特定用户会话。它们通常不依赖于任何用户登录,而是在系统级别运行。

启动和终止守护进程

启动守护进程

  • 守护进程的启动通常涉及调用 fork 系统调用,创建子进程并使其成为独立的守护进程。它可能还涉及将标准输入、标准输出、标准错误重定向到特定的文件或设备,并在后台运行。

终止守护进程

  • 守护进程的终止通常由系统信号或特定的命令触发。守护进程可以通过捕获和处理信号(例如 SIGTERM)来进行优雅的关闭,释放资源,关闭文件描述符等。

守护进程通常能够捕获和处理信号。常见的信号包括 SIGHUP 用于重新加载配置,SIGTERM 用于优雅地终止进程,SIGKILL 用于强制终止进程等。

常见用途和实例

  • 定期任务:
    • 许多守护进程负责执行定期的任务,例如系统日志守护进程 (syslogd) 将系统日志写入文件,或者定期备份守护进程。
  • 网络服务:
    • 守护进程通常用于提供网络服务,如 Web 服务器(httpd)、数据库服务(mysqldpostgresql)等。这些守护进程监听网络端口,接受客户端连接并提供相应的服务。
  • 硬件和设备管理:
    • 一些守护进程可能负责监控和管理硬件设备,例如打印守护进程(cupsd)管理打印作业。

相关命令

Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面。常用命令如下:

systemctl - 管理系统服务,是 Systemd 的主命令,用于管理系统。

  • systemctl 是一个用于管理 systemd 系统和服务的工具,用于替代传统的 init 系统的一部分。
  • systemctl 允许你查看和控制系统服务,包括启动、停止、重启服务等。开机时,Systemd只执行 /etc/systemd/system目录里面的配置文件。
  • 旧的 service 命令仍然可以使用,但实际上它通常是一个指向 systemctl 的符号链接
systemctl [OPTIONS] COMMAND [UNIT...]
  • OPTIONS: 可选参数,用于调整 systemctl 的行为。
  • COMMAND: 指定要执行的命令,如 startstoprestartstatus 等。
  • UNIT: 指定一个或多个服务单元(Unit),表示要对哪个服务进行操作。服务单元的命名格式通常是 unit_name.service
systemctl reboot	# 重启系统
systemctl poweroff # 关闭系统,切断电源
systemctl halt # CPU停止工作
systemctl suspend # 暂停系统
systemctl hibernate # 让系统进入冬眠状态
systemctl hybrid-sleep # 让系统进入交互式休眠状态
systemctl rescue # 启动进入救援状态(单用户状态)

systemd-analyze - 查看启动耗时

systemd-analyze    				# 查看启动耗时                       
systemd-analyze blame # 查看每个服务的启动耗时
systemd-analyze critical-chain # 显示瀑布状的启动过程流
systemd-analyze critical-chain atd.service # 显示指定服务的启动流

hostnamectl - 查看当前主机的信息

hostnamectl			# 显示当前主机的信息
hostnamectl set-hostname rhel7 # 设置主机名。

localectl - 查看本地化设置

localectl				# 查看本地化设置
localectl set-locale LANG=en_GB.utf8 # 设置本地化参数。
localectl set-keymap en_GB

timedatectl - 查看当前时区设置

timedatect			# 查看当前时区设置
timedatectl list-timezones # 显示所有可用的时区

timedatectl set-timezone America/New_York # 设置当前时区
timedatectl set-time YYYY-MM-DD
timedatectl set-time HH:MM:SS

loginctl - 查看当前登录的用户

loginctl list-sessions		# 列出当前session
loginctl list-users # 列出当前登录用户
loginctl show-user ruanyf # 列出显示指定用户的信息

Systemd Unit

Unit简介

Systemd 可以管理所有系统资源。不同的资源统称为 Unit(单位)。

Unit 一共分成12种。

  • Service unit:系统服务
  • Target unit:多个 Unit 构成的一个组
  • Device Unit:硬件设备
  • Mount Unit:文件系统的挂载点
  • Automount Unit:自动挂载点
  • Path Unit:文件或路径
  • Scope Unit:不是由 Systemd 启动的外部进程
  • Slice Unit:进程组
  • Snapshot Unit:Systemd 快照,可以切回某个快照
  • Socket Unit:进程间通信的 socket
  • Swap Unit:swap 文件
  • Timer Unit:定时器

相关命令

systemctl list-units - 查看当前系统的所有 Unit 信息

systemctl list-units					#列出当前系统中所有的Unit(包括服务、套接字、挂载点等)以及它们的状态。
systemctl list-units --all #列出所有Unit,包括没有找到配置文件的或者启动失败的
systemctl list-units --type=service --state=running #列出所有正在运行的unit
systemctl list-units --type=service #显示所有已启用的服务,类型为 service 的 Unit
systemctl list-units --failed #列出所有加载失败的Unit

systemctl status - 查看系统状态和单个 Unit 的状态

systemctl status					# 显示系统状态
sysystemctl status bluetooth.service # 显示单个 Unit 的状态
systemctl -H [email protected] status atd.service# 显示远程主机的某个 Unit 的状态
systemctl status httpd

httpd.service - The Apache HTTP Server
Loaded: loaded (/usr/lib/systemd/system/httpd.service; enabled)
Active: active (running) since 金 2014-12-05 12:18:22 JST; 7min ago
Main PID: 4349 (httpd)
Status: "Total requests: 1; Current requests/sec: 0; Current traffic: 0 B/sec"
CGroup: /system.slice/httpd.service
├─4349 /usr/sbin/httpd -DFOREGROUND
├─4350 /usr/sbin/httpd -DFOREGROUND
├─4351 /usr/sbin/httpd -DFOREGROUND
├─4352 /usr/sbin/httpd -DFOREGROUND
├─4353 /usr/sbin/httpd -DFOREGROUND
└─4354 /usr/sbin/httpd -DFOREGROUND

12月 05 12:18:22 localhost.localdomain systemd[1]: Starting The Apache HTTP Server...
12月 05 12:18:22 localhost.localdomain systemd[1]: Started The Apache HTTP Server.
12月 05 12:22:40 localhost.localdomain systemd[1]: Started The Apache HTTP Server.
  • Loaded行:配置文件的位置,是否设为开机启动
  • Active行:表示正在运行
  • Main PID行:主进程ID
  • Status行:由应用本身(这里是 httpd )提供的软件当前状态
  • CGroup块:应用的所有子进程
  • 日志块:应用的日志

除了 status命令,systemctl还提供了三个查询状态的简单方法,主要供脚本内部的判断语句使用。

systemctl is-active application.service		# 显示某个 Unit 是否正在运行
systemctl is-failed application.service # 显示某个 Unit 是否处于启动失败状态
systemctl is-enabled application.service # 显示某个 Unit 服务是否建立了启动链接

启动和停止 Unit(主要是 service)

#服务启动和关闭,自启
systemctl start service_name #启动指定的服务
systemctl stop service_name #停止指定的服务
systemctl restart service_name #重启指定的服务
systemctl enable service_name #设置服务开机自启
systemctl disable service_name #禁用服务开机启动

systemctl show service_name #显示有关特定服务的详细信息,包括其状态、启动条件等。
systemctl kill apache.service # 杀死一个服务的所有子进程
systemctl reload apache.service # 重新加载一个服务的配置文件
systemctl daemon-reload # 重载所有修改过的配置文件
systemctl show httpd.service # 显示某个 Unit 的所有底层参数
systemctl show -p CPUShares httpd.service # 显示某个 Unit 的指定属性的值
systemctl set-property httpd.service CPUShares=500 # 设置某个 Unit 的指定属性

systemctl list-dependencies - 查看和设置系统服务的依赖关系

Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启动 B。

systemctl list-dependencies			#显示当前系统中所有服务之间的依赖关系
systemctl list-dependencies --all #展开 Target, 显示当前系统中所有服务之间的依赖关系
systemctl list-dependencies --all service_name #显示特定服务及其依赖关系

Unit 的配置文件

每一个 Unit 都有一个配置文件,告诉 Systemd 怎么启动这个 Unit 。

Systemd 默认从目录 /etc/systemd/system/读取配置文件。但是,里面存放的大部分文件都是符号链接,指向目录 /usr/lib/systemd/system/,真正的配置文件存放在那个目录。

systemctl enable命令用于在上面两个目录之间,建立符号链接关系,设置Unit开机启动。

systemctl disable是删除符号链接关系,禁用Unit开机启动。

systemctl enable [email protected]
# 等同于
ln -s '/usr/lib/systemd/system/[email protected]' '/etc/systemd/system/multi-user.target.wants/[email protected]'

配置文件的后缀名,就是该 Unit 的种类,比如 sshd.socket。如果省略,Systemd 默认后缀名为 .service,所以 sshd会被理解成 sshd.service

相关命令

systemctl list-dependencies-files - 列出所有配置文件

systemctl list-unit-files			# 列出所有配置文件
systemctl list-unit-files --type=service # 列出指定类型的配置文件

示例:

systemctl list-unit-files --type=service
UNIT FILE STATE PRESET
arp-ethers.service disabled disabled
atd.service enabled enabled
auditd.service enabled enabled
[email protected] alias -

STATE:显示每个配置文件的状态,一共有四种

  • enabled:已建立启动链接
  • disabled:没建立启动链接
  • static:该配置文件没有 [Install]部分(无法执行),只能作为其他配置文件的依赖
  • masked:该配置文件被禁止建立启动链接

配置文件的格式

systemctl cat - 查看配置文件的内容

配置文件主要放在 /usr/lib/systemd/system目录,也可能在 /etc/systemd/system目录。也可以在找到配置文件以后,使用文本编辑器打开。

sshd.service文件为例

systemctl cat sshd.service

[Unit]
Description=OpenSSH server daemon
Documentation=man:sshd(8) man:sshd_config(5)
After=network.target sshd-keygen.service
Wants=sshd-keygen.service

[Service]
EnvironmentFile=/etc/sysconfig/sshd
ExecStart=/usr/sbin/sshd -D $OPTIONS
ExecReload=/bin/kill -HUP $MAINPID
Type=simple
KillMode=process
Restart=on-failure
RestartSec=42s

[Install]
WantedBy=multi-user.target
  • 配置文件分成几个区块。每个区块的第一行,是用方括号表示的区别名,比如 [Unit]
  • 配置文件的区块名和字段名,都是大小写敏感的。
  • 每个区块内部是一些等号连接的键值对,键值对的等号两侧不能有空格。

[Unit]区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他 Unit 的关系。它的主要字段如下。

  • Description:简短描述

  • Documentation:文档地址

  • Requires:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败

    • 表示"强依赖"关系,即如果该服务启动失败或异常退出,那么 sshd.service也必须退出。
    • 注意,Wants字段与 Requires字段只涉及依赖关系,与启动顺序无关,默认情况下是同时启动的。
  • Wants:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败

    • 表示 sshd.servicesshd-keygen.service之间存在"弱依赖"关系,即如果"sshd-keygen.service"启动失败或停止运行,不影响 sshd.service继续执行。
  • BindsTo:与 Requires类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行

  • Before:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动

  • After:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动

    • 例如:如果 network.targetsshd-keygen.service需要启动,那么 sshd.service应该在它们之后启动。
  • Conflicts:这里指定的 Unit 不能与当前 Unit 同时运行

  • Condition...:当前 Unit 运行必须满足的条件,否则不会运行

  • Assert...:当前 Unit 运行必须满足的条件,否则会报启动失败

[Install]通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动。它的主要字段如下。

  • WantedBy:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入 /etc/systemd/system目录下面以 Target 名 + .wants后缀构成的子目录中
  • RequiredBy:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入 /etc/systemd/system目录下面以 Target 名 + .required后缀构成的子目录中
  • Alias:当前 Unit 可用于启动的别名
  • Also:当前 Unit 激活(enable)时,会被同时激活的其他 Unit

[Service]区块用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的主要字段如下。

  • Type:定义启动时的进程行为。它有以下几种值。
  • Type=simple:默认值,执行 ExecStart指定的命令,启动主进程
  • Type=forking:以 fork 方式从父进程创建子进程,创建后父进程会立即退出
  • Type=oneshot:一次性进程,Systemd 会等当前服务退出,再继续往下执行
  • Type=dbus:当前服务通过D-Bus启动
  • Type=notify:当前服务启动完毕,会通知 Systemd,再继续往下执行
  • Type=idle:若有其他任务执行完毕,当前服务才会运行
  • ExecStart:启动当前服务的命令
  • ExecStartPre:启动当前服务之前执行的命令
  • ExecStartPost:启动当前服务之后执行的命令
  • ExecReload:重启当前服务时执行的命令
  • ExecStop:停止当前服务时执行的命令
  • ExecStopPost:停止当其服务之后执行的命令
  • RestartSec:自动重启当前服务间隔的秒数
  • Restart:定义何种情况 Systemd 会自动重启当前服务,可能的值包括 always(总是重启)、on-successon-failureon-abnormalon-aborton-watchdog
    • no(默认值):退出后不会重启
    • on-success:只有正常退出时(退出状态码为0),才会重启
    • on-failure:非正常退出时(退出状态码非0),包括被信号终止和超时,才会重启
    • on-abnormal:只有被信号终止和超时,才会重启
    • on-abort:只有在收到没有捕捉到的信号终止时,才会重启
    • on-watchdog:超时退出,才会重启
    • always:不管是什么退出原因,总是重启
    • 对于守护进程,推荐设为 on-failure。对于那些允许发生错误退出的服务,可以设为 on-abnormal
  • TimeoutSec:定义 Systemd 停止当前服务之前等待的秒数
  • Environment:指定环境变量。指定当前服务的环境参数文件。该文件内部的 key=value键值对,可以用 $key的形式,在当前配置文件中获取。
    • 例如:启动 sshd,执行的命令是 /usr/sbin/sshd -D $OPTIONS,其中的变量 $OPTIONS就来自 EnvironmentFile字段指定的环境参数文件。
  • KillMode:定义 Systemd 如何停止服务。例如:将 KillMode设为 process,表示只停止主进程,不停止任何sshd 子进程,即子进程打开的 SSH session 仍然保持连接。这个设置不太常见,但对 sshd 很重要,否则你停止服务的时候,会连自己打开的 SSH session 一起杀掉。
    • control-group(默认值):当前控制组里面的所有子进程,都会被杀掉
    • process:只杀主进程
    • mixed:主进程将收到 SIGTERM 信号,子进程收到 SIGKILL 信号
    • none:没有进程会被杀掉,只是执行服务的 stop 命令。

示例:

[Service]
ExecStart=/bin/echo execstart1
ExecStart=
ExecStart=/bin/echo execstart2
ExecStartPost=/bin/echo post1
ExecStartPost=/bin/echo post2

#输出:上面这个配置文件,第二行ExecStart设为空值,等于取消了第一行的设置,运行结果如下。
execstart2
post1
post2

所有的启动设置之前,都可以加上一个连词号(-),表示"抑制错误",即发生错误的时候,不影响其他命令的执行。比如,EnvironmentFile=-/etc/sysconfig/sshd(注意等号后面的那个连词号),就表示即使 /etc/sysconfig/sshd文件不存在,也不会抛出错误。

Target

启动计算机的时候,需要启动大量的 Unit。如果每一次启动,都要一一写明本次启动需要哪些 Unit,显然非常不方便。Systemd 的解决方案就是 Target。

Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候,Systemd 就会启动里面所有的 Unit。从这个意义上说,Target 这个概念类似于"状态点",启动某个 Target 就好比启动到某种状态。

传统的 init启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似。不同的是,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动。

Target 也有自己的配置文件, Target 配置文件里面没有启动命令。

systemctl cat multi-user.target

[Unit]
Description=Multi-User System
Documentation=man:systemd.special(7)
Requires=basic.target
Conflicts=rescue.service rescue.target
After=basic.target rescue.service rescue.target
AllowIsolate=yes
  • Requires字段:要求 basic.target一起运行。
  • Conflicts字段:冲突字段。如果 rescue.servicerescue.target正在运行,multi-user.target就不能运行,反之亦然。
  • After:表示 multi-user.targetbasic.targetrescue.servicerescue.target之后启动,如果它们有启动的话。
  • AllowIsolate:允许使用 systemctl isolate命令切换到 multi-user.target

常用命令

systemctl list-unit-files --type=target		# 查看当前系统的所有 Target
systemctl list-dependencies multi-user.target # 查看一个 Target 包含的所有 Unit
systemctl get-default # 查看启动时的默认 Target
systemctl set-default multi-user.target # 设置启动时的默认 Target

# 切换 Target 时,默认不关闭前一个 Target 启动的进程,
# systemctl isolate 命令改变这种行为,
# 关闭前一个 Target 里面所有不属于后一个 Target 的进程
systemctl isolate multi-user.target

Target 与 传统 RunLevel 的对应关系如下:

Traditional runlevel      New target name     Symbolically linked to...

Runlevel 0 | runlevel0.target -> poweroff.target
Runlevel 1 | runlevel1.target -> rescue.target
Runlevel 2 | runlevel2.target -> multi-user.target
Runlevel 3 | runlevel3.target -> multi-user.target
Runlevel 4 | runlevel4.target -> multi-user.target
Runlevel 5 | runlevel5.target -> graphical.target
Runlevel 6 | runlevel6.target -> reboot.target

它与 init进程的主要差别如下。

  • 默认的 RunLevel (在 /etc/inittab文件设置)现在被默认的 Target 取代,位置是 /etc/systemd/system/default.target,通常符号链接到 graphical.target(图形界面)或者 multi-user.target(多用户命令行)。
  • 启动脚本的位置 ,以前是 /etc/init.d目录,符号链接到不同的 RunLevel 目录 (比如 /etc/rc3.d/etc/rc5.d等),现在则存放在 /lib/systemd/system/etc/systemd/system目录。
  • 配置文件的位置 ,以前 init进程的配置文件是 /etc/inittab,各种服务的配置文件存放在 /etc/sysconfig目录。现在的配置文件主要存放在 /lib/systemd目录,在 /etc/systemd目录里面的修改可以覆盖原始设置。

journalctl - 查看所有日志(内核日志和应用日志)

Systemd 统一管理所有 Unit 的启动日志,日志的配置文件是 /etc/systemd/journald.conf

查看服务的日志

journalctl -u service_name	#显示指定服务的日志,journalctl 命令提供了更灵活的日志查看和过滤功能。


journalctl # 查看所有日志(默认情况下 ,只保存本次启动的日志)
journalctl -k # 查看内核日志(不显示应用日志)


journalctl -b # 查看系统本次启动的日志
journalctl -b -0
journalctl -b -1 # 查看上一次启动的日志(需更改设置)

# 查看指定时间的日志
journalctl --since="2012-10-30 18:17:16"
journalctl --since "20 min ago"
journalctl --since yesterday
journalctl --since "2015-01-10" --until "2015-01-11 03:00"
journalctl --since 09:00 --until "1 hour ago"


journalctl -n # 显示尾部的最新10行日志
journalctl -n 20 # 显示尾部指定行数的日志
journalctl -f # 实时滚动显示最新日志


journalctl /usr/lib/systemd/systemd # 查看指定服务的日志
journalctl _PID=1 # 查看指定进程的日志
journalctl /usr/bin/bash # 查看某个路径的脚本的日志
journalctl _UID=33 --since today # 查看指定用户的日志
journalctl -u nginx.service # 查看某个 Unit 的日志
journalctl -u nginx.service --since today
journalctl -u nginx.service -f # 实时滚动显示某个 Unit 的最新日志
journalctl -u nginx.service -u php-fpm.service --since today # 合并显示多个 Unit 的日志

# 查看指定优先级(及其以上级别)的日志,共有8级
# 0: emerg
# 1: alert
# 2: crit
# 3: err
# 4: warning
# 5: notice
# 6: info
# 7: debug
journalctl -p err -b


journalctl --no-pager # 日志默认分页输出,--no-pager 改为正常的标准输出
journalctl -b -u nginx.service -o json # 以 JSON 格式(单行)输出
journalctl -b -u nginx.serviceqq -o json-pretty # 以 JSON 格式(多行)输出,可读性更好


journalctl --disk-usage # 显示日志占据的硬盘空间
journalctl --vacuum-size=1G # 指定日志文件占据的最大空间
journalctl --vacuum-time=1years # 指定日志文件保存多久

Reference Links

#systemd入门和实战

Systemd 入门教程:命令篇 - 阮一峰的网络日志 (ruanyifeng.com)

Systemd 入门教程:实战篇 - 阮一峰的网络日志 (ruanyifeng.com)

System and Service Manager (systemd.io)