8 个用于有效进程管理的 Linux 命令

使用这些关键命令管理您的应用程序的整个生命周期。
263 位读者喜欢这篇文章。
Command line prompt

Opensource.com

通常,应用程序进程的生命周期有三个主要状态:启动、运行和停止。如果我们想成为合格的管理员,每个状态都可以并且应该被仔细管理。 这八个命令可用于管理进程的整个生命周期。

启动进程

启动进程最简单的方法是在命令行中键入其名称,然后按 Enter 键。 如果您想启动 Nginx Web 服务器,请键入 nginx。 也许您只是想检查版本。

alan@workstation:~$ nginx

alan@workstation:~$ nginx -v
nginx version: nginx/1.14.0

查看您的可执行路径

上面演示的启动进程假定可执行文件位于您的可执行路径中。 理解此路径是可靠地启动和管理进程的关键。 管理员经常为他们期望的目的自定义此路径。 您可以使用 echo $PATH 查看您的可执行路径。

alan@workstation:~$ echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin

WHICH

使用 which 命令查看可执行文件的完整路径。

alan@workstation:~$ which nginx                                                    
/opt/nginx/bin/nginx

我将使用流行的 Web 服务器软件 Nginx 作为我的示例。 让我们假设已安装 Nginx。 如果命令 which nginx 没有返回任何内容,则表示未找到 Nginx,因为 which 仅搜索您定义的可执行路径。 有三种方法可以解决无法仅通过名称启动进程的情况。 第一种是键入完整路径。 虽然,我宁愿不必键入所有这些,你呢?

alan@workstation:~$ /home/alan/web/prod/nginx/sbin/nginx -v
nginx version: nginx/1.14.0

第二种解决方案是将应用程序安装到您可执行路径中的目录中。 但是,这可能不可行,特别是如果您没有 root 权限。

第三种解决方案是更新您的可执行路径环境变量,以包含您要使用的特定应用程序的安装目录。 此解决方案依赖于 shell。 例如,Bash 用户需要编辑其 .bashrc 文件中的 PATH= 行。

PATH="$HOME/web/prod/nginx/sbin:$PATH"

现在,重复您的 echo 和 which 命令,或尝试检查版本。 容易多了!

alan@workstation:~$ echo $PATH
/home/alan/web/prod/nginx/sbin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin

alan@workstation:~$ which nginx
/home/alan/web/prod/nginx/sbin/nginx

alan@workstation:~$ nginx -v                                                 
nginx version: nginx/1.14.0

保持进程运行

NOHUP

当您注销或关闭终端时,进程可能不会继续运行。 通过在要运行的命令前加上 nohup 命令,可以避免这种特殊情况。 此外,附加一个 & 符号 (&) 会将进程发送到后台,并允许您继续使用终端。 例如,假设您要运行 myprogram.sh。

nohup myprogram.sh &

nohup 的一个好处是它会返回正在运行的进程的 PID。 接下来我将更多地谈论 PID。

管理正在运行的进程

每个进程都分配有一个唯一的进程识别号 (PID)。 此号码是我们用来管理每个进程的。 我们也可以使用进程名称,我将在下面演示。 有几个命令可以检查正在运行的进程的状态。 让我们快速浏览一下这些。

PS

最常见的是 ps。 ps 的默认输出是当前终端中正在运行的进程的简单列表。 如下所示,第一列包含 PID。

alan@workstation:~$ ps
PID TTY          TIME CMD
23989 pts/0    00:00:00 bash
24148 pts/0    00:00:00 ps

我想查看我之前启动的 Nginx 进程。 为此,我告诉 ps 显示每个正在运行的进程 (-e) 和完整列表 (-f)。

alan@workstation:~$ ps -ef
UID        PID  PPID  C STIME TTY          TIME CMD 
root         1     0  0 Aug18 ?        00:00:10 /sbin/init splash
root         2     0  0 Aug18 ?        00:00:00 [kthreadd]
root         4     2  0 Aug18 ?        00:00:00 [kworker/0:0H]
root         6     2  0 Aug18 ?        00:00:00 [mm_percpu_wq]
root         7     2  0 Aug18 ?        00:00:00 [ksoftirqd/0]
root         8     2  0 Aug18 ?        00:00:20 [rcu_sched]
root         9     2  0 Aug18 ?        00:00:00 [rcu_bh]
root        10     2  0 Aug18 ?        00:00:00 [migration/0]
root        11     2  0 Aug18 ?        00:00:00 [watchdog/0]
root        12     2  0 Aug18 ?        00:00:00 [cpuhp/0]
root        13     2  0 Aug18 ?        00:00:00 [cpuhp/1]
root        14     2  0 Aug18 ?        00:00:00 [watchdog/1]
root        15     2  0 Aug18 ?        00:00:00 [migration/1]
root        16     2  0 Aug18 ?        00:00:00 [ksoftirqd/1]
alan     20506 20496  0 10:39 pts/0    00:00:00 bash
alan     20520  1454  0 10:39 ?        00:00:00 nginx: master process nginx
alan     20521 20520  0 10:39 ?        00:00:00 nginx: worker process
alan     20526 20506  0 10:39 pts/0    00:00:00 man ps
alan     20536 20526  0 10:39 pts/0    00:00:00 pager
alan     20564 20496  0 10:40 pts/1    00:00:00 bash

您可以在上面 ps 命令的输出中看到 Nginx 进程。 该命令显示了近 300 行,但我为了说明而缩短了它。 您可以想象,尝试处理 300 行进程信息有点混乱。 我们可以将此输出管道传输到 grep 以过滤掉 nginx。

alan@workstation:~$ ps -ef |grep nginx
alan     20520  1454  0 10:39 ?        00:00:00 nginx: master process nginx
alan     20521 20520  0 10:39 ?        00:00:00 nginx: worker process

这样好多了。 我们可以快速看到 Nginx 的 PID 为 20520 和 20521。

PGREP

创建 pgrep 命令是为了进一步简化操作,从而无需单独调用 grep。

alan@workstation:~$ pgrep nginx
20520
20521

假设您处于托管环境中,其中多个用户正在运行多个不同的 Nginx 实例。 您可以使用 -u 选项从输出中排除其他人。

alan@workstation:~$ pgrep -u alan nginx
20520
20521

PIDOF

另一个巧妙的命令是 pidof。 即使另一个具有相同名称的进程正在运行,此命令也将检查特定二进制文件的 PID。 为了设置一个示例,我将 Nginx 复制到第二个目录,并相应地设置前缀来启动它。 在现实生活中,此实例可能位于不同的位置,例如不同用户拥有的目录中。 如果我运行两个 Nginx 实例,则 ps -ef 输出将显示它们的所有进程。

alan@workstation:~$ ps -ef |grep nginx
alan     20881  1454  0 11:18 ?        00:00:00 nginx: master process ./nginx -p /home/alan/web/prod/nginxsec
alan     20882 20881  0 11:18 ?        00:00:00 nginx: worker process
alan     20895  1454  0 11:19 ?        00:00:00 nginx: master process nginx
alan     20896 20895  0 11:19 ?        00:00:00 nginx: worker process

使用 grep 或 pgrep 将显示 PID 号,但我们可能无法辨别哪个实例是哪个。

alan@workstation:~$ pgrep nginx
20881
20882
20895
20896

pidof 命令可用于确定每个特定 Nginx 实例的 PID。

alan@workstation:~$ pidof /home/alan/web/prod/nginxsec/sbin/nginx
20882 20881

alan@workstation:~$ pidof /home/alan/web/prod/nginx/sbin/nginx
20896 20895

TOP

top 命令已经存在很长时间了,对于查看正在运行的进程的详细信息以及快速识别内存占用等问题非常有用。 其默认视图如下所示。

top - 11:56:28 up 1 day, 13:37,  1 user,  load average: 0.09, 0.04, 0.03
Tasks: 292 total,   3 running, 225 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.1 us,  0.2 sy,  0.0 ni, 99.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 16387132 total, 10854648 free,  1859036 used,  3673448 buff/cache
KiB Swap:        0 total,        0 free,        0 used. 14176540 avail Mem 

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
17270 alan      20   0 3930764 247288  98992 R   0.7  1.5   5:58.22 gnome-shell
20496 alan      20   0  816144  45416  29844 S   0.5  0.3   0:22.16 gnome-terminal-
21110 alan      20   0   41940   3988   3188 R   0.1  0.0   0:00.17 top
    1 root      20   0  225564   9416   6768 S   0.0  0.1   0:10.72 systemd
    2 root      20   0       0      0      0 S   0.0  0.0   0:00.01 kthreadd
    4 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 kworker/0:0H
    6 root       0 -20       0      0      0 I   0.0  0.0   0:00.00 mm_percpu_wq
    7 root      20   0       0      0      0 S   0.0  0.0   0:00.08 ksoftirqd/0

可以通过键入字母 s,后跟您首选的更新秒数来更改更新间隔。 为了更轻松地监视我们的示例 Nginx 进程,我们可以调用 top 并使用 -p 选项传递 PID。 此输出更加清晰。

alan@workstation:~$ top -p20881 -p20882 -p20895 -p20896

Tasks:   4 total,   0 running,   4 sleeping,   0 stopped,   0 zombie
%Cpu(s):  2.8 us,  1.3 sy,  0.0 ni, 95.9 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 16387132 total, 10856008 free,  1857648 used,  3673476 buff/cache
KiB Swap:        0 total,        0 free,        0 used. 14177928 avail Mem 

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
20881 alan      20   0   12016    348      0 S   0.0  0.0   0:00.00 nginx
20882 alan      20   0   12460   1644    932 S   0.0  0.0   0:00.00 nginx
20895 alan      20   0   12016    352      0 S   0.0  0.0   0:00.00 nginx
20896 alan      20   0   12460   1628    912 S   0.0  0.0   0:00.00 nginx

在管理进程(特别是停止进程)时,正确确定 PID 非常重要。 此外,如果以这种方式使用 top,则任何时候停止其中一个进程或启动一个新进程,都需要将新进程告知 top。

停止进程

KILL

有趣的是,没有 stop 命令。 在 Linux 中,有 kill 命令。 Kill 用于向进程发送信号。 最常用的信号是“terminate”(SIGTERM)或“kill”(SIGKILL)。 但是,还有更多信号。 以下是一些示例。 完整列表可以使用 kill -L 显示。

 1) SIGHUP	 2) SIGINT	 3) SIGQUIT	 4) SIGILL	 5) SIGTRAP
 6) SIGABRT	 7) SIGBUS	 8) SIGFPE	 9) SIGKILL	10) SIGUSR1
11) SIGSEGV	12) SIGUSR2	13) SIGPIPE	14) SIGALRM	15) SIGTERM

请注意,信号编号 9 是 SIGKILL。 通常,我们发出诸如 kill -9 20896 之类的命令。 默认信号是 15,即 SIGTERM。 请记住,许多应用程序都有自己的停止方法。 Nginx 使用 -s 选项来传递诸如“stop”或“reload”之类的信号。 通常,我更喜欢使用应用程序的特定方法来停止操作。 但是,我将演示 kill 命令来停止 Nginx 进程 20896,然后使用 pgrep 确认它已停止。 PID 20896 不再出现。

alan@workstation:~$ kill -9 20896
 
alan@workstation:~$ pgrep nginx
20881
20882
20895
22123

PKILL

pkill 命令类似于 pgrep,因为它可以通过名称搜索。 这意味着您在使用 pkill 时必须非常小心。 在我的 Nginx 示例中,如果我只想杀死一个 Nginx 实例,我可能不会选择使用它。 我可以传递 Nginx 选项 -s stop 到特定实例以将其杀死,或者我需要使用 grep 在完整的 ps 输出上进行过滤。

/home/alan/web/prod/nginx/sbin/nginx -s stop

/home/alan/web/prod/nginxsec/sbin/nginx -s stop

如果我想使用 pkill,我可以包含 -f 选项以要求 pkill 在完整的命令行参数中进行过滤。 这当然也适用于 pgrep。 因此,首先我可以使用 pgrep -a 进行检查,然后再发出 pkill -f

alan@workstation:~$ pgrep -a nginx
20881 nginx: master process ./nginx -p /home/alan/web/prod/nginxsec
20882 nginx: worker process
20895 nginx: master process nginx
20896 nginx: worker process

我也可以使用 pgrep -f 来缩小我的结果。 与 pkill 一起使用的相同参数会停止进程。

alan@workstation:~$ pgrep -f nginxsec
20881
                                            
alan@workstation:~$ pkill -f nginxsec

使用 pgrep(尤其是 pkill)要记住的关键是,您必须始终确保您的搜索结果准确,这样您就不会无意中影响错误的进程。

这些命令中的大多数都有许多命令行选项,所以我始终建议阅读每个命令的 man page。 虽然其中大多数存在于 Linux、Solaris 和 BSD 等平台中,但仍存在一些差异。 在命令行工作或编写脚本时,请务必进行测试并准备好根据需要进行更正。

标签
Alan Formy-Duval Opensource.com Correspondent
Alan 拥有 20 年的 IT 经验,主要在政府和金融行业。 他最初是一名增值经销商,之后转行从事系统工程。 Alan 的背景是高可用性集群应用程序。 他在 Oracle Press/McGraw Hill 的《Oracle Solaris 11 系统管理》一书中撰写了“用户和组”以及“Apache 和 Web 堆栈”章节。

6 条评论

谢谢你。 好文章。
pidof 正是我一直需要的。 我使用了另一种变通方法来在一行上获取所有 PID。
对于 nohup,您应该添加关于 nohup.out 的内容,当在没有任何重定向的情况下执行时,在程序后期发现写入 'nohup.out' 文件并长时间占用磁盘空间时,这非常烦人。

您提出了一个有效的担忧。 确实,nohup 会写入一个名为 nohup.out 的文件。 特别是在生产环境中,我们希望控制此输出。 尤其是,如果运行多个进程。 例如,如果我们想将 stderr 和 stdout 写入特定于进程的日志,我们可以这样做
nohup myprogram.sh > myprogram.out 2> myprogram.err < /dev/null &

或者,如果我们想将两者都写入同一个文件
nohup myprogram.sh >myprogram.log 2>&1 < /dev/null &

感谢您指出这一点。

回复 作者:Rajshekhar K

很棒,每个初学者都必须阅读

我认为

echo $PATH | tr ':' '\n'

使路径更易于阅读。

SIGTERM 比 SIGKILL 更可取,因为它允许程序控制其关闭例程。 SIGKILL (kill -9) 应该只作为程序不响应时的最后手段使用,有时会有不良的副作用。

Randall,您说得对。 我确实跳过了这个细微差别。 通常,我尝试不带选项的 kill,因为默认值为 SIGTERM (-15)。 只有这样,我才会转到 -9。 但是,就像我说的,如果可用,我总是更喜欢应用程序/供应商提供的脚本。

回复 作者:Randall Smith (未验证)

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.