Linux基础系列文章大纲 Shell系列文章大纲
SysV /etc/rc.d/init.d/functions脚本源码分析 虽然现在SysV风格的服务启动脚本在主流的操作系统上已经被systemd替代而逐渐退出舞台,但是对于学习写健壮的服务管理脚本以及学习写脚本来说,学习/etc/rc.d/init.d/functions还是很有帮助的。
/etc/rc.d/init.d/functions几乎被/etc/rc.d/init.d/下所有的Sysv服务启动脚本加载,也是学习shell脚本时一个非常不错的材料,在其中使用了不少技巧。
在该文件中提供了几个有用的函数:
daemon
:启动一个服务程序。启动前还检查进程是否已在运行。
killproc
:杀掉给定的服务进程。
status
:检查给定进程的运行状态。
success
:显示绿色的”OK”,表示成功。
failure
:显示红色的”FAILED”,表示失败。
passed
:显示绿色的”PASSED”,表示pass该任务。
warning
:显示绿色的”warning”,表示警告。
action
:根据进程退出状态码自行判断是执行success还是failure。
confirm
:提示(Y)es/(N)o/(C)ontinue? [Y]
并判断、传递输入的值。
is_true
:$1
的布尔值代表为真时,返回状态码0,否则返回1。包括t、y、yes和true,不区分大小写。
is_false
:$1
的布尔值代表为假时,返回状态码0。否则返回1。包括f、n、no和false,不区分大小写。
checkpid
:检查/proc下是否有给定pid对应的目录。给定多个pid时,只要存在一个目录都返回状态码0。
__pids_var_run
:检查pid是否存在,并保存到变量pid中,同时返回几种进程状态码。是functions中重要函数之一。
__pids_pidof
:获取进程pid。
pidfileofproc
:获取进程的pid。但只能获取/var/run下的pid文件中的值。
pidofproc
:获取进程的pid。可获取任意给定pidfile或默认/var/run下pidfile中的值。
前三个是functions文件最重要的3个函数,还用到了一些额外的辅助函数,稍稍有点复杂。所以由简至繁,先介绍并展示后面几个函数,再回头解释前3个函数。
以下是/etc/init.d/functions文件的开头定义的语句。设置umask值,使得加载该文件的脚本所在shell的umask为22。导出路径变量。但说实话,这个导出的路径变量并不理想,因为要为非rpm包安装的程序设计服务启动脚本时,必须写全路径命令,例如/usr/local/mysql/bin/mysql。因此,可以考虑将/etc/init.d/functions中的语句注释掉。
1 2 3 4 5 umask 022PATH="/sbin:/usr/sbin:/bin:/usr/bin" export PATH
PS:本文分析的/etc/init.d/functions文件是CentOS 7上的,和CentOS 6有些许区别,但该有的目的和动作都有。
1.几个显示函数 包括echo_success、success、echo_failure、failure、echo_passed、passed、echo_warning和warning函数。这几个函数的定义方式和使用方法完全一样。
以下是echo_success和success函数的定义语句。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 echo_success () { [ "$BOOTUP " = "color" ] && $MOVE_TO_COL echo -n "[" [ "$BOOTUP " = "color" ] && $SETCOLOR_SUCCESS echo -n $" OK " [ "$BOOTUP " = "color" ] && $SETCOLOR_NORMAL echo -n "]" echo -ne "\r" return 0 } success () { [ "$BOOTUP " != "verbose" -a -z "${LSB:-} " ] && echo_success return 0 }
很简单,就是不换行带颜色输出[ OK ]
字样。
1 2 3 4 5 6 [root@xuexi ~] [root@xuexi ~] [root@xuexi ~] [root@xuexi ~] [root@xuexi ~]
同理,剩余的几个状态显示函数也一样。
1 2 3 4 [root@xuexi ~] [root@xuexi ~] [root@xuexi ~] [root@xuexi ~]
2.action函数 这个函数在写脚本时还比较有用,可以根据退出状态码自动判断是执行success还是执行failure函数。
action函数定义语句如下:
1 2 3 4 5 6 7 8 9 10 11 action () { local STRING rc STRING=$1 echo -n "$STRING " shift "$@ " && success $"$STRING " || failure $"$STRING " rc=$? echo return $rc }
这个函数定义的很有技巧。先将第一个参数保存并踢掉,再执行后面的命令($@
表示执行后面的命令)。所以,当action函数只有一个参数时,action直接返回OK,状态码为0,当超过一个参数时,第一个参数先被打印,再执行从第二个参数开始的命令。
例如:
1 2 3 4 5 6 7 8 9 [root@xuexi ~] [ OK ] [root@xuexi ~] 5 [ OK ] [root@xuexi ~] sleeping [ OK ] [root@xuexi ~] moving file mv : cannot stat ‘xxxxxx.sh’: No such file or directory [FAILED]
所以,在脚本中使用action函数时,可以让命令执行成功与否的判断显得更”专业”。算是一个比较有趣的函数。
通常,该函数会结合/bin/true和/bin/false命令使用,它们无条件返回0或1状态码。
1 2 action $"MESSAGES: " /bin/true action $"MESSAGES: " /bin/false
例如,mysqld启动脚本中,判断mysqld已在运行时,直接输出启动ok的消息。(但实际上根本没做任何事)
1 2 3 4 if [ $MYSQLDRUNNING = 1 ] && [ $? = 0 ]; then action $"Starting $prog : " /bin/true ret=0
3.is_true和is_false函数 这两个函数的作用是转换输入的布尔值为状态码。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 is_true () { case "$1 " in [tT] | [yY] | [yY][eE][sS] | [tT][rR][uU][eE]) return 0 ;; esac return 1 } is_false () { case "$1 " in [fF] | [nN] | [nN][oO] | [fF][aA][lL][sS][eE]) return 0 ;; esac return 1 }
当is_true函数的第一个参数(后面的参数会忽略掉)为忽略大小写的t、y、yes或true时,返回状态码0,否则返回1。 当is_false函数的第一个参数(后面的参数会忽略掉)为忽略大小写的f、n、no或false时,返回状态码0,否则返回1。
4.confirm函数 这个函数一般用不上,因为脚本本来就是为了避免交互式的。在CentOS 7的functions中已经删除了该函数定义语句。不过,借鉴下它的处理方法还是不错的。
以下摘自CentOS 6.6的/etc/init.d/functions文件。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 strstr () { [ "${1#*$2*} " = "$1 " ] && return 1 return 0 } confirm () { [ -x /bin/plymouth ] && /bin/plymouth --hide-splash while : ; do echo -n $"Start service $1 (Y)es/(N)o/(C)ontinue? [Y] " read answer if strstr $"yY" "$answer " || [ "$answer " = "" ] ; then return 0 elif strstr $"cC" "$answer " ; then rm -f /var/run/confirm [ -x /bin/plymouth ] && /bin/plymouth --show-splash return 2 elif strstr $"nN" "$answer " ; then return 1 fi done }
第一个函数strstr的作用是判断第一个参数$1
中是否包含了$2
,如果包含了则返回状态码0。这函数也是一个不错的技巧。
第二个函数confirm的作用是根据交互式输入的值返回不同的状态码,如果输入的是y或Y或不输入时,返回0。输入的是c或C时,返回状态码2,输入的是n或N时返回状态码1。
于是可以根据confirm的状态值决定是否要继续执行某个程序。
用法和效果如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 [root@xuexi ~] Start service (Y)es/(N)o/(C)ontinue? [Y] Y [root@xuexi ~] 0 [root@xuexi ~] Start service (Y)es/(N)o/(C)ontinue? [Y] [root@xuexi ~] 0 [root@xuexi ~] Start service (Y)es/(N)o/(C)ontinue? [Y] n [root@xuexi ~] 1 [root@xuexi ~] Start service (Y)es/(N)o/(C)ontinue? [Y] c [root@xuexi ~] 2
5.pid检测相关函数 启动进程时,pid文件非常重要。不仅可以通过它判断进程是否在运行,还可以从中读取pid号用来杀进程。
5.1 checkpid、__pids_var_run和__pids_pidof函数
pid文件的路径可能为/var/run/$base.pid
文件($base
表示进程名的basename),也可能是自定义的路径,例如mysql的pid可以自定义为/mysql/data/mysql01.pid。但无论哪种情况,functions中的__pids_var_run
函数都可以处理。
pid文件中可能有多行,表示多实例。
每个进程都必有一个pid,但并不一定都记录在pid文件中,例如线程的pid。但无论如何,在/proc/目录下,一定会有pid号命名的目录,只要有对应pid号的目录,就表示该进程已经在运行。函数checkpid
专门检测给定的pid值在/proc下是否有对应的目录存在。
为了获取进程名的pid值,此处函数__pids_pidof
使用的是pidof
命令。该命令专门设计用来在脚本中取给定进程的pid。它的”-o”选项用于忽略某些进程号,在脚本中应用时常被忽略的是调用pidof的shell的PID,当前shell的PID以及父shell的pid。总之,该函数的目的就是为了获取合理无误的进程pid。
以下是函数checkpid
、__pids_var_run
和__pids_pidof
的定义语句。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 checkpid () { local i for i in $* ; do [ -d "/proc/$i " ] && return 0 done return 1 } __pids_var_run () { local base=${1##*/} local pid_file=${2:-/var/run/$base.pid} pid= if [ -f "$pid_file " ] ; then local line p [ ! -r "$pid_file " ] && return 4 while : ; do read line [ -z "$line " ] && break for p in $line ; do [ -z "${p//[0-9]/} " ] && [ -d "/proc/$p " ] && pid="$pid $p " done done < "$pid_file " if [ -n "$pid " ]; then return 0 fi return 1 fi return 3 } __pids_pidof () { pidof -c -m -o $$ -o $PPID -o %PPID -x "$1 " || \ pidof -c -m -o $$ -o $PPID -o %PPID -x "${1##*/} " }
从__pidsvar_run
函数的定义语句中可以了解到,只有当pid文件存在,且/proc下有pid对应的目录时,才表示进程在运行(当然,线程没有pid文件)。__pids_var_run
函数调用方法:
1 __pids_var_run program [pidfile]
如果不给定pidfile,则默认为/var/run/$base.pid
文件。函数的执行结果为4种状态码:
0:program正在运行。
1:program进程已死。pid文件存在,但/proc目录下没有对应的文件。
3:pid文件不存在。
4:pid文件的权限错误,不可读。
除了返回状态码,__pids_var_run
函数还会保存变量pid的结果,以供其他程序引用。
__pids_pidof
中使用了pidof命令,其中使用了几个”-o”选项,它用于忽略指定的pid。但看上去$$ $PPID %PPID
不是很好理解。-o $$
是忽略的是shell进程,大多数时候它会继承父shell的pid,但在脚本中时它代表的是脚本所在shell的pid。-o $PPID
忽略的是父shell。-o %PPID
忽略的是调用pidof命令的shell。不是很好理解,可以参考下面的测试语句。
测试脚本:
1 2 3 4 5 6 7 8 9 #!/bin/bash echo 'pidof bash: ' `pidof bash`echo 'script shell pid: ' `echo $$`echo 'script parent shell pid: ' `echo $PPID `echo 'pidof -o $$ bash: ' `pidof -o $$ bash`echo 'pidof -o $PPID bash: ' `pidof -o $PPID bash`echo 'pidof -o %PPID bash: ' `pidof -o %PPID bash`echo 'pidof -o $$ -o $PPID -o %PPID bash: ' `pidof -o $$ -o $PPID -o %PPID bash`
测试语句:
1 2 3 4 5 6 7 8 9 10 11 12 [root@xuexi ~] 3306 2436 2302 [root@xuexi ~] 1 parent shell: 2302 2 current bash pid: 3745 3306 2436 2302 3 pidof bash: 3748 3745 3306 2436 2302 4 script shell pid: 3748 5 script parent shell pid: 3745 6 pidof -o $$ bash: 3745 3306 2436 2302 7 pidof -o $PPID bash: 3748 3306 2436 2302 8 pidof -o %PPID bash: 3745 3306 2436 2302 9 pidof -o $$ -o $PPID -o %PPID bash: 3306 2436 2302
第一个pidof命令:说明当前已有3个bash,pid为:3306、2436和2302。 第二个命令:
行1说明括号的父shell为2302。
行5说明脚本的父shell为3745。即括号的父shell为当前bash环境,脚本的父shell为括号所在shell。
行2减第一个命令的结果说明括号所在子shell的pid为3745。
行3减行2说明shell脚本所在子shell的pid为3748。
-o $$
忽略的是当前shell,即脚本所在shell的pid,因为在shell脚本中时,$$
不继承父shell的pid。
-o $PPID
忽略的是pidof所在父shell,即括号所在shell。
-o %PPID
忽略的是调用调用pidof程序所在的shell,即脚本所在shell。
5.2 pidfileofproc和pidofproc函数 除了以上3个pid相关函数,functions文件中,还提供了两个函数pidfileofproc
和pidofproc
,均用于获取给定程序的pid值。
以下是pidfileofproc函数的定义语句。注意,该函数不是获取pidfile,而是获取pid值。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 pidfileofproc () { local pid if [ "$# " = 0 ] ; then echo $"Usage: pidfileofproc {program}" return 1 fi __pids_var_run "$1 " [ -n "$pid " ] && echo $pid return 0 }
因此,pidfileofproc
函数只能获取/var/run下的pid。
以下是pidofproc函数的定义语句:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 pidofproc () { local RC pid pid_file= if [ "$# " = 0 ]; then echo $"Usage: pidofproc [-p pidfile] {program}" return 1 fi if [ "$1 " = "-p" ]; then pid_file=$2 shift 2 fi fail_code=3 __pids_var_run "$1 " "$pid_file " RC=$? if [ -n "$pid " ]; then echo $pid return 0 fi [ -n "$pid_file " ] && return $RC __pids_pidof "$1 " || return $RC }
这两个函数的区别在于pidfileofproc只能搜索/var/run下的pid,而pidofproc可以搜索自给定的pidfile或/var/run/下的pid。而前面的__pids_pidof
函数,只有在获取bash进程时更精确(因为它会忽略父shell进程)。至于3个选哪个的问题,见文末总结 。
这两个函数用的比较少,但确实有使用它的脚本。如crond启动脚本中借助pidfileofproc来杀进程:
1 2 3 4 5 6 7 echo -n $"Stopping $prog : " if [ -n "`pidfileofproc $exec `" ]; then killproc $exec RETVAL=3 else failure $"Stopping $prog " fi
dnsbind的named服务启动脚本中借助pidofproc来判断进程是否已在运行。
1 2 3 4 5 6 7 8 9 10 pidofnamed () { pidofproc -p "$ROOTDIR$PIDFILE " "$named " ; } if [ -n "`pidofnamed`" ]; then echo -n $"named: already running" success echo exit 0; fi ;
6.重头戏(一):daemon函数 daemon函数用于启动一个程序,并根据结果输出success或failure。
定义语句如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 daemon () { local gotbase= force= nicelevel corelimit local pid base= user= nice = bg = pid_file= local cgroup= nicelevel=0 while [ "$1 " != "${1##[-+]} " ]; do case $1 in '' ) echo $"$0 : Usage: daemon [+/-nicelevel] {program}" "[arg1]..." return 1;; --check) base=$2 gotbase="yes" shift 2 ;; --check=?*) base=${1#--check=} gotbase="yes" shift ;; --user) user=$2 shift 2 ;; --user=?*) user=${1#--user=} shift ;; --pidfile) pid_file=$2 shift 2 ;; --pidfile=?*) pid_file=${1#--pidfile=} shift ;; --force) force="force" shift ;; [-+][0-9]*) nice ="nice -n $1 " shift ;; *) echo $"$0 : Usage: daemon [+/-nicelevel] {program}" "[arg1]..." return 1;; esac done [ -z "$gotbase " ] && base=${1##*/} __pids_var_run "$base " "$pid_file " [ -n "$pid " -a -z "$force " ] && return corelimit="ulimit -S -c ${DAEMON_COREFILE_LIMIT:-0} " [ -n "${NICELEVEL:-} " ] && nice ="nice -n $NICELEVEL " if [ -n "${CGROUP_DAEMON} " ]; then if [ ! -x /bin/cgexec ]; then echo -n "Cgroups not installed" ; warning echo else cgroup="/bin/cgexec" ; for i in $CGROUP_DAEMON ; do cgroup="$cgroup -g $i " ; done fi fi [ "${BOOTUP:-} " = "verbose" -a -z "${LSB:-} " ] && echo -n " $base " if [ -z "$user " ]; then $cgroup $nice /bin/bash -c "$corelimit >/dev/null 2>&1 ; $*" else $cgroup $nice runuser -s /bin/bash $user -c "$corelimit >/dev/null 2>&1 ; $*" fi [ "$?" -eq 0 ] && success $"$base startup" || failure $"$base startup" }
daemon函数调用方法:
1 daemon [--check=servicename] [--user=USER] [--pidfile=PIDFILE] [--force] program [prog_args]
需要注意的是:
只有--user
可以用来控制program启动的环境。
--check
和--pidfile
都是用来检查是否已运行的,不是用来启动的,如果提供了--check
,则检查的是名为servicename的进程,否则检查的是program名称的进程。
--force
则表示进程已存在时仍启动。
prog_args是向program传递它的运行参数,一般会从/etc/sysconfig/$base文件中获取。
例如httpd的启动脚本中。
1 2 echo -n $"Starting $prog : " daemon --pidfile=${pidfile} $httpd $OPTIONS
这样的语句的执行结果大致如下:
1 2 [root@xuexi ~] Starting httpd: [ OK ]
还需注意,通常program的运行参数可能也是--
开头的,要和program前面的选项区分。例如:
1 daemon --pidfile $pidfile --check $servicename $processname --pid-file=$pidfile
第二个--pid-file
是$processname
的运行参数,第一个--pidfile
是daemon检测$processname
是否已运行的选项。由于提供了--check $servicename
,所以函数调用语句__pids_var_run $base [pidfile]
中的$base
等于$servicename
,即表示检查$servicename
进程是否允许。如果没有提供该选项,则检查的是$processname
。
至此,daemon函数已经分析完成。实际上很简单,就是为daemon提供几个选项,再提供要执行的命令,并为该命令提供启动参数。
7.重头戏(二):killproc函数 killproc函数的作用是根据给定程序名杀进程。中间它会获取程序名对应的pid号,且保证/proc目录下没有pid对应的目录才表示进程关闭成功。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 killproc () { local RC killlevel= base pid pid_file= delay try RC=0; delay=3; try=0 if [ "$# " -eq 0 ]; then echo $"Usage: killproc [-p pidfile] [ -d delay] {program} [-signal]" return 1 fi if [ "$1 " = "-p" ]; then pid_file=$2 shift 2 fi if [ "$1 " = "-d" ]; then delay=$(echo $2 | awk -v RS=' ' -v IGNORECASE=1 '{if($1!~/^[0-9.]+[smhd]?$/) exit 1;d=$1~/s$|^[0-9.]*$/?1:$1~/m$/?60:$1~/h$/?60*60:$1~/d$/?24*60*60:-1;if(d==-1) exit 1;delay+=d*$1} END {printf("%d",delay+0.5)}' ) if [ "$?" -eq 1 ]; then echo $"Usage: killproc [-p pidfile] [ -d delay] {program} [-signal] return 1 fi shift 2 fi # check for second arg to be kill level [ -n " ${2:-} " ] && killlevel=$2 # 获取稍后的kill程序将要发送的信号 # Save basename. base=${1##*/} # Find pid. # 获取program的pid号,以让kill程序杀掉 __pids_var_run " $1 " " $pid_file " # 检查program是否已有对应pid文件,并返回pidfile中所有pid值 RC=$? if [ -z " $pid " ]; then if [ -z " $pid_file " ]; then pid=" $(__pids_pidof "$1 " )" # pid为空,且没有pidfile时,获取program的pid else [ " $RC " = " 4" ] && { failure $" $base shutdown" ; return $RC ;} fi fi # Kill it. # 根据pid,杀掉已存在的进程 if [ -n " $pid " ] ; then # 如果进程pid存在,则杀死它 [ " $BOOTUP " = " verbose" -a -z " ${LSB:-} " ] && echo -n " $base " if [ -z " $killlevel " ] ; then # 没有指定要传递的信号时 if checkpid $pid 2>&1; then # 给定pid在/proc目录中是否有对应目录 # TERM first, then KILL if not dead kill -TERM $pid >/dev/null 2>&1 # 先发送TERM信号 usleep 50000 if checkpid $pid ; then # 0.5秒后还没死透,则 try=0 while [ $try -lt $delay ] ; do # 在给定delay时间内不断检测是否已死 checkpid $pid || break sleep 1 let try+=1 done if checkpid $pid ; then # 超出delay后,发送KILL信号强制杀死 kill -KILL $pid >/dev/null 2>&1 usleep 50000 fi fi fi checkpid $pid # 若/proc下还有pid对应的目录,则进程关闭失败 RC=$? [ " $RC " -eq 0 ] && failure $" $base shutdown" || success $" $base shutdown" RC=$((! $RC) ) # use specified level only else # 使用指定的信号杀进程 if checkpid $pid ; then kill $killlevel $pid >/dev/null 2>&1 RC=$? [ " $RC " -eq 0 ] && success $" $base $killlevel " || failure $" $base $killlevel " elif [ -n " ${LSB:-} " ]; then RC=7 # Program is not running fi fi else # 如果进程pid不存在,表示未运行 if [ -n " ${LSB:-} " -a -n " $killlevel " ]; then RC=7 # Program is not running else failure $" $base shutdown" RC=0 fi fi # Remove pid file if any. if [ -z " $killlevel " ]; then # 未给定信号时,可能KILL信号强杀时使得pid文件还存在,手动移除它 rm -f " ${pid_file:-/var/run/$base.pid} " fi return $RC }
根据此脚本,可以知道关闭进程时,需要再三确定pid文件是否存在,/proc下是否有和pid对应的目录。直到/proc下已经没有了和pid对应的目录时,才表示进程真正杀死了。但此时pid文件仍可能存在 ,因此还要保证pid文件已被移除。
该函数的调用方法:
1 killproc [-p pidfile] [ -d delay] {program} [-signal]
8.重头戏(三):status函数 status函数用于获取进程的运行状态,有以下几种状态:
1 2 3 4 5 ${base} (pid $pid ) is running... ${base} dead but pid file exists ${base} status unknown due to insufficient privileges. ${base} dead but subsys locked ${base} is stopped
以下的status函数定义语句。注意,此为CentOS 7上语句,比CentOS 6多了一段systemctl的处理,用于Sysv的status状态向systemd的status状态转换。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 status () { local base pid lock_file= pid_file= if [ "$# " = 0 ] ; then echo $"Usage: status [-p pidfile] {program}" return 1 fi if [ "$1 " = "-p" ]; then pid_file=$2 shift 2 fi if [ "$1 " = "-l" ]; then lock_file=$2 shift 2 fi base=${1##*/} if [ "$_use_systemctl " = "1" ]; then systemctl status ${0##*/} .service ret=$? if systemctl show -p ActiveState ${0##*/} .service | grep -q '=active$' && \ systemctl show -p SubState ${0##*/} .service | grep -q '=exited$' ; then ret=3 fi return $ret fi __pids_var_run "$1 " "$pid_file " RC=$? if [ -z "$pid_file " -a -z "$pid " ]; then pid="$(__pids_pidof "$1 " ) " fi if [ -n "$pid " ]; then echo $"${base} (pid $pid ) is running..." return 0 fi case "$RC " in 0) echo $"${base} (pid $pid ) is running..." return 0 ;; 1) echo $"${base} dead but pid file exists" return 1 ;; 4) echo $"${base} status unknown due to insufficient privileges." return 4 ;; esac if [ -z "${lock_file} " ]; then lock_file=${base} fi if [ -f /var/lock/subsys/${lock_file} ]; then echo $"${base} dead but subsys locked" return 2 fi echo $"${base} is stopped" return 3 }
函数调用方法:
1 status [-p pidfile] [-l lockfile] program
由于函数定义原因,如果同时提供”-p”和”-l”选项,”-l”选项必须放在”-p”的后面。
9.几个重要函数的总结和使用说明 functions文件重要的东西差不多都介绍了,还有些无所谓的东西就忽略它们好了。看完这么多分析,肯定会晕头转向,所以给个总结。至于前面几个简单的函数echo_success
、echo_failure
、echo_passed
、echo_warning
、success
、failure
、passed
、warning
、action
、confirm
、is_true
、is_false
就懒的总结了,用法都很简单。
9.1 pid相关
checkpid
:检查/proc下是否有给定pid对应的目录,无论给定多少个pid,只要有一个有目录,都返回0。
调用方法:checkpid pid_list
1 2 3 4 [root@xuexi ~] [root@xuexi ~] [root@xuexi ~] 0
__pids_var_run
:检查pid是否存在,并保存到变量pid中,同时返回几种进程状态码。
这个函数非常重要,不仅从pidfile中获取并保存pid号码,还根据情况返回几种状态码,这几个状态码是status函数的重要依据。在SysV服务启动脚本中使用非常广泛。
调用方法:__pids_var_run program [pidfile]
以下是httpd进程的测试结果。分别是指定pid文件和不指定pid文件的情况。
1 2 3 4 5 6 7 8 9 10 11 12 [root@xuexi ~] [root@xuexi ~] [root@xuexi ~] 0 [root@xuexi ~] 4863 [root@xuexi ~] [root@xuexi ~] 3 [root@xuexi ~] [root@xuexi ~]
__pids_pidof
:获取进程pid。
pidfileofproc
:获取进程的pid。但只能获取/var/run下的pid文件中的值。
pidofproc
:获取进程的pid。可获取任意给定pidfile或默认/var/run下pidfile中的值。
都是获取进程pid,第一个函数和后两个的区别主要在于获取的pid是bash进程时更精确,第二个和第三个函数的区别在于第2个函数只能获取/var/run下pid文件中的pid值。
1 2 3 4 5 6 [root@xuexi ~] [root@xuexi ~] [root@xuexi ~] 4872 4871 4870 4869 4868 4867 4866 4865 4863 [root@xuexi ~] 4872 4871 4870 4869 4868 4867 4866 4865 4863
上面pidfileofproc命令没有任何结果,因为httpd的pid文件为/var/run/httpd/httpd.pid,而非/var/run/httpd.pid。
如果将httpd的pid路径修改为/var/run/httpd.pid,再看它们的结果。
1 2 3 4 5 6 7 8 9 [root@xuexi ~] [root@xuexi ~] [root@xuexi ~] [root@xuexi ~] [root@xuexi ~] /var/run/httpd.pid /var/run/httpd:
再看它们搜索到的pid以及进程列表中httpd的pid和pid文件中的pid。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 [root@xuexi ~] 6235 6234 6233 6232 6231 6230 6229 6228 6226 [root@xuexi ~] 6226 [root@xuexi ~] 6226 [root@xuexi ~] root 6226 0.0 0.3 177844 3892 ? Ss 12:14 0:00 /usr/sbin/httpd apache 6228 0.0 0.2 177844 2532 ? S 12:14 0:00 /usr/sbin/httpd apache 6229 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd apache 6230 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd apache 6231 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd apache 6232 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd apache 6233 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd apache 6234 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd apache 6235 0.0 0.2 177844 2508 ? S 12:14 0:00 /usr/sbin/httpd [root@xuexi ~] 6226
所以,要使用这3个函数中的哪一个?如果要找出进程的”master”进程号,例如要向主进程发送HUP信号reload配置文件时,应该用pidofproc并使用”-p”指定pid文件。其余时候用__pids_pidof
准没错,也正是如此,在daemon和killproc函数中都使用了它。另外,在多实例的情况下,也可以考虑使用pidofproc来根据pidfile搜索对应实例的pid。
9.2 daemon的使用
daemon
:启动一个服务程序。在启动前还检查是否已在运行。
调用方式:
1 daemon [--check=servicename] [--user=USER] [--pidfile=PIDFILE] [--force] program [prog_args]
--user
用于指定进程运行身份,--check
和--pidfile
用于指定检查进程是否已在运行,--force
表示即使在运行也同样再启动一个程序。prog_args用于为program程序提供启动参数。
一般daemon会配合以下几个语句同时执行,这正是SysV脚本的一个特点。
1 2 3 4 5 echo -n $"Starting $prog : " daemon --pidfile=${pidfile} $prog $OPTIONS RETVAL=$? [ $RETVAL = 0 ] && touch ${lockfile} return $RETVAL
注意,daemon函数启动程序时,自身就会调用success或failure函数,所以就不需再使用action函数了。如果不使用daemon函数启动服务,通常会配合action函数。例如:
1 2 3 $prog $OPTIONS RETVAL=$? [ $RETVAL -eq 0 ] && action "Starting $prog " /bin/true && touch ${lockfile}
9.3 killproc的使用
函数调用方式:
1 killproc [-p pidfile] [-d delay] program [-signal]
-p pidfile
:选项用于指定从此文件中获取进程的pid号,不指定时默认从/var/run/$base.pid
中获取。
-signal
:用于指定kill发送的信号。如果不指定,则默认先发送TERM信号,在-d delay
时间段内仍不断检测是否进程已经被杀死,如果还未死透,则delay超时后发送KILL信号强制杀死。
-d delay
:指定未使用-signal
时的延迟检测时间。有效单位为秒、分、时、日(“smhd”),不写时默认为秒。
需要明确的是,只有/proc目录下没有了pid对应的目录才算是杀死了。
一般来说,killproc前会判断进程是否已在运行,最后还要删除pid文件和lock文件。当然,killproc函数可以保证pid文件被删除。所以,killproc函数大致会同时配合以下语句用来杀进程:
1 2 3 4 5 6 7 8 9 10 status -p ${pidfile} $prog > /dev/null if [[ $? = 0 ]]; then echo -n $"Stopping $prog : " killproc -p ${pidfile} -d ${STOP_TIMEOUT} $httpd else echo -n $"Stopping $prog : " success fi RETVAL=$? [ $RETVAL -eq 0 ] && rm -f ${lockfile} ${pidfile}
同样注意,killproc中已经自带success和failure函数。如果不使用killproc杀进程,则通常会配合action函数或者success、failure。大致如下:
1 2 3 4 5 6 7 8 killall $prog ; usleep 50000 ; killall $prog RETVAL=$? if [ "RETVAL" -ne 0 ];then action $"Stopping $prog : " /bin/true rm -rf ${lockfile} ${pidfile} else action $"Stoping $prog : " /bin/false fi
以上由于采用的是killall命令,如果采用的是kill命令,则需要先获取进程的pid,在此之前还要检查pid文件是否存在。
9.4 status的使用
用于返回进程状态。调用方式:注意”-p”必须在”-l”前面
1 status [-p pidfile] [-l lockfile] program
共有以下几种状态:
1 2 3 4 5 ${base} (pid $pid ) is running... ${base} dead but pid file exists ${base} status unknown due to insufficient privileges. ${base} dead but subsys locked ${base} is stopped
10.memcached服务启动脚本示例 以下是memcached服务启动脚本的示例,是一个非常简单但却非常通用的Sysv服务启动脚本。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 #!/bin/bash PORT="11211" USER="nobody" MAXCONN="1024" CACHESIZE="64" OPTIONS="" RETVAL=0 prog="/usr/local/memcached/bin/memcached" desc="Distributed memory caching" lockfile="/var/lock/subsys/memcached" . /etc/rc.d/init.d/functions [ -f /etc/sysconfig/memcached ] && source /etc/sysconfig/memcached start () { echo -n $"Starting $desc (memcached): " daemon $prog -d -p $PORT -u $USER -c $MAXCONN -m $CACHESIZE "$OPTIONS " RETVAL=$? echo [ $RETVAL -eq 0 ] && touch $lockfile return $RETVAL } stop () { echo -n $"Shutting down $desc (memcached): " killproc $prog RETVAL=$? echo [ $RETVAL -eq 0 ] && rm -f $lockfile return $RETVAL } restart () { stop start } reload () { echo -n $"Reloading $desc ($prog ): " killproc $prog -HUP RETVAL=$? echo return $RETVAL } case "$1 " in start) start ;; stop) stop ;; restart) restart ;; condrestart) [ -e $lockfile ] && restart RETVAL=$? ;; reload) reload ;; status) status $prog RETVAL=$? ;; *) echo $"Usage: $0 {start|stop|restart|reload|condrestart|status}" RETVAL=1 esac exit $RETVAL
另请参考如何写SysV服务管理脚本 。