Linux-Shell设计

  • Post author:
  • Post category:linux




一、shell 总论

​ shell 就是“壳程序”,这个名字是针对 kernel 来说的,也就是在操作系统外围的程序(严格的讲,已经不是操作系统了)。宏观上的 shell 是所有的应用程序,而狭义上的 shell,指的是命令行方面的操作系统界面。我们通过 shell 将我们输入的命令与内核沟通,好让内核可以控制硬件来正确无误地工作。

​ 我们在终端上经常敲的

ls



cd

等命令,其实都是一组一组得引用程序(存放在

\bin

) 里,我们通过 shell 调用这些程序来执行我们的指令。

​ bash 是 shell 的一种,linux 上还可以有多种 shell 程序。

​ 关于 shell 本身的使用,只有两点需要强调,就是如果一个命令过长,那么可以使用反斜杠

\

进行换行输出。此外,如果觉得输入命令太麻烦,可以使用别名设置,比如强大需求的

ll

alias="ls -al"



二、变量



2.1 使用、声明与取消

​ 变量的使用用的是如下格式

echo ${name}
echo $name

​ 其中

echo



在控制台界面打印变量

的意思,

$

是引用内容的意思。

​ bash 的赋值变量有点像

弱数据类型

语言的赋值,赋值的时候可以不指定类型(默认

字符串

)。赋值的时候,需要注意整个语句一般是不能有空格的,所以只有下面这种是对的:

name=Thysrael

​ 然后以下的都是错误的

name = Thysrael
name=Thysrael I miss you

​ 如果,真的想要进行有空格的赋值,那么应该采用双引号或者单引号的形式,两者的区别如下

name=Thysrael
sayhi="$name I miss you"
sayhello='$name I miss you'

​ 可以看出,在双引号里的变量会有进行内容引用,而当引号内只是单纯的字符串。

​ 按照这样的声明方法声明出的变量,都是字符串类型的(但是似乎在 bash 上,字符串类型就已经有很强大的功能了)。我们还可以采用如下命令来声明其他类型的变量:

declare [-aixr] variable_name

​ 其中参数的意义如下表:

参数 意义

-a
数组

-i
整型

-x
设置为环境变量

-r


readonly

,不能被更改,也不能被

unset

​ 累加内容的写法有两种:

name="$name"Shaw
name=${name}Shaw

​ 如果想要取消变量,有如下写法

unset name



2.2 作用范围

​ 变量的作用范围分为三种,

环境变量、全局变量、局部变量

。局部变量是指在脚本

函数体

中声明的变量,其作用域只有函数体内,因为脚本的知识是在后面涉及的,所有就不在此处介绍了。

​ 全局变量就是像上面

name

这样变量,他的作用范围是整个进程(也就是 shell 程序的一个“实例化”)。如果在 bash 里面输入:

bash

​ 就可以开启一个子进程,(虽然不会开启一个新的终端,但是确实是启动了一个新进程)



$

是一个环境变量(应该是吧),其内容是当前的进程号(PID),我们可以用命令

echo $$

打印来看看我们是否重新创建了一个进程,来佐证我们的观点,此外,还需要知道该命令

exit

​ 这个命令是退出当前进程。

在这里插入图片描述

​ 具体呈现的就是这样的结构:

在这里插入图片描述

​ 所谓的全局变量,就是只能在当前进程中起作用。比如下面的例子:

在这里插入图片描述

​ 只能在父进程里面打印出

name

变量,而在子进程中并没有

name

变量。

​ 而

环境变量

指的就是在父进程和其所有衍生出的进程里都可以使用的变量。我们可以用

export

或者

env

命令进行查看。

​ 如果我们想把一个全局变量变成环境变量,可以使用如下命令:

export variable

在这里插入图片描述

​ 可以发现,是可以在子进程中使用的。但是需要强调的是,这个变量在其他无关进程中依然是没法使用的,比如说我新开一个终端,那么会发现之前终端上定义的各种变量都消失了。

​ 如果想要定义的变量在每个终端中都预定义,那么就必须把这种变量写到 bash 的配置文件中,这样的变量一般都是大写的。



2.3 读取

采用如下命令

read variable_name

输入这个命令以后,bash 会等待输入,为了提示用户进行交互,还可以添加提示字符参数:

read -p "Please input the content of this variable: " variable_name



2.4 删除

​ 这里说的删除是指删除字符串变量的一个子串,如果想要快速删除一个子串,当然最快的方法是使用

通配符

(退化版的正则表达式)。删除一次只能删除一个子串,那么就是涉及两个问题:

  • 从前面开始删还是从后面开始删
  • 当采用通配符的时候,是贪婪模式还是非贪婪模式

首先先看一个标准的例子:

在这里插入图片描述

可以看到,用这种格式

{path命令符/目标子串}

可以起到删除目的。其中

命令符

有以下几种:

命令符 解释

#
采用非贪婪模式从左到右开始匹配(前缀必须匹配)

##
采用贪婪模式从左到右开始匹配(前缀必须匹配)

%
采用非贪婪模式从右到左开始匹配(后缀必须匹配)

%%
采用贪婪模式从右到左开始匹配(后缀必须匹配)

实验结果如下:

在这里插入图片描述



2.5 空串替换

​ 这里说的是一个很有趣的问题,对于一个字符串变量名。有三种状态:

  • A:未被声明
  • B:被声明,但是被声明为空串
  • C:被声明,但是不为空串

​ 有如下表格:

变量设置方式 A B C

var=${str-expr}

var=expr

var=

var=$str

var=${str:-expr}

var=expr

var=expr

var=$str

var=${str+expr}

var=

var=expr

var=expr

var=${str:+expr}

var=

var=

var=expr

var=${str=expr}

str=expr,var=expr

str不变,var=

str不变,var=

var=${str:=expr}

str=expr,var=expr

str=expr,var=expr

str不变,var=

做了一些实验:

在这里插入图片描述



2.6 整数计算

​ 因为变量的默认形式都是字符串,所以对于这种代码,会有很不尽如人意的输出

在这里插入图片描述

​ 所以需要采用特定的写法,如下

在这里插入图片描述

​ 还有用命令写的:

在这里插入图片描述




三、重定向

​ 其实没有想象的那么难,首先有下面的图

在这里插入图片描述

​ 其实这幅图只是在说明,当 bash 运行的时候,同时打开是三个文件。我们在重定向中,用

0

代表

stdin



1

代表

stdout



2

代表

stderr

​ 当我们想要把指令的输出内容重定向的时候,可以采用如下命令

command 1> file

​ 此时

e.txt

的内容就变成了:

在这里插入图片描述

​ 如果接着运行其他重定向命令,那么就会有如下结果:

在这里插入图片描述

​ 会发现原来

ll

的输出被

pwd

掩盖了。如果我们想要进入追加模式,那么应该有如下命令

command 1>> file

在这里插入图片描述

​ 其次是其实

1

是可以省略的,比如:

ls >e.txt

​ 如果想要把标准错误重定向,也是类似,如:

find /home -name .bashrc > list_right 2> list_error

​ 如果想要标准输出和标准错误同时输入一个文件,可以采用以下写法:

find /home -name .bashrc > list_right 2> list_error 1>&2

​ 这个指令的意思是,先将

标准错误

重定向到

list_error

,然后再将

标准输出

重定向到标准错误重定向的文件。

​ 还有一个有意思的东西是,如果不想要输出信息了,可以考虑将输出重定向到一个特殊的文件中,这个特定的文件可以当垃圾桶

command > /dev/null



四、多条命令关系



4.1 命令执行的判断根据

​ 如果想要一条语句执行多条命令,那么可以采用这种写法

cmd1; cmd2; cmd3

​ 但是这种写法其实就是把三行命令写到了一起,其实没啥逻辑关系。可是如果是这种

cmd1 && cmd2

​ 这个语句的意思是只有

cmd1

成功执行,

cmd2

才能成功执行。这个的底层意思可以这样理解:首先介绍一个变量(可能是个变量吧):

?

。这个的意思是

上一条指令的执行结果如何

,如果执行成功,则有

$? = 0

。这条语句的意思就是当

cmd1



$?=0

的时候,才执行

cmd2

。最后实现的效果就是,

cmd_n

会按照顺序一条一条的执行,直到执行完成,或者有一个指令报错。

​ 与之相对的,有如下命令

cmd1 || cmd2

​ 意思是当第一条指令执行错误的时候,第二条指令才会执行,这个已看上去会有点难以理解,不过其实这句话说得有点类似于一个

try{}catch{}

结构。



4.2 管道命令

​ 管道命令的意思就是通过连接符

|

,使前一条指令的标准输出作为后一条指令的标准输入。下面这张图很好的描述了这个概念:

​ 但是可以接受

stdin

的命令并不多,我们进行以下总结:

在这里插入图片描述

​ 但是其实能接受

stdin

的命令本来就不多,这里介绍几个用法:



4.2.1 阅读指令

​ 这两个指令其实不应该在这里讲,这个应该属于是在

文件

那里讲的,这两个命令与

cat

类似,都是用于阅读文本文件的(

vim

与他们的区别在于不仅可以阅读,还可以修改)。

more



less

都是按页阅读文件,也就是说,当文本文件的内容过多的时候,用

cat

就没有办法显示全了(只会显示一个屏幕,想看上面的必须用滚轮去捯)。这时就引入了

more



less

。我将他们理解为一种文本阅读器,这么说的理由是他们不止有阅读的功能,还有

查找,光标移动

等功能。此外,

more

可以看成

less

功能的一个子集,

more

的功能更少,而

less

更多一些,所以我在日常中使用

less

。不存在权衡的问题。

​ 演示如下,输入命令:

less /etc/debconf.conf

可以看到如下场景:

在这里插入图片描述

这个界面其实是很像

vim

的界面的。而且实际上也很像,有如下操作


  • Space

    :向下翻一页

  • Enter

    :向下滑一行

  • /查找内容

    :向下寻找内容

  • ?查找内容

    :向上寻找内容

  • n

    :向下重复上次的查找操作

  • N

    :向上重复上次的查找操作(上面这四条查找相关,都是与 vim 中相同)

  • q

    :退出(也可以是

    ZZ

    ,这也是与 vim 相同的地方)

  • g

    :到文本的第一行去

  • G

    :到文本的最后一行去

​ 正是因为其强大的阅读器功能,

less

常常作为管道命令的接受者,即阅读某个命令的输出信息,有如下示例:

在这里插入图片描述

​ 可以看到,我把我的博客的 generate 的输出信息输入到了

less

中,这样我就可以用

less

来查看我的产生信息了。

在这里插入图片描述



4.2.2 选取指令



4.2.2.1 head tail

​ 这里介绍四种命令,第一个是

head

,用来截取信息的前面的几行,如下示例:

head -n [num]

就是显示头部 num 行

在这里插入图片描述

​ 第二个是

tail

就是显示尾部信息

tail -n [num]

在这里插入图片描述



4.2.2.2 grep

第三个是

grep

如果说前面查找行是按照

行号



grep

则是依靠查找内容来进行行的检索,其格式如下

grep [-acinv] '查找字符串' filename

其中参数有:


  • -a

    :将二进制文件按照文本文件的方式查询

  • -c

    :计算找到查找字符的次数

  • -i

    :忽略大小写的不同

  • -n

    :输出查找内容的行号

  • -v

    :反向选择,即输出没有查找字符的行

举例如下:

在这里插入图片描述

比较高阶一点的用法是将

查找字符串



正则表达式的形式表示

,这样的话,查找会更加快一些。



4.2.2.3 sed



sed

是一个按行处理文本的工具,前三个还比较局限于

检索功能

,而

sed

的编辑功能是强大的。其本质如下

sed 是一种流编辑器,他是文本处理中的工具,能够完美配合正则表达式使用。处理时,把当前处理的行存储在临时缓存区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区中的内容送往屏幕。接着处理下一行,这样不断重复,直至文件结尾。

​ 其实需要注意的是,就是

sed

不会修改目标文件的内容,而只是将改变后的信息输出到屏幕上。



sed

的命令由三部分组成(如果用作管道命令的话,就不需要后面的文件了),即

sed [参数] '查找1操作1;查找2操作2;查找3操作3...' filename


参数

如下

字符 含义

-n
沉默模式,仅显示处理后的结果,一般打印的时候都需要开着

-i
直接修改文件内容,而不是由屏幕输出

-r
使用扩展正则表达式的语法
其他 不重要,就不总结了

这是开不开沉寂模式的对比

在这里插入图片描述


查找

的方法有很多:

  • 按行数查找

    • 一个特定的行数:

      1

      表示第一行
    • 一个范围的行数:

      1,3

      表示第 1,2,3 行
    • 一个范围的行数,到结尾:

      2,$

      表示从第 2 行开始到结尾行
  • 正则表达式查找:

    /正则表达式/

    。似乎正则有一些是没有办法使用的,示例如下

在这里插入图片描述


操作

的功能也有很多,如下表

符号 解释
d 删除
a 追加,会追加到搜索到的下一行
p 打印,就是把搜索到的内容打印出来(以行为单位)
i 插入,会插入到搜索到的上一行
s 替代,

/old/new

,但是只会找一个,如果想要全局替代,需要写成

/old/new/g
c 取代,会把范围内的行全都替换掉

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述



4.2.2.4 awk

​ 相较于

sed

常常用作于一个整行的数据处理,

awk

则比较倾向于一行当中分成数个字段来处理。

​ 其基本的处理模式如下:

awk '条件类型1{操作1} 条件类型2{操作2}...' filename



awk

会默认按空格将一行中的内容分割成多个

字段

,我们可以用字段变量来表示获得的字段。其中

$0

代表一整行数据,

$1

代表第一个个字段,

$2

代表第二个字段,以此类推。

​ 此外,

awk

还有许多内置变量,用以更好的完成工作

变量 意义

NF
每一行拥有的字段总数

NR
目前 awk 所处理的是第几行数据

FS
分割字符,可以通过设置它来分割字符

前两个变量常常用于构建条件,如下,就是把偶数行取了出来,可以看到这种变量使用的时候,不需要使用

$

在这里插入图片描述

第三个可以用于指定分隔符,可以把

BEGIN

看成一种特殊的条件



4.2.2.5 cut



cut

是弱化版的

awk

实现的是行内信息的切割,有如下格式,

-d

说明要声明分割字符,

-f

说明要挑选字段

cut -d '分割字符' -f num1,num2

​ 这条命令表示按照分割字符进行切分,并将切分的结构构成的子串,挑选出第num1到第num2个子串输出。

​ 还有另外一种格式,即:

cut -c num1-num2

​ 意思是挑选每一行从第num1到第num2个字符进行输出。效果如图:

在这里插入图片描述




五、脚本



5.1 解释器

​ 这里想谈一下我对

解释型语言



编译型语言

的理解。我们常说解释型语言写出来的源码叫做

脚本

。我觉得二者的区别在于是否经过编译。对于脚本语言(比如python,java,matlab),他们是不直接编译生成一个可执行文件的,他们会将源码交到一个叫做

解释器

的程序手里,由解释器读取相关的信息,并执行相关的操作。这个解释器在python里叫python解释器,在java里叫java虚拟机。如果说的再彻底一点,可以说解释器是脚本和操作系统之间的一个新的抽象层,就好像一个功能不太健全的虚拟机一样。而编译型语言并没有这个抽象的中间层,它直接编译生成可执行文件,这个文件可以直接运行,而不是通过解释器。

​ shell 脚本就是发挥了 shell 作为一个解释器的功能,开发出的很多个程序。

​ shell 脚本第一行会有一个固定的写法,来声明所用的 shell 程序,被叫做 shebang 行,如

#!/bin/bash



5.2 基础

脚本一般后缀名为

.sh

。想要运行脚本,可以使用命令

bash sh_name.sh

脚本中经常出现分号

;

。在实践的过程中,我发现去掉几个也没有啥关系(主要是不去真的很丑),然后发现网上有一个结论是

“如果写成单行,需要用分号进行区分,如果写成块,那么则用换行符替代了分号”

。不知道对不对。



5.3 条件判断

条件判断有两种格式,但是都是一种条件判断的格式,表格如下

判断

文件类型

,其格式为(注意

[\space\space]

必须与里面的内容有两个空格的间隔 )

test -arg filename
[ -arg filename ]
参数(arg) 意义

-e
该文件名是否存在

-f
该文件名是否是文件

-d
该文件名是否是目录

-S
该文件是否是一个 socket 文件

-L
该文件名是否是一个链接文件

判断

文件权限

,格式如下

test -arg filename
[ -arg filename ]
参数(arg) 意义

-r
判断该文件名是否具有可读性

-w
判断该文件名是否具有可写性

-x
判断该文件名是否具有可执行性


比较两文件

,格式如下

test file1 -arg file2
[ file1 -arg file2 ]
参数(arg) 意义

-nt
newer than 判断 file1 是否比 file2 新

-ot
older than 判断 file1 是否比 file2 旧

-ef
判断 file1 与 file2 是否是同一文件,判定文件是否均指向同一个 inode


比较两个整数

,格式如下

test num1 -arg num2
[ num1 -arg num2 ]
参数(arg) 意义

-eq
equal, 两数相等

-ne
not equal, 两数不等

-gt
greater than ,n1 大于 n2

-lt
less than,n1 小于 n2

-ge
greater than or equal than

-le
less than or equal than


判断字符串的数据

,格式如下

test -arg string
[ -arg string ]
参数 意义

-z
zero,判断字符串是空字符串

-n
not zero, 判断字符串不是空字符串


判断两字符串是否相等

,格式如下(注意空格问题)

test str1\space==\spacestr2
test str1\space!=\spacestr2
[\spacestr1\space==\spacestr2\space]
[\spacestr1\space!=\spacestr2\space]


多条件判定

其实就是逻辑判断符:

参数 意义

-a
即 and

-o
即 or

!
即 not



5.4 默认变量

默认变量就是输入脚本后跟的内容,有点类似于 C 程序的

main

函数的

argv

,然后还有一些约定的变量:


  • $#

    :表示参数的个数

  • $@

    :表示[“$1″”$2″“$3″”$4″…]

光说没意思,还是放一个脚本的代码和运行结果吧:

#!/bin/bash

echo "The script name is ${0}"
echo "Total parameter number is $#"
[ "s#" -lt 2 ] && echo "The number of parameter is less than 2. Stop here." && exit 0
echo "Your whole parameter is $@"
echo "The 1st parameter is ${1}"
echo "The 2nd parameter is ${2}"

在这里插入图片描述



5.5 条件分支语句

第一种是简单的

if

语句,有格式:

if [ condition ]; then
	commands
fi

有示例:

#!/bin/bash

read -p "Please input (Y/N): " yn
if [ "${yn}" == "Y" ] || [ "${yn}" == "y" ]; then
    echo "Ok, continue."
    exit 0
fi

if [ "${yn}" == "N" ] || [ "${yn}" == "n" ]; then
    echo "Oh, interupt."
    exit 0
fi

echo "I don't know what your choice is'" && exit 0

第二种是

if-else

语句,格式如下

if [ condition1 ]; then
	commands1
elif [ condition2 ]; then
 	commands2
else
	commands3
fi

示例如下:

#!/bin/bash

read -p "Please input (Y/N): " yn
if [ "${yn}" == "Y" ] || [ "${yn}" == "y" ]; then
    echo "Ok, continue."
elif [ "${yn}" == "N" ] || [ "${yn}" == "n" ]; then
    echo "Oh, interupt."
else
    echo "I don't know what your choice is"
fi

第三种是

case

语句,格式如下

case $variable_name in
	"value1")
		command1
		;;
	"value2")
		command2
		;;
	"value3")
		command3
		;;
	*)
		command4
		;;
esac

示例如下:

#!/bin/bash

case ${1} in
    "one")
        echo "Your choice is ONE."
        ;;
    "two")
        echo "Your choice is TWO."
        ;;
    "three")
        echo "Your choice is THREE."
        ;;
    *)  
        echo "Usage ${0} {one|two|three}"
        ;;
esac



5.6 循环语句

跟 C 的思路挺像的,分为

不定循环



固定循环

对于不定循环,有两种写法

while [ condition ]
do
	commands
done

until [ condition ]
do
	commands
done

其中,

until

语句的意思当

condition

为真的时候,退出循环(与·

while

相反),有如下示例

#!/bin/bash

while [ "{yn}" != "yes" -a "{yn} != "YES" ]
do
	read -p "Please input yes/YES to stop this program: " yn
done

​ 这个脚本的意思是输入 yes 就可以停止程序,如果用

until

来写的话(相同需求),为如下写法

#!/bin/bash

while [ "{yn}" == "yes" -o "{yn} == "YES" ]
do
	read -p "Please input yes/YES to stop this program: " yn
done

固定循环就是一般为

for

也同样有多种形式

最为常见的

数值 for

循环

for (( i=1; i<=n; i=i+1 ))
do 
	commands
done

有如下示例:

#!/bin/bash

read -p "Please input a number, I will count for 1+2+3+...+your_input" n

s=0
for (( i=1; i<=n; i=i+1 ))
do 
	s=$(( S{s}+s{i} ))
done

echo "The result is ${s}"

还有一种形式的 for 循环,格式如下

for var in con1 con2 con3 ...
do
	commands
done



var

会分别取

con1,con2,con3...

进行执行。

​ 如果想要构造一个连续序列,可以按如下写法

for c in {a..z}
do 
	echo $c
don

​ 此时 c 就会取遍小写字母表。



5.7 函数

​ 函数的格式如下:

function fname() 
{
	commands	
}

​ 需要注意的是,不需要声明函数参数,而是直接使就好了,比如

${1}

就代表第一个参数,这种使用方法是与脚本的默认变量冲突的,我们认为函数的参量会覆盖脚本的默认变量,有如下示例

#!/bin/bash

function printIt()
{
    echo "Your choice is ${1}"
}

echo "This program will print your choice."

case ${1} in
    "one")
        printIt 1
        ;;
    "two")
        printIt 2
        ;;
    "three")
        printIt 3
        ;;
    *)  
        echo "Usage ${0} {one|two|three}"
        ;;
esac



版权声明:本文为living_frontier原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。