5
Shell 数组
1. Shell 数组概述
我们学习了变量,知道了变量为存储单个元素的最小单元,本节我们来学习数组来存放多个元素的集合。
1.1 Shell 数组是什么
顾名思义,数组就是一系列数据的集合,这个数据就是我们之前学习的存储单个元素的最小单元变量,也就是说将一些列的元素整合到一个集合内,这个集合的名称就叫数组。当然与其他语言一样,数组具备几个条件,在 Shell 中数组仅支持一维数组,数组元素的下标从 0 开始,数组元素没有最大限制等。
1.2 为什么要用数组
与变量类似,当我们操作批量数据的时候,一个一个变量操作非常不便,此时我们可以使用一个数组集合,对整个数组集合进行遍历或其他操作,最终实现批量的效果,数组使得我们的脚本更具扩展性。
1.3 变量与数组的差异
变量是存储单个数据的单元,其在内存中是随机存储的,数组是存储一系列数据的集合,是事先在内存中开辟连续的一系列空间,之后将数组元素有序的存储在其中。
2. 数组的基本使用
2.1 数组的定义
数组的定义有两种方式,可分为直接定义和单元素定义。
2.1.1 直接定义
数组类似于变量定义,只不过将里面的值用小括号括起来,其中每个元素使用空格分割。Shell 是弱类型的,数组中元素的类型可以不一样,例如其中可以包含数字与字符串。
例如:
ARG1=(1 2 3 "hello Shell")
ARG1
为数组名称,其值前三个为数字,最后一个为字符串。
2.1.2 单元素定义
Shell 中数组下标从 0 开始,利用单个元素来定义数组。
例如:
[root@master scripts]# ARG2[0]=1
[root@master scripts]# ARG2[1]=2
[root@master scripts]# ARG2[2]=3
[root@master scripts]# ARG2[3]="hello Shell"
2.2 元素获取
2.2.1 获取单个元素
与变量的引用一样,数组可以获取单个位置的元素,利用 ${ARG[num]}
。
例如:
[root@master scripts]# echo ${ARG1[0]} //获取AEG1数组中第一个元素
1
[root@master scripts]# echo ${ARG1[3]} //获取AEG1数组中第四个元素
hello Shell
2.2.2 获取全部元素
- 获取数组值
获取数组全部元素使用 ${ARG[*]}
或 ${ARG[@]}
。
例如:
[root@master scripts]# echo ${ARG1[@]}
1 2 3 hello Shell
[root@master scripts]# echo ${ARG1[\*]}
1 2 3 hello Shell
- 获取数组下标
获取数组全部下标使用 ${!ARG[*]}
或 ${!ARG[@]}
。
例如:
[root@master ~]# echo ${!ARG1[@]}
0 1 2 3
[root@master ~]# echo ${!ARG1[\*]}
0 1 2 3
2.2.3 获取数组长度
- 获取整个数组长度
数组长度及数组中元素的个数,可以利用 ${#ARG[*]}
或 ${#ARG[@]}
,我们发现其实就是在获取数组全部元素前添加#
来获取数组个数。
例如:
[root@master scripts]# echo ${#ARG1[\*]}
4
[root@master scripts]# echo ${#ARG1[@]}
4
- 获取单个元素的长度
对于数组中的某个元我们也可以进行长度的获取,可以利用 ${#ARG1[num]}
。
例如:
[root@master scripts]# echo ${ARG1[@]}
100 2 3 hello Shell 10
[root@master scripts]# echo ${ARG1[3]} //获取第四个元素内容为:hello Shell
hello Shell
[root@master scripts]# echo ${#ARG1[3]} //获取四个元素长度为11
11
2.2.4 数组元素的修改
数组可以进行一些列对其元素的操作。
- 修改
对数组元素的修改,直接对单个元素修改即可,例如:
[root@master scripts]# AEG1[0]=100
[root@master scripts]# echo ${ARG1[@]}
100 2 3 hello Shell
- 增加
对数组元素的增加,和修改一致,直接对单个位置元素增加即可,例如:
[root@master scripts]# ARG1[10]=10
[root@master scripts]# echo ${ARG1[@]}
100 2 3 hello Shell 10
[root@master scripts]# echo ${#ARG1[@]}
5
Tips:在此我们发现元素之前有 4 个元素,我们将下标 10 的元素赋值为 10,数组是按照从前往后顺序赋值的。
- 删除
删除数组可以使用 unset,unset ARG1[num]
可以删除对应下标的数组元素,如果不带下标则删除数组的全部元素,例如:
[root@master scripts]# echo ${ARG1[@]}
100 3 hello Shell 10
[root@master scripts]# unset ARG1[0] //删除下标为0的元素
[root@master scripts]# echo ${ARG1[@]}
3 hello Shell 10
[root@master scripts]# unset ARG1 //删除整个数组元素
[root@master scripts]# echo ${ARG1[@]}
2.2.5 数组的切片
和其他语言一样,可以对数组进行切片也称截取操作。可以通过 ${AEG1[@或*]:起始位置:长度}
对原数组进行切片,返回的为字符串,例如:
[root@master scripts]# echo ${ARG1[@]}
1 2 3 hello Shell
[root@master scripts]# echo ${ARG1[@]:0:2} //从第1个元素往后2个元素进行切片
1 2
2.2.6 数组的替换
可以替换数组中的某一个元素,例如我们将 ARG1
数组中的第 1 个元素替换为 110。
[root@master scripts]# echo ${ARG1[@]}
1 2 3 hello Shell
[root@master scripts]# echo ${ARG1[@]/1/110}
110 2 3 hello Shell
3. Shell 数组分类
我们知道了 Shell 中数组的基本操作,来看一下数组的分类。
3.1 普通数组
普通数组就是我们上面以数字为下标的数组,上述的例子都为普通数组。
3.2 关联数组
关联数组是可以用字符串当作数组下标的一类数组,在使用关联数组前,必须先使用 declare -A
声明它,例如:
[root@master ~]# declare -A ARGFILE //定义管理数组
[root@master ~]# ARGFILE=([name1]=Shell [name2]=linux [name3]=arg) //关联数组元素赋值
[root@master ~]# echo ${ARGFILE[@]} //查看所有元素
arg linux Shell
[root@master ~]# echo ${ARGFILE[name1]} //查看索引为name1的元素值
Shell
当然也可以对单个元素进行赋值操作, 我们可以看到关联数组就没有排序了,类似于其他语言中的字典,key 值也是字符串形式。
[root@master ~]# declare -A ARGLIST
[root@master ~]# ARGLIST[n1]=1
[root@master ~]# ARGLIST[n2]=2
[root@master ~]# ARGLIST[n3]="hello Shell"
[root@master ~]# echo ${ARGLIST[@]} //获取关联数组的所有值
2 hello Shell 1
[root@master ~]# echo ${#ARGLIST[@]} //获取关联数组的元素个数
3
[root@master ~]# echo ${!ARGLIST[@]} //获取关联数组的下标
n2 n3 n1
4. 实例
4.1 需求
我们想利用数组统计 linux 服务器的每 5 分钟的网络链接情况,查看处于各个时间段的服务器 TCP 链接的情况。
4.2 思路
可以利用 netstat -ant
命令来查看网络链接情况,但是输出的内容我们只关心最后一列的状态,因此我们可以利用 awk 来打印从第二行开始到最后一列状态,由于 awk 命令在后续我们会详解,在此仅作为工具使用,例如:
[root@master ~]# netstat -ant|awk 'NR>2 {print $NF}'
LISTEN
LISTEN
ESTABLISHED
TIME_WAIT
打印出来的就是最后一列的状态,我们将其内容作为数组的下标,值为其出现的次数,这样就可以统计 TCP 链接到状态,配合定时任务来定时统计服务器的 tcp 链接状态。
4.3 实现
[root@master Shell_args]# cat tcp\_status.sh
#!/bin/bash
# Description: check tcp status
# Auth: kaliarch
# Email: kaliarch@163.com
# function: net check
# Date: 2020-03-14 14:00
# Version: 1.0
# 日志目录
LOG_FILE="/tmp/tcp\_status.log"
# 定义管理数组
declare -A TCP_STATUS
# 对数组进行内容赋值
# 利用netstat命令来过滤出关系的一列数据
for status in $(netstat -ant|awk 'NR>2 {print $NF}')
do
# 对状态相同状态的TCP进行数值累加
let TCP_STATUS[${status}]++
done
# 将统计完成的TCP链接状态及数据记录到日志中
for i in ${!TCP_STATUS[@]}
do
echo "$(date +%F" "%H:%m) 服务器的TCP状态为: ${i} 的数量为: ${TCP\_STATUS[${i}]}" >> ${LOG_FILE}
done
# 测试
[root@master ~]# bash tcp\_status.sh
[root@master ~]# cat /tmp/tcp\_status.log
2020-03-14 15:03 服务器的TCP状态为: TIME_WAIT 的数量为: 138
2020-03-14 15:03 服务器的TCP状态为: ESTABLISHED 的数量为: 501
2020-03-14 15:03 服务器的TCP状态为: LISTEN 的数量为: 59
查看我们单独运行脚本已经成功,可以将这个脚本加入 crontab 中,来定时执行,后期就可以通过日志来查看当时服务器的状态了。
5. 注意事项
- 需要在实战中理解数组的具体用途,尤其注意关联数组的灵活运用;
- 需要理解数组的全部元素,元素下标以及元素的切片和替换,具体场景配合使用;
- 数组一般用来统计批量的内容,例如批量文件的计算等,配合其他命令使用。
6. 小结
数组可谓为我们在 Shell 编程中提供了集合类型数据存储的方案,对于批量数据的操作,数组功不可没。在具体的实践中根据数据特征,明确需求是利用数字作为下标的数组,还是使用关联数组,最后在实践中灵活运用数组的整体长度,切片,替换等操作,配合其他命令实现具体业务需求。