在Bash中将字符串拆分成数组

2012-04-13 [1591] technology bash

在Bash中将字符串拆分成数组

split string to array in bash

和AS中的String.split不同，Bash没有类似的语法，但它实在是太灵活了，有很多种方式可以做类似的事情。

以前我写过一篇 Bash数组操作教程，今天使用Bash做文件处理的时候，发现有必要再写一篇将字符串拆分成数组的教程。但发现有人已经写了更好的教程在前面了，于是就偷懒转过来好了。

** 下面的内容转自Bash @ Linux **

以空白作为分隔符来拆分字符串构造数组

ARR=($STR)

注意$STR不能加引号。

1STR="Hello World" 
2ARR=($STR) 
3declare -p ARR 
4declare -a ARR='([0]="Hello" [1]="World")'

用指定分隔符来拆分字符串构造数组

如果分隔符不是空白，而是别的，那么需要借助IFS变量。

default IFS (Internal Field Separator, which is space/tab/new line)

1echo $PATH 
2/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
3IFS=: DIRS=($PATH) 
4declare -p DIRS   
5declare -a DIRS='([0]="/usr/kerberos/sbin" [1]="/usr/kerberos/bin" [2]="/usr/apache/apache-ant-1.7.1/bin" [3]="/usr/local/sbin" [4]="/usr/local/bin" [5]="/sbin" [6]="/bin" [7]="/usr/sbin" [8]="/usr/bin" [9]="/root/bin")'

但是下面的方式是不行的。

1echo $PATH 
2/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
3IFS=: declare -a DIRS=($PATH) 
4declare -p DIRS 
5declare -a DIRS='([0]="/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin")'

使用read -a来拆分字符串构造数组

All work and no play makes Jack a dull boy. 只会用功不玩耍，聪明孩子也变傻。

 1PROVERB="All work and no play makes Jack a dull boy." 
 2read -a WORDS <<< $PROVERB 
 3echo "$WORDS" 
 4All
 5echo "${#WORDS}" 
 63
 7echo "${WORDS[*]}" 
 8All work and no play makes Jack a dull boy.
 9echo "${WORDS[@]}" 
10All work and no play makes Jack a dull boy.
11echo "${#WORDS[*]}" 
1210
13echo "${#WORDS[@]}" 
1410

前面的例子中要分割的字符串是以空格分割的，现在举一个以:分割的例子。

1echo $IFS 
2IFS=: read -r -a DIRS <<< "$PATH" 
3echo $IFS 
4declare -p DIRS 
5declare -a DIRS='([0]="/usr/kerberos/sbin" [1]="/usr/kerberos/bin" [2]="/usr/apache/apache-ant-1.7.1/bin" [3]="/usr/local/sbin" [4]="/usr/local/bin" [5]="/sbin" [6]="/bin" [7]="/usr/sbin" [8]="/usr/bin" [9]="/root/bin")'

下面的例子是将当前工作目录以/进行分割。

1echo $PWD 
2/root/work191/ct08/src/ctmw
3IFS=/ read -r -a PARTS <<< $PWD 
4declare -p PARTS 
5declare -a PARTS='([0]=" root work191 ct08 src ctmw")'
6IFS=/ read -r -a PARTS <<<"$PWD" 
7declare -p PARTS                 
8declare -a PARTS='([0]="" [1]="root" [2]="work191" [3]="ct08" [4]="src" [5]="ctmw")'

使用cut命令分隔字符串

1echo "$STR" | cut -f $N

以TAB分隔，打印第N个子串值，N从1开始计数。

1echo "$STR" | cut -d "$DELIM" -d $N

以指定DELIM分隔，打印第N个子串值，N从1开始计数。其中，-d部分也可以是$N1,$N2,$N3的形式，即输出多个子串。

A good beginning is half done. 良好的开端是成功的一半。

1STR="A good beginning is half done." 
2echo $STR | cut -d ' ' -f 2          
3good
4echo $PATH 
5/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
6echo $PATH | cut -d ':' -f 3 
7/usr/apache/apache-ant-1.7.1/bin
8echo $PATH | cut -d ':' -f 3,5 
9/usr/apache/apache-ant-1.7.1/bin:/usr/local/bin

使用awk命令分隔字符串

1echo "$STR" | awk '{print $1}'
2echo "$STR" | awk '{print $2}'

注意：awk后面的参数用单引号，不能用双引号。

1STR="A good beginning is half done." 
2echo "$STR" | awk '{print $1}' 
3A
4echo "$STR" | awk '{print $2}' 
5good
6echo "$STR" | awk '{print $5,$6}' 
7half done.

文章ID：1591
原文作者：zrong(Jacky)
原文链接：https://blog.zengrong.net/post/bash_split_string_to_array/
版权声明：本作品采用署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 进行许可，非商业转载请注明出处（原文作者，原文链接），商业转载请联系作者获得授权。