linux逐行连接两个文件,awk将两个文件逐行连接

  • Post author:
  • Post category:linux


将两个文档逐行连接,比如:

a文件内容是

a 1

b 2

c 3

b文件内容是

a 5

b 6

结果是

a 1 5

b 2 6

c 3

awk代码为:

awk ‘{a[$1]=a[$1]” “$2}END{for (j in a) print j””a[j]}’ a b

说实话,这行代码相当难以理解。看完了awk的语法,也没有发现类似的用法。使用谷歌找到了一个解释。

{ a[$1]=a[$1]” ” $2; next } means append the value of field two ($2) to an array (a) indexed by the value of field one ($1)

意思是a数组以$1为key,a[$1]的初值是空字符串,将同一个key对应的” “$2不断追加到a[$1]中。

比如:

awk ‘{a[$1]=a[$1]” “$2}END{for (j in a) print a[j]}’ a b

上面代码的结果是(间隔为两个空格):

1 5

2 6

3

还有一种方法

shellpaste -d’ ‘ a b | awk ‘{print $1, $2, $4}’

但这种写法没有第一种好,第一种写法可以保证b文件的第一列顺序与a不同时仍然可以实现拼接。比如,当b文件内容下面这种时,结果是一样的 b 6 a 5