linux - for循环数组 - 循环浏览Bash中的文件内容
shell for循环数组 (8)
@彼得:这可能适合你 -
echo "Start!";for p in $(cat ./pep); do
echo $p
done
这将返回输出 -
Start!
RKEKNVQ
IPKKLLQK
QYFHQLEKMNVK
IPKKLLQK
GDLSTALEVAIDCYEK
QYFHQLEKMNVKIPENIYR
RKEKNVQ
VLAKHGKLQDAIN
ILGFMK
LEDVALQILL
如何用Bash迭代文本文件的每一行?
有了这个脚本:
echo "Start!"
for p in (peptides.txt)
do
echo "${p}"
done
我在屏幕上得到这个输出:
Start!
./runPep.sh: line 3: syntax error near unexpected token `('
./runPep.sh: line 3: `for p in (peptides.txt)'
(后来我想用$ p做一些更复杂的事情,而不是输出到屏幕上。)
环境变量SHELL是(来自env):
SHELL=/bin/bash
/bin/bash --version
输出:
GNU bash, version 3.1.17(1)-release (x86_64-suse-linux-gnu)
Copyright (C) 2005 Free Software Foundation, Inc.
cat /proc/version
输出:
Linux version 2.6.18.2-34-default ([email protected]) (gcc version 4.1.2 20061115 (prerelease) (SUSE Linux)) #1 SMP Mon Nov 27 11:46:27 UTC 2006
文件peptides.txt包含:
RKEKNVQ
IPKKLLQK
QYFHQLEKMNVK
IPKKLLQK
GDLSTALEVAIDCYEK
QYFHQLEKMNVKIPENIYR
RKEKNVQ
VLAKHGKLQDAIN
ILGFMK
LEDVALQILL
选项1a: While循环:一次一行:输入重定向
#!/bin/bash
filename='peptides.txt'
echo Start
while read p; do
echo $p
done < $filename
选项1b: While循环:一次一行:
打开文件,从文件描述符中读取(在这种情况下,文件描述符#4)。
#!/bin/bash
filename='peptides.txt'
exec 4<$filename
echo Start
while read -u4 p ; do
echo $p
done
选项2: For循环:将文件读入单个变量并解析。
该语法将基于令牌之间的任何空白区域解析“行”。 这仍然有效,因为给定的输入文件行是单个工作记号。 如果每行有多个标记,那么这种方法就不适用。 另外,将完整文件读入单个变量对于大型文件来说并不是一个好策略。
#!/bin/bash
filename='peptides.txt'
filelines=`cat $filename`
echo Start
for line in $filelines ; do
echo $line
done
使用while循环,如下所示:
while IFS= read -r line; do
echo "$line"
done <file
笔记:
如果您没有正确设置
IFS
,您将失去缩进。
假设你有这个文件:
$ cat /tmp/test.txt
Line 1
Line 2 has leading space
Line 3 followed by blank line
Line 5 (follows a blank line) and has trailing space
Line 6 has no ending CR
有四个元素会改变许多Bash解决方案读取的文件输出的含义:
- 空白行4;
- 两条线上的前导或尾随空格;
- 保持个别行的含义(即每行是记录);
- 第6行没有以CR结尾。
如果您想逐行输入文本文件(包括没有CR的空白行和终止行),则必须使用while循环,并且必须对最后一行进行备用测试。
以下是可能更改文件的方法(与cat
返回值相比):
1)失去最后一行和前后空格:
$ while read -r p; do printf "%s\n" "'$p'"; done </tmp/test.txt
'Line 1'
'Line 2 has leading space'
'Line 3 followed by blank line'
''
'Line 5 (follows a blank line) and has trailing space'
(如果你这样做while IFS= read -rp; do printf "%s\n" "'$p'"; done </tmp/test.txt
而不是保留前导和尾随空格,但仍然丢失最后一行if它不以CR结束)
2)使用cat
替换进程会读取整个文件,并丢失单行的含义:
$ for p in "$(cat /tmp/test.txt)"; do printf "%s\n" "'$p'"; done
'Line 1
Line 2 has leading space
Line 3 followed by blank line
Line 5 (follows a blank line) and has trailing space
Line 6 has no ending CR'
(如果你从$(cat /tmp/test.txt)
删除了,你可以$(cat /tmp/test.txt)
读取文件,而不是一个$(cat /tmp/test.txt)
读取文件,也可能不是打算这么做......)
逐行读取文件并保留所有间距的最稳健和最简单的方法是:
$ while IFS= read -r line || [[ -n $line ]]; do printf "'%s'\n" "$line"; done </tmp/test.txt
'Line 1'
' Line 2 has leading space'
'Line 3 followed by blank line'
''
'Line 5 (follows a blank line) and has trailing space '
'Line 6 has no ending CR'
如果您想剥离领先和交易空间,请删除IFS=
部分:
$ while read -r line || [[ -n $line ]]; do printf "'%s'\n" "$line"; done </tmp/test.txt
'Line 1'
'Line 2 has leading space'
'Line 3 followed by blank line'
''
'Line 5 (follows a blank line) and has trailing space'
'Line 6 has no ending CR'
(一个文本文件没有终止\n
,虽然相当普遍,但在POSIX下被认为是坏的,如果你可以指望\n
你不需要while
循环中使用|| [[ -n $line ]]
。)
更多BASH常见问题
如果您不希望您的阅读被换行符打破,请使用 -
#!/bin/bash
while IFS='' read -r line || [[ -n "$line" ]]; do
echo "$line"
done < "$1"
然后以文件名作为参数运行脚本。
这并不比其他答案好,但是还有一种方法可以在没有空格的文件中完成工作(请参阅评论)。 我发现我经常需要单行程序来查看文本文件中的列表,而无需使用单独的脚本文件。
for word in $(cat peptides.txt); do echo $word; done
这种格式允许我把它全部放在一个命令行中。 将“echo $ word”部分更改为任何你想要的,你可以发出多个以分号分隔的命令。 以下示例将该文件的内容用作您可能写入的另外两个脚本的参数。
for word in $(cat peptides.txt); do cmd_a.sh $word; cmd_b.py $word; done
或者,如果您打算像使用流编辑器一样使用它(学习sed),则可以将输出转储到另一个文件,如下所示。
for word in $(cat peptides.txt); do cmd_a.sh $word; cmd_b.py $word; done > outfile.txt
我已经使用过这些,因为我已经使用了每行一个字创建它们的文本文件。 (见注释)如果你有空间不想分裂你的文字/线条,它会变得有点丑陋,但同样的命令仍然可以工作如下:
OLDIFS=$IFS; IFS=$'\n'; for line in $(cat peptides.txt); do cmd_a.sh $line; cmd_b.py $line; done > outfile.txt; IFS=$OLDIFS
这只是告诉shell仅在新行上拆分,而不是空格,然后将环境返回到之前的状态。 在这一点上,你可能想考虑把它全部放到一个shell脚本中,而不是把它全部压缩成一行。
祝你好运!
#!/bin/bash
#
# Change the file name from "test" to desired input file
# (The comments in bash are prefixed with #'s)
for x in $(cat test.txt)
do
echo $x
done
cat peptides.txt | while read line
do
# do something with $line here
done