利用shell脚本如何提取一个文件中某一特定行和下面若干行的内容

发布网友发布时间：2022-04-26 17:38

共3个回答

懂视网时间：2022-04-19 00:06

在Linux中有很多方法逐行读取一个文件的方法，其中最常用的就是下面的脚本里的方法，而且是效率最高，使用最多的方法。为了给大家一个直观的感受，我们将通过生成一个大的文件的方式来检验各种方法的执行效率。

方法1：while循环中执行效率最高，最常用的方法。

function while_read_LINE_bottm(){
While read LINE
do
echo $LINE
done < $FILENAME
}

注释：我习惯把这种方式叫做read釜底抽薪，因为这种方式在结束的时候需要执行文件，就好像是执行完的时候再把文件读进去一样。

方法2 ：重定向法；管道法: cat $FILENAME | while read LINE

Function While_read_LINE(){
cat $FILENAME | while read LINE
do
echo $LINE
done
}

注释：我只所有把这种方式叫做管道法，相比大家应该可以看出来了吧。当遇见管道的时候管道左边的命令的输出会作为管道右边命令的输入然后被输入出来。

方法3：文件描述符法

Function while_read_line_fd(){
Exec 3<&0
Exec 0<$FILENAME
While read LINE
Do
Echo $LINE
Exec 0<&<3
}

注释：这种方法分2步骤，第一，通过将所有内容重定向到文件描述符3来关闭文件描述符0.为此我们用了语法Exec 3<&0 。第二部将输入文件放送到文件描述符0，即标准输入。

方法4 for 循环。

function for_in_file(){
For i in `cat $FILENAME`
do
echo $i
done
}

注释：这种方式是通过for循环的方式来读取文件的内容相比大家很熟悉了，这里不多说。对各个方法进行测试，看那方法的执行效率最高。

首先我们用脚本(脚本见附件)生成一个70000行的文件，文件位置在/scripts/bigfile。然后通过下面的脚本来测试各个方法的执行效率，脚本很简单，不再解释。

#!/bin/bash
FILENAME="$1"
TIMEFILE="/tmp/loopfile.out" > $TIMEFILE
SCRIPT=$(basename $0)
function usage(){
echo -e "
USAGE: $SCRIPT file 
"
exit 1
}
function while_read_bottm(){
while read LINE
do
echo $LINE
done < $FILENAME
}
function while_read_line(){
cat $FILENAME | while read LINE
do
echo $LINE
done
}
function while_read_line_fd(){
exec 3<&0
exec 0< $FILENAME
while read LINE
do
echo $LINE
done
exec 0<&3
}
function for_in_file(){
for i in `cat $FILENAME`
do
echo $i
done
}
if [ $# -lt 1 ] ; then
usage
fi
echo -e " 
 starting file processing of each method
"
echo -e "method 1:"
echo -e "function while_read_bottm"
time while_read_bottm >> $TIMEFILE
echo -e "
"
echo -e "method 2:"
echo -e "function while_read_line "
time while_read_line >> $TIMEFILE
echo -e "
"
echo -e "method 3:"
echo "function while_read_line_fd"
time while_read_line_fd >>$TIMEFILE
echo -e "
"
echo -e "method 4:"
echo -e "function for_in_file"
time for_in_file >> $TIMEFILE

执行脚本后： [root@localhost shell]# ./while /scripts/bigfile
脚本输出内容

method 1:
function while_read_bottm
real 0m5.689s
user 0m3.399s
sys 0m1.588s
method 2:
function while_read_line
real 0m11.612s
user 0m4.031s
sys 0m4.956s
method 3:
function while_read_line_fd
real 0m5.853s
user 0m3.536s
sys 0m1.469s
method 4:
function for_in_file
real 0m5.153s
user 0m3.335s
sys 0m1.593s

下面我们对各个方法按照速度进行排序。

real 0m5.153s method 4 （for 循环法）
real 0m5.689s method 1 （while 釜底抽薪法）
real 0m5.853s method 3 （标识符法）
real 0m11.612s method 2 （管道法）

由此可见在各个方法中，for语句效率最高，而在while循环中读写文件时，

while read LINE
do
echo $LINE
done < $FILENAME

方式执行效率最高。

更多Shell逐行读取文件的4种方法相关文章请关注PHP中文网！

热心网友时间：2022-04-18 21:14

1、在linux目录/root下建立一个txt文件，内容如下，使用|竖线分割，作为我们的实验数据样本。

2、sed用法、sed-n'xp'data.txt；显示文件X行数据,获取第18行数据，即为sed-n'18p'data.txt。

3、sed-n'开始行，结束行p'data.txt；显示文件X行到Y行的内容：命令：sed-n'10,18p'data.txt。

4、head/tail用法。tail用法：tail经常用来查看文件末尾的数据，在shell中可以获取文本中指定数据行。tail-n-3data.txt获取文件最好3行数据。tail-n+3data.txt获取文件3到最后一行数据。

5、head用法：head经常用来显示文本的前n行数据。head-n10data.txt显示文本请10行数据。

6、tail和head的结合使用：例如获取文本倒数第二行数据,结果如图所示。命令：tail-n2data.txt|head-n1。

7、awk用法、awk在文本处理方面有着强大的功能，配合脚本使用，可以打印指定行和列。awk'NR==18{print}'data.txt。NR指定行号。

热心网友时间：2022-04-18 22:32

一条语句搞定，假定你要找到最后一个ABC以及后面的10行，当然这条语句能够执行的基础是，1.log里确实有ABC这个字符串，否则下面一条语句就会出现失败，更好的方法是在脚本中分成两条语句，一条语句判断是否有ABC以及行号，第二条语句是用sed来打印。你可以自己根据下面的命令来搞定，我就不多说了。

sed -n "$(grep -n ABC 1.log | tail -1 | cut -d : -f 1),+10p" ABC.log