博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
awk 系列Part3:如何使用 awk 按模式筛选文本或字符串
阅读量:6801 次
发布时间:2019-06-26

本文共 1907 字,大约阅读时间需要 6 分钟。

awk 系列:如何使用 awk 按模式筛选文本或字符串

awk 系列Part3:如何使用 awk 按模式筛选文本或字符串

作为 awk 命令系列的第三部分,这次我们将看一看如何基于用户定义的特定模式来筛选文本或字符串。

在筛选文本时,有时你可能想根据某个给定的条件或使用一个可被匹配的特定模式,去标记某个文件或数行字符串中的某几行。使用 awk 来完成这个任务是非常容易的,这也正是 awk 中可能对你有所帮助的几个功能之一。

让我们看一看下面这个例子,比方说你有一个写有你想要购买的食物的购物清单,其名称为 food_prices.list,它所含有的食物名称及相应的价格如下所示:

$ cat food_prices.list No  Item_Name       Quantity    Price1   Mangoes            10       $2.452   Apples             20       $1.503   Bananas            5        $0.904   Pineapples         10       $3.465   Oranges            10       $0.786   Tomatoes           5        $0.557   Onions             5        $0.45

然后,你想使用一个 (*) 符号去标记那些单价大于 $2 的食物,那么你可以通过运行下面的命令来达到此目的:

$ awk '/ *\$[2-9]\.[0-9][0-9] */ { print $1, $2, $3, $4, "*" ; } / *\$[0-1]\.[0-9][0-9] */ { print ; }' food_prices.list

awk 系列Part3:如何使用 awk 按模式筛选文本或字符串

打印出单价大于 $2 的项目

从上面的输出你可以看到在含有 芒果(mangoes) 和菠萝(pineapples)的那行末尾都已经有了一个 (*) 标记。假如你检查它们的单价,你可以看到它们的单价的确超过了 $2 。

在这个例子中,我们已经使用了两个模式:

  • 第一个模式: / *\$[2-9]\.[0-9][0-9] */ 将会得到那些含有食物单价大于 $2 的行,
  • 第二个模式: /*\$[0-1]\.[0-9][0-9] */ 将查找那些食物单价小于 $2 的那些行。

上面的命令具体做了什么呢?这个文件有四个字段,当模式一匹配到含有食物单价大于 $2 的行时,它便会输出所有的四个字段并在该行末尾加上一个 (*) 符号来作为标记。

第二个模式只是简单地输出其他含有食物单价小于 $2 的行,按照它们出现在输入文件 food_prices.list 中的样子。

这样你就可以使用模式来筛选出那些价格超过 $2 的食物项目,尽管上面的输出还有些问题,带有 (*) 符号的那些行并没有像其他行那样被格式化输出,这使得输出显得不够清晰。

我们在 awk 系列的第二部分中也看到了同样的问题,但我们可以使用下面的两种方式来解决:

1、可以像下面这样使用 printf 命令,但这样使用又长又无聊:

$ awk '/ *\$[2-9]\.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s\n", $1, $2, $3, $4 "*" ; } / *\$[0-1]\.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s\n", $1, $2, $3, $4; }' food_prices.list

awk 系列Part3:如何使用 awk 按模式筛选文本或字符串

使用 Awk 和 Printf 来筛选和输出项目

2、 使用 $0 字段。Awk 使用变量 0 来存储整个输入行。对于上面的问题,这种方式非常方便,并且它还简单、快速:

$ awk '/ *\$[2-9]\.[0-9][0-9] */ { print $0 "*" ; } / *\$[0-1]\.[0-9][0-9] */ { print ; }' food_prices.list

awk 系列Part3:如何使用 awk 按模式筛选文本或字符串

使用 Awk 和变量来筛选和输出项目

结论

这就是全部内容了,使用 awk 命令你便可以通过几种简单的方法去利用模式匹配来筛选文本,帮助你在一个文件中对文本或字符串的某些行做标记。

希望这篇文章对你有所帮助。记得阅读这个系列的下一部分,我们将关注在 awk 工具中使用比较运算符。


via:

作者:

译者:
校对:

本文由 原创编译, 荣誉推出

转载于:https://blog.51cto.com/wutengfei/2401573

你可能感兴趣的文章
Cuckoo hash算法分析——其根本思想和bloom filter一致 增加hash函数来解决碰撞 节省了空间但代价是查找次数增加...
查看>>
JavaScript禁用页面刷新
查看>>
React Native填坑之旅--动画
查看>>
MyEclipse10.0安装jad反编译插件
查看>>
Linux 小知识翻译 - 「环境变量」
查看>>
js提取正则中的字符串
查看>>
js38---门面模式
查看>>
转:SharePoint Portal Server扩容部署
查看>>
libtiff库使用
查看>>
[转载]UML用例图总结
查看>>
《深度探索C++对象模型》调用虚函数
查看>>
“ORA-01747: user.table.column, table.column 或列说明无效” 的解决方案
查看>>
Python命令行解析argparse常用语法使用简介
查看>>
Lambda 表达式
查看>>
手把手教你用python抢票回家过年 !(附代码)
查看>>
SilverLight1.1 之旅(二):添加事件
查看>>
【转】Javascript MD5编码
查看>>
Java:集合类的区别详解
查看>>
linux 内核库函数 【转】
查看>>
asp.net 判断是否是日期格式,判断是否是长日期格式,短日期格式,时间判断,日期判断,全部格式...
查看>>