Linux字符截取命令-cut Linux字符截取命令-cut
作者 | WenasWei 一 Linux之cut命令详解 将每个文件中选定的行部分打印到标准输出, 如果没有文件,或者文件是-,则读取标准输入,长选项的强制参数对于短选项也是强制的。 cut 是一个选取命令,一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的,用于显示每行从开头算起 num1 到 num2 的文字。 1.1 使用语法 cut [-bn] [file]cut [-c] [file]cut [-df] [file] 1.2 使用说明 cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。 如果不指定 File 参数,cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一, cut 默认以制表符为分隔符。 参数:-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。-c :以字符为单位进行分割。-d :自定义分隔符,默认为制表符。-f :与-d一起使用,指定显示哪个区域。-n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的范围之内,该字符将被写出;否则,该字符将被排除 在 -b、-c 或 -f 中只能使用一个。每个LIST由一个组成 范围,或用逗号分隔的多个范围。选定的输入被写入 顺序与读取和写入的顺序相同。 1.3 三个方法定位 cut 命令主要是接受三个定位方法:第一,字节(bytes),用选项 -b第二,字符(characters),用选项 -c第三,域(fields),用选项 -f 二 cut 帮助文档 执行命令查询帮助文档:
cut帮助文档解析: (1)’-b字节列表’ ’–bytes =字节列表’ 选择仅打印字节列表中列出的位置中的 字节。制表符和退格键与其他任何字符一样;他们占用了1个字节。如果指定了输出定界符,然后在所选字节范围之间输出该字符串。 (2)’-c字符列表’ ’–characters =字符列表’ 选择仅打印在 character-list 中列出的位置中的 字符。目前与 -b 相同,但是国际化将改变这种状况。制表符和退格键与其他任何字符一样;他们占1个字符。如果指定了输出定界符,然后在所选字节范围之间输出该字符串。 (3)’-d input_delim_byte’ ’–delimiter = input_delim_byte’ 和 -F,请使用 input_delim_byte 的第一个字节作为输入字段分隔符(默认为TAB)。 (4)’-f字段列表’ ’–fields =字段列表’ 选择仅打印在 field-list 中列出的字段。默认情况下,字段之间用TAB字符分隔。还要打印任何不包含定界符的行,除非 -仅定界 (-s)选项已指定。 (5)’-n’ 不要拆分多字节字符。 (6)’-s’ ’-仅定界’ 为了 -F,请勿打印不包含字段分隔符的行。通常,任何没有字段分隔符的行都按原样打印。 三 命令详解与使用案例 3.1 实例一: 查询命令结合 cut -b 当你执行 who 命令时,会输出类似如下的内容: (1) 提取每一行的第3个字节 (2) 提取第1,第2、第3个字节 方案1: 方案2: -b 支持形如 1-3 的写法,而且多个定位之间用逗号隔开就可以了。 注意: cut 命令如果使用了-b选项,那么执行此命令时,cut 会先把 -b 后面所有的定位进行从小到大排序,然后再提取。不能颠倒定位的顺序。 (3) 提取第1到第3,第5和第20个字符之后的所有数据 (4) 提取第n个字节前后所有的字节 n = 2 的情况下 方案1: 方案2: 3.2 实例二: 文本文件结合 cut -c (1)创建测试文件 创建一份测试文件: test.txt 测试文件内容数据 (2) -c 和 -b 的使用区别 -c与命令查询结果: 看似查询结果相同,只是因为这个例子 who 输出取的数据都是字节字符,所以用 -b 和 -c 没有区别,如果你提取中文,区别就看出来了,看看中文提取的情况: 结果发现,这个问题不知道哪个版本已经修复了,附加上测试使用的 linux 版本,其他命令与 -b使用类似,下面将不再一一列举。 3.3 实例三: cut -d 与 -f 的共同使用 cut 的 -d 选项的默认间隔符就是制表符,所以当你就是要使用制表符的时候,完全就可以省略 -d 选项,而直接用-f来取域就可以了。 (1) 结合查询命令取出指定符号的切割的第一域 (2) 取出文档中指定符号的切割的第一域 (3)如上 -b 中的拼接规则同理使用 (4)分隔符必须为单个字符,多个异常如下 四 使用场景和缺陷不足 4.1 cut的使用场景 cut命令用来显示行中的指定部分,删除文件中指定字段脚本切割读取文件或者指定命令信息统计指定的服务器信息处理,进行归纳统计 4.2 cut的缺陷和不足 不能处理多空格如果文件里面的某些域是由若干个空格来间隔的,那么用cut就有点麻烦了,因为 cut 只擅长处理“以一个字符间隔”的文本内容 4.3 cut和awk的差别 当一个文件中每一行都含有一个或多个空格时,这时候只能用 awk 来分隔cut默认的分隔符是制表符,awk默认的分隔符是一个空格或者多个空格或者是制表符语法格式不同 参考文档: [1] 东方雨中漫步者.博客园: https://www.cnblogs.com/dong008259/archive/2011/12/09/2282679.html ,2011-12-09.[2] GNU操作系统: http://www.gnu.org/software/coreutils/manual/html_node/cut-invocation.html#cut-invocation
2024最新激活全家桶教程,稳定运行到2099年,请移步至置顶文章:https://sigusoft.com/99576.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。 文章由激活谷谷主-小谷整理,转载请注明出处:https://sigusoft.com/75377.html