关于linux：如何使用’cut’查找最后一个字段

How to find the last field using 'cut'

如果不使用sed或awk，而仅使用cut，那么当字段数未知或每行更改时，如何获取最后一个字段？

您可以尝试这样的事情：

1	echo 'maps.google.com' \| rev \| cut -d'.' -f 1 \| rev

说明

maps.google.com的反向为moc.elgoog.spam
cut使用点作为定界符并选择第一个字段，即moc
最后，我们再次将其反转(感谢提醒@tom)以获得com

相关讨论

使用参数扩展。这比包括cut(或grep)的任何种类的外部命令要高效得多。

1 2	data=foo,bar,baz,qux last=${data##*,}

有关bash中本机字符串操作的介绍，请参见 BashFAQ＃100 。

相关讨论

@ErwinWessels：因为bash真的很慢。使用bash运行管道，而不是批量处理数据。我的意思是，如果您在shell变量中已经有一行文本，或者您想执行while IFS= read -ra array_var; do :;done <(cmd)处理几行文本，那么这很好。但是对于大文件，rev | cut | rev可能更快！ (当然awk会比那快。)
@PeterCordes，对于大文件来说，awk肯定会更快，但是要克服恒定因素的启动成本，awk会花费很多。 (还存在一些shell，例如ksh93，其性能接近awk，在此答案中给出的语法仍然有效； bash异常缓慢，但它甚至无法接近唯一可用的选项)。
谢谢@PeterCordes;像往常一样，我猜每个工具都有其用例。
到目前为止，这是在bash脚本中精简单个变量的最快，最简洁的方法(假设您已经在使用bash脚本)。无需调用任何外部。
虽然这看起来确实很整洁，但我还是更喜欢double rev，它不是bash特有的。它学到了我一个新工具！请注意，我一直使用bash，但永远不会提醒那些古怪而野蛮的语法。
@Balmipour，...，但是rev特定于您使用的提供此功能的任何操作系统-尚未在所有UNIX系统上标准化。有关命令和实用程序的POSIX部分，请参见列出的章节-此处不存在。而且${var##prefix_pattern}实际上不是bash特定的；它在POSIX sh标准中，请参阅第2.6.2节(链接)的结尾，因此与rev不同，它始终可在任何兼容的shell上使用。
@Balmipour，...如果您从事学习新工具的业务，则可以考虑学习具有良好运行时性能特征的工具的好处。 shell之所以以速度慢而闻名，其原因的一半是因为许多人习惯于编写效率低下的脚本，并在内部脚本会用时使用外部命令。 (另一半是我和Peter先前讨论的问题-解释器的性能-但是如果您在紧密的循环中扩展外部工具，那么比较起来，解释器的性能就不那么明显了)。
@Charles Duffy感谢您的精确度。我从不需要外壳脚本中的性能，但是就这一点以及它的POSIX标准(我不知道)的事实而言，您显然是正确的。猜猜选择在很大程度上取决于需求，但是我很乐意对此有所了解:)
要求切|转速快一点是完全没有根据的。与字符串扩展相比，它非常慢。在我的系统上，字符串扩展的10000次重复花费0.398秒。 rev | cut | rev耗时1分钟6秒
@ Bruno9779，因此，它取决于实现细节。如果您为要反转的每个字符串增加一个新的管道，那将非常慢-正如您所注意到的。如果您通过发送10,000个字符串来重用单个管道，则它会比同等的本机bash更快-这大概就是PeterCordes所说的。就是说，单管道重用实际上很少是实际可行的，因此我同意您的观点，通常来说，参数扩展是正确的选择。
@ Bruno9779，...提供了一个仅使用一个管道即可非常快速地处理大量行的具体示例：在for ((i=0; i<10000; i++)); do echo"foo,bar,baz,$RANDOM"; done >file; time { rev devnull; }中，time覆盖的部分在我的本地系统上花费了0m0.026s挂钟时间。
您可以概括一下以得出最后一个领域的结论吗？ rev|cut|rev答案很容易适应以获取任何字段...
@GiacomoAlzetta，n=2; IFS=, read -r -a fields; echo"${fields[${#fields[@]}-n]}"-在ideone.com/gMUu1x上查看它的运行情况

仅使用cut是不可能的。这是使用grep的方法：

1	grep -o '[^,]*$'

用逗号分隔其他定界符。

相关讨论

没有awk吗？
但是使用awk是如此简单：

1	echo 'maps.google.com' \| awk -F. '{print $NF}'

AWK是一种功能更强大的工具，可以放在口袋里。
-F如果用于字段分隔符
NF是字段数(也代表最后一个的索引)

相关讨论

有多种方法。您也可以使用它。

1
2
3

echo"Your string here"| tr ' ' '
' | tail -n1
> here

显然，tr命令的空格输入应替换为所需的定界符。

相关讨论

这是仅使用cut的唯一可能解决方案：

echo"s.t.r.i.n.g." | cut -d'.' -f2-
[repeat_following_part_forever_or_until_out_of_memory:] | cut -d'.' -f2-

使用此解决方案，字段的数量确实可以是未知的，并且会不时变化。但是，由于行长不得超过LINE_MAX个字符或字段(包括换行符)，因此，绝对不能将任意数量的字段作为此解决方案的实际条件。

是的，这是一个非常愚蠢的解决方案，但是唯一符合我认为标准的解决方案。

相关讨论

如果您的输入字符串不包含正斜杠，则可以使用basename和一个子shell：

1	$ basename"$(echo 'maps.google.com' \| tr '.' '/')"

这不使用sed或awk，但是也没有使用cut，因此我不确定它是否可以用措词回答问题。

如果处理可能包含正斜杠的输入字符串，这将无法正常工作。解决该问题的方法是将正斜杠替换为您知道不是有效输入字符串的一部分的其他字符。例如，文件名中也不允许使用竖线(|)字符，因此可以使用：

1	$ basename"$(echo 'maps.google.com/some/url/things' \| tr '/' '\|' \| tr '.' '/')" \| tr '\|' '/'

以下实现朋友的建议

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

#!/bin/bash
rcut(){

nu="$( echo $1 | cut -d"$DELIM" -f 2- )"
if ["$nu" !="$1" ]
then
rcut"$nu"
else
echo"$nu"
fi
}

$ export DELIM=.
$ rcut a.b.c.d
d

相关讨论

为这个老问题添加一个方法只是为了好玩：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

$ cat input.file # file containing input that needs to be processed
a;b;c;d;e
1;2;3;4;5
no delimiter here
124;adsf;15454
foo;bar;is;null;info

$ cat tmp.sh # showing off the script to do the job
#!/bin/bash
delim=';'
while read -r line; do
while [["$line" =~"$delim" ]]; do
line=$(cut -d"$delim" -f 2- <<<"$line")
done
echo"$line"
done < input.file

$ ./tmp.sh # output of above script/processed input file
e
5
no delimiter here
15454
info

除了bash，仅使用cut。
好吧，我想是回声。

相关讨论

如果您有一个名为filelist.txt的文件，该文件是诸如以下内容的列表路径：
c：/dir1/dir2/file1.h
c：/dir1/dir2/dir3/file2.h

那么您可以执行以下操作：
rev filelist.txt |切-d" /" -f1 |转速

我意识到，只要确保存在尾随定界符，它就会起作用。因此，在我的情况下，我有逗号和空格分隔符。我在最后添加一个空格；

1
2
3

$ ans="a, b"
$ ans+=""; echo ${ans} | tr ',' ' ' | tr -s ' ' | cut -d' ' -f2
b

相关讨论