关于perl：仅打印行中的第一个单词

Print only the first word in line

我需要以下perl代码的帮助。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

#!perl -w
use strict;
use warnings;

open my $file, '<', 'ubb' or die $1;

my $spool = 0;
my @matchingLines;

while (<$file>) {
if (/GROUPS/i) {
$spool = 1;
next;
}
elsif (/SERVERS/i) {
$spool = 0;
print map {"$_" } @matchingLines;
@matchingLines = ();
}
if ($spool) {
push (@matchingLines, $_);
}
}
close ($file);

输出如下所示。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

ADM LMID=GW_S4_1_PM,GW_S4_2_BM
GRPNO=1

ADM_TMS LMID=GW_S4_1_PM,GW_S4_2_BM
GRPNO=2
TMSNAME=TMS

ADM_1 LMID=GW_S4_1_PM
GRPNO=11

ADM_2 LMID=GW_S4_2_BM
GRPNO=12

DMWSG_Gateway_1 LMID=GW_S4_1_PM
GRPNO=101
ENVFILE="../GW_S4.Gateway.envfile"

DMWSG_Gateway_2 LMID=GW_S4_2_BM
GRPNO=201
ENVFILE="../GW_S4.Gateway.envfile"

DMWSG_1 LMID=GW_S4_1_PM
GRPNO=106

DMWSG_2 LMID=GW_S4_2_BM
GRPNO=206

但是我只想获取每行的第一个单词(例如ADM，ADM_TMS，ADM_1)。

请注意，该文件在此处打印的内容的上方和下方都有很多其他行。我只想对GROUPS和SERVERS之间的行执行此操作。

相关讨论

我建议您对代码进行2次更改

注意：已使用问题中的样本数据(以及其他内容)对它们进行了测试。

I：提取push之前的第一个单词

更改此

1	push (@matchingLines, $_);

到

1	push (@matchingLines, /^(\\S+)/);

这会将每行的第一个单词而不是整行推入数组。

请注意，/^(\\S+)/是$_ =~ /^(\\S+)/的简写。如果像7stud的答案中那样使用显式循环变量，则不能使用此简写形式，而应使用显式语法，例如$line =~ /^(\\S+)/或任何循环变量。

当然，您也可以按照7stud的答案中的建议使用split函数。

II：更改print的方式

更改此

1	print map {"$_" } @matchingLines;

变成

1
2
3
4

local $" ="\
";
print"@matchingLines \
";

$"指定使用双引号内的print或say打印数组时用于列表元素的定界符。

或者，根据TLP的建议，

1 2	$\\ = $/; print for @lines;

或

1
2
3

print join("\
", @lines),"\
"

请注意，$/是输入记录分隔符(默认为换行符)，$\\是输出记录分隔符(默认为未定义)。在每个print命令之后附加$\\。

有关$/，$\\和$"的更多信息：

请参见perldoc perlvar(只需使用CTRL F在该页面中找到它们)
或者，您可以简单地在控制台上使用perldoc -v '$/'等获取这些信息。

关于可读性的注意事项

我不认为隐式正则表达式匹配，即/pattern/本身是不好的。

但是与变量匹配，即$variable =~ /pattern/更具可读性(因为您可以立即看到正在进行正则表达式匹配)，并且对新手更友好，这是以简洁为代价的。

相关讨论

同意方括号，不确定括号是否需要保留，不确定不确定的做法。
是的，需要parens(我似乎没有)。当然，不好的做法。有所谓的"现代Perl"，还有旧风格的Perl。那是旧样式的perl。
您为什么删除评论，好像我在自言自语。检查不良行为部分。
对不起。我看到了括号，删除了我的评论以将其重写，然后您发表了评论。在以后的搜索中，我首先建议对正则表达式进行更改，以开始评论，同时我还指出隐式正则表达式匹配是不好的做法，这就是为什么我重写了op的if语句的原因。
再次嗨，我是盲人还是愚蠢的(或两者兼而有之)。但是我没有追随者去上班。使用严格使用警告；打开我的$ file，'<'，'ubb'或死亡$ 1;我的$ spool = 0;我的@matchingLines; while(我的$ line = <$ file>){如果($ line =?/ GROUPS / i){$ spool = 1;下一个; } elsif($ line =?/ SERVERS / i){$ spool = 0;本地$" =" ";打印" @matchingLines \\
"; @matchingLines =();} if($ spool){推(@matchingLines，/ ^(\\\\ S)/);}} close($ file);
@ user2617541您可以定义"无效"吗？ (在注释中粘贴很多代码也不是一个好主意，因为它很难阅读)
嗨，我在位置18的行末发现Array找到了运算符期望的位置(可能是从第17行开始的失控的多行"字符串")(之前缺少操作符？)反斜杠在位置18的行找到了期望的运算符" @matchingLines "(在\\\\？之前缺少运算符)在运算符在行18处，行尾(在前一行中缺少分号？)处找到字符串的语法错误，在行18处，在" print" @matchingLines附近，可以在EOF之前在第18行第EOF行处找不到字符串终止符'"'。感谢提示，不要粘贴代码。
我注意到您使用的是local $" ="\"而不是local $" ="\
"。那将是有问题的，因为它将导致未封闭的字符串(因为您要转义双引号)
谢谢，我错过了那个(盲人)。但是，在垫子第22行，<$ file>行70的模式匹配(m //)中使用未初始化的值。
哦，我明白了，您正在将我的答案和7stud的答案结合在一起。在这种情况下，您必须将/^(\\S+)/替换为$line =~ /^(\\S+)/
第22行是push(@matchingLines，/ ^(\\\\ S)/);
很高兴知道它有效。另外，请考虑投票/选择您认为有帮助的"已接受"答案。请参阅stackoverflow.com/help/someone-answers
1代表1。至于#2，实际执行print join("\
", @lines),"\
"可能更具可读性。或say for @lines。或$\\ = $/; print for @lines。
@TLP，谢谢。在print语句中包含了您的建议

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

use strict;
use warnings;
use 5.014; #say()

my $fname = 'data.txt';
open my $INFILE, '<', $fname
or die"Couldn't open $fname: $!"; #-->Not $1"

my $recording_on = 0;
my @matching_lines;

for my $line (<$INFILE>) {

if ($line =~ /groups/i) {
$recording_on = 1;
next;
}
elsif ($line =~ /servers/i) {
say for @matching_lines; #say() is the same as print(), but it adds a newline at the end
@matching_lines = ();
$recording_on = 0;
}

if ($recording_on) {
my ($first_word, $trash) = split"", $line, 2;
push @matching_lines, $first_word;
}
}

close $INFILE;