Perl 格式化输出

Perl 是一个非常强大的文本数据处理语言。

Perl 中可以使用 format 来定义一个模板,然后使用 write 按指定模板输出数据。

Perl 格式化定义语法格式如下:

  1. format FormatName =
  2. fieldline
  3. value_one, value_two, value_three
  4. fieldline
  5. value_one, value_two
  6. .

参数解析:

  • FormatName :格式化名称。

  • fieldline :一个格式行,用来定义一个输出行的格式,类似 @,^,<,>,| 这样的字符。

  • value_one,value_two…… :数据行,用来向前面的格式行中插入值,都是perl的变量。

  • . :结束符号。

以下是一个简单是格式化实例:

  1. #!/usr/bin/perl
  2. $text = "google baidu taobao";
  3. format STDOUT =
  4. first: ^<<<<< # 左边对齐,字符长度为6
  5. $text
  6. second: ^<<<<< # 左边对齐,字符长度为5
  7. $text
  8. third: ^<<<< # 左边对齐,字符长度为5,taobao 最后一个 o 被截断
  9. $text
  10. .
  11. write

执行以上实例输出结果为:

  1. first: google
  2. second: baidu
  3. third: taoba

格式行(图形行)语法

  • 格式行以 @ 或者 ^ 开头,这些行不作任何形式的变量代换。

  • @ 字段(不要同数组符号 @ 相混淆)是普通的字段。

  • @,^ 后的 <, >,| 长度决定了字段的长度,如果变量超出定义的长度,那么它将被截断。

  • <, >,| 还分别表示,左对齐,右对齐,居中对齐。

  • ^ 字段用于多行文本块填充。

值域格式

值域的格式,如下表所示:

格式值域含义
@<<<左对齐输出
@>>>右对齐输出
@|||中对齐输出
@##.## 固定精度数字
@*多行文本

每个值域的第一个字符是行填充符,当使用@字符时,不做文本格式化。

在上表中,除了多行值域@*,域宽都等于其指定的包含字符@在内的字符个数,例如:

  1. @###.##

表示七个字符宽,小数点前四个,小数点后两个。

实例如下:

实例

  1. #!/usr/bin/perl
  2. format EMPLOYEE =
  3. ===================================
  4. @<<<<<<<<<<<<<<<<<<<<<< @<<
  5. $name, $age
  6. @#####.##
  7. $salary
  8. ===================================
  9. .
  10. select(STDOUT);
  11. $~ = EMPLOYEE;
  12. @n = ("Ali", "Baidu", "Jaffer");
  13. @a = (20,30, 40);
  14. @s = (2000.00, 2500.00, 4000.000);
  15. $i = 0;
  16. foreach (@n){
  17. $name = $_;
  18. $age = $a[$i];
  19. $salary = $s[$i++];
  20. write;
  21. }

以上实例输出结果为:

  1. ===================================
  2. Ali 20
  3. 2000.00
  4. ===================================
  5. ===================================
  6. Baidu 30
  7. 2500.00
  8. ===================================
  9. ===================================
  10. Jaffer 40
  11. 4000.00
  12. ===================================

格式变量

  • $~ ($FORMAT_NAME) :格式名字$^ ($FORMAT_TOP_NAME) :当前的表头格式名字存储在

  • $% ($FORMAT_PAGE_NUMBER) :当前输出的页号

  • $= ($FORMAT_LINES_PER_PAGE) :每页中的行数

  • $| ($FORMAT_AUTOFLUSH) :是否自动刷新输出缓冲区存储

  • $^L ($FORMAT_FORMFEED) :在每一页(除了第一页)表头之前需要输出的字符串存储在

以下是一个简单是使用 $~ 格式化的实例:

实例

  1. #!/usr/bin/perl
  2. $~ = "MYFORMAT"; # 指定默认文件变量下所使用的格式
  3. write; # 输出 $~ 所指定的格式
  4. format MYFORMAT = # 定义格式 MYFORMAT
  5. =================================
  6. Text # Perl 教程
  7. =================================
  8. .
  9. write;

执行以上实例输出结果为:

  1. =================================
  2. Text # Perl 教程
  3. =================================
  4. =================================
  5. Text # Perl 教程
  6. =================================

如果不指定$~的情况下,会输出名为STDOUT的格式:

  1. #!/usr/bin/perl
  2. write; # 不指定$~的情况下会寻找名为STDOUT的格式
  3. format STDOUT =
  4. ~用~号指定的文字不会被输出
  5. ----------------
  6. STDOUT格式
  7. ----------------
  8. .

执行以上实例输出结果为:

  1. ----------------
  2. STDOUT格式
  3. ----------------

以下实例我们通过添加报表头部信息来演示 $^ 或 $FORMAT_TOP_NAME 变量的使用:

  1. #!/usr/bin/perl
  2. format EMPLOYEE =
  3. ===================================
  4. @<<<<<<<<<<<<<<<<<<<<<< @<<
  5. $name, $age
  6. @#####.##
  7. $salary
  8. ===================================
  9. .
  10. format EMPLOYEE_TOP =
  11. ===================================
  12. Name Age
  13. ===================================
  14. .
  15. select(STDOUT);
  16. $~ = EMPLOYEE;
  17. $^ = EMPLOYEE_TOP;
  18. @n = ("Ali", "Baidu", "Jaffer");
  19. @a = (20,30, 40);
  20. @s = (2000.00, 2500.00, 4000.000);
  21. $i = 0;
  22. foreach (@n){
  23. $name = $_;
  24. $age = $a[$i];
  25. $salary = $s[$i++];
  26. write;
  27. }

以上实例输出结果为:

  1. ===================================
  2. Name Age
  3. ===================================
  4. ===================================
  5. Ali 20
  6. 2000.00
  7. ===================================
  8. ===================================
  9. Baidu 30
  10. 2500.00
  11. ===================================
  12. ===================================
  13. Jaffer 40
  14. 4000.00
  15. ===================================

我们也可以使用 $% 或 $FORMAT_PAGE_NUMBER 为报表设置分页:

  1. #!/usr/bin/perl
  2. format EMPLOYEE =
  3. ===================================
  4. @<<<<<<<<<<<<<<<<<<<<<< @<<
  5. $name, $age
  6. @#####.##
  7. $salary
  8. ===================================
  9. .
  10. # 添加分页 $%
  11. format EMPLOYEE_TOP =
  12. ===================================
  13. Name Age Page @<
  14. $%
  15. ===================================
  16. .
  17. select(STDOUT);
  18. $~ = EMPLOYEE;
  19. $^ = EMPLOYEE_TOP;
  20. @n = ("Ali", "Baidu", "Jaffer");
  21. @a = (20,30, 40);
  22. @s = (2000.00, 2500.00, 4000.000);
  23. $i = 0;
  24. foreach (@n){
  25. $name = $_;
  26. $age = $a[$i];
  27. $salary = $s[$i++];
  28. write;
  29. }

以上实例输出结果为:

  1. ===================================
  2. Name Age Page 1
  3. ===================================
  4. ===================================
  5. Ali 20
  6. 2000.00
  7. ===================================
  8. ===================================
  9. Baidu 30
  10. 2500.00
  11. ===================================
  12. ===================================
  13. Jaffer 40
  14. 4000.00
  15. ===================================

输出到其它文件

默认情况下函数write将结果输出到标准输出文件STDOUT,我们也可以使它将结果输出到任意其它的文件中。最简单的方法就是把文件变量作为参数传递给write,如:

  1. write(MYFILE);

以上代码write就用默认名为MYFILE的打印格式输出到文件MYFILE中。

但是这样就不能用$~变量来改变所使用的打印格式。系统变量$~只对默认文件变量起作用,我们可以改变默认文件变量,改变$~,再调用write。

实例

  1. #!/usr/bin/perl
  2. if (open(MYFILE, ">tmp")) {
  3. $~ = "MYFORMAT";
  4. write MYFILE; # 含文件变量的输出,此时会打印与变量同名的格式,即MYFILE。$~里指定的值被忽略。
  5. format MYFILE = # 与文件变量同名
  6. =================================
  7. 输入到文件中
  8. =================================
  9. .
  10. close MYFILE;
  11. }

执行成功后,我们可以查看 tmp 文件的内容,如下所示:

  1. $ cat tmp
  2. =================================
  3. 输入到文件中
  4. =================================

我们可以使用select改变默认文件变量时,它返回当前默认文件变量的内部表示,这样我们就可以创建子程序,按自己的想法输出,又不影响程序的其它部分。

  1. #!/usr/bin/perl
  2. if (open(MYFILE, ">>tmp")) {
  3. select (MYFILE); # 使得默认文件变量的打印输出到MYFILE中
  4. $~ = "OTHER";
  5. write; # 默认文件变量,打印到select指定的文件中,必使用$~指定的格式 OTHER
  6. format OTHER =
  7. =================================
  8. 使用定义的格式输入到文件中
  9. =================================
  10. .
  11. close MYFILE;
  12. }

执行成功后,我们可以查看 tmp 文件的内容,如下所示:

  1. $ cat tmp
  2. =================================
  3. 输入到文件中
  4. =================================
  5. =================================
  6. 使用定义的格式输入到文件中
  7. =================================