Java 8 Stream

Java 8 API添加了一个新的抽象称为流Stream,可以让你以一种声明的方式处理数据。

Stream 使用一种类似用 SQL 语句从数据库查询数据的直观方式来提供一种对 Java 集合运算和表达的高阶抽象。

Stream API可以极大提高Java程序员的生产力,让程序员写出高效率、干净、简洁的代码。

这种风格将要处理的元素集合看作一种流, 流在管道中传输, 并且可以在管道的节点上进行处理, 比如筛选, 排序,聚合等。

元素流在管道中经过中间操作(intermediate operation)的处理,最后由最终操作(terminal operation)得到前面处理的结果。

  1. +-------------------------+ +-------+ +-------+ +-----+ +---------+
  2. | stream of elements +-----> |filter+-> |sorted+-> |map+-> |collect|
  3. +-------------------------+ +-------+ +-------+ +-----+ +---------+

以上的流程转换为 Java 代码为:

  1. List<Integer> transactionsIds =
  2. widgets.stream()
  3. .filter(b -> b.getColor() == RED)
  4. .sorted((x,y) -> x.getWeight() - y.getWeight())
  5. .mapToInt(Widget::getWeight)
  6. .sum();

什么是 Stream?

Stream(流)是一个来自数据源的元素队列并支持聚合操作

  • 元素是特定类型的对象,形成一个队列。 Java中的Stream并不会存储元素,而是按需计算。
  • 数据源 流的来源。 可以是集合,数组,I/O channel, 产生器generator 等。
  • 聚合操作 类似SQL语句一样的操作, 比如filter, map, reduce, find, match, sorted等。

和以前的Collection操作不同, Stream操作还有两个基础的特征:

  • Pipelining: 中间操作都会返回流对象本身。 这样多个操作可以串联成一个管道, 如同流式风格(fluent style)。 这样做可以对操作进行优化, 比如延迟执行(laziness)和短路( short-circuiting)。
  • 内部迭代: 以前对集合遍历都是通过Iterator或者For-Each的方式, 显式的在集合外部进行迭代, 这叫做外部迭代。 Stream提供了内部迭代的方式, 通过访问者模式(Visitor)实现。

生成流

在 Java 8 中, 集合接口有两个方法来生成流:

  • stream() − 为集合创建串行流。

  • parallelStream() − 为集合创建并行流。

  1. List<String> strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");
  2. List<String> filtered = strings.stream().filter(string -> !string.isEmpty()).collect(Collectors.toList());

forEach

Stream 提供了新的方法 'forEach' 来迭代流中的每个数据。以下代码片段使用 forEach 输出了10个随机数:

  1. Random random = new Random();
  2. random.ints().limit(10).forEach(System.out::println);

map

map 方法用于映射每个元素到对应的结果,以下代码片段使用 map 输出了元素对应的平方数:

  1. List<Integer> numbers = Arrays.asList(3, 2, 2, 3, 7, 3, 5);
  2. // 获取对应的平方数
  3. List<Integer> squaresList = numbers.stream().map( i -> i*i).distinct().collect(Collectors.toList());

filter

filter 方法用于通过设置的条件过滤出元素。以下代码片段使用 filter 方法过滤出空字符串:

  1. List<String>strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");
  2. // 获取空字符串的数量
  3. int count = strings.stream().filter(string -> string.isEmpty()).count();

limit

limit 方法用于获取指定数量的流。 以下代码片段使用 limit 方法打印出 10 条数据:

  1. Random random = new Random();
  2. random.ints().limit(10).forEach(System.out::println);

sorted

sorted 方法用于对流进行排序。以下代码片段使用 sorted 方法对输出的 10 个随机数进行排序:

  1. Random random = new Random();
  2. random.ints().limit(10).sorted().forEach(System.out::println);

并行(parallel)程序

parallelStream 是流并行处理程序的代替方法。以下实例我们使用 parallelStream 来输出空字符串的数量:

  1. List<String> strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");
  2. // 获取空字符串的数量
  3. int count = strings.parallelStream().filter(string -> string.isEmpty()).count();

我们可以很容易的在顺序运行和并行直接切换。

Collectors

Collectors 类实现了很多归约操作,例如将流转换成集合和聚合元素。Collectors 可用于返回列表或字符串:

  1. List<String>strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");
  2. List<String> filtered = strings.stream().filter(string -> !string.isEmpty()).collect(Collectors.toList());
  3. System.out.println("筛选列表: " + filtered);
  4. String mergedString = strings.stream().filter(string -> !string.isEmpty()).collect(Collectors.joining(", "));
  5. System.out.println("合并字符串: " + mergedString);

统计

另外,一些产生统计结果的收集器也非常有用。它们主要用于int、double、long等基本类型上,它们可以用来产生类似如下的统计结果。

  1. List<Integer> numbers = Arrays.asList(3, 2, 2, 3, 7, 3, 5);
  2. IntSummaryStatistics stats = numbers.stream().mapToInt((x) -> x).summaryStatistics();
  3. System.out.println("列表中最大的数 : " + stats.getMax());
  4. System.out.println("列表中最小的数 : " + stats.getMin());
  5. System.out.println("所有数之和 : " + stats.getSum());
  6. System.out.println("平均数 : " + stats.getAverage());

Stream 完整实例

将以下代码放入 Java8Tester.java 文件中:

Java8Tester.java 文件

  1. import java.util.ArrayList;
  2. import java.util.Arrays;
  3. import java.util.IntSummaryStatistics;
  4. import java.util.List;
  5. import java.util.Random;
  6. import java.util.stream.Collectors;
  7. import java.util.Map;
  8. public class Java8Tester {
  9. public static void main(String args[]){
  10. System.out.println("使用 Java 7: ");
  11. // 计算空字符串
  12. List<String> strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");
  13. System.out.println("列表: " +strings);
  14. long count = getCountEmptyStringUsingJava7(strings);
  15. System.out.println("空字符数量为: " + count);
  16. count = getCountLength3UsingJava7(strings);
  17. System.out.println("字符串长度为 3 的数量为: " + count);
  18. // 删除空字符串
  19. List<String> filtered = deleteEmptyStringsUsingJava7(strings);
  20. System.out.println("筛选后的列表: " + filtered);
  21. // 删除空字符串,并使用逗号把它们合并起来
  22. String mergedString = getMergedStringUsingJava7(strings,", ");
  23. System.out.println("合并字符串: " + mergedString);
  24. List<Integer> numbers = Arrays.asList(3, 2, 2, 3, 7, 3, 5);
  25. // 获取列表元素平方数
  26. List<Integer> squaresList = getSquares(numbers);
  27. System.out.println("平方数列表: " + squaresList);
  28. List<Integer> integers = Arrays.asList(1,2,13,4,15,6,17,8,19);
  29. System.out.println("列表: " +integers);
  30. System.out.println("列表中最大的数 : " + getMax(integers));
  31. System.out.println("列表中最小的数 : " + getMin(integers));
  32. System.out.println("所有数之和 : " + getSum(integers));
  33. System.out.println("平均数 : " + getAverage(integers));
  34. System.out.println("随机数: ");
  35. // 输出10个随机数
  36. Random random = new Random();
  37. for(int i=0; i < 10; i++){
  38. System.out.println(random.nextInt());
  39. }
  40. System.out.println("使用 Java 8: ");
  41. System.out.println("列表: " +strings);
  42. count = strings.stream().filter(string->string.isEmpty()).count();
  43. System.out.println("空字符串数量为: " + count);
  44. count = strings.stream().filter(string -> string.length() == 3).count();
  45. System.out.println("字符串长度为 3 的数量为: " + count);
  46. filtered = strings.stream().filter(string ->!string.isEmpty()).collect(Collectors.toList());
  47. System.out.println("筛选后的列表: " + filtered);
  48. mergedString = strings.stream().filter(string ->!string.isEmpty()).collect(Collectors.joining(", "));
  49. System.out.println("合并字符串: " + mergedString);
  50. squaresList = numbers.stream().map( i ->i*i).distinct().collect(Collectors.toList());
  51. System.out.println("Squares List: " + squaresList);
  52. System.out.println("列表: " +integers);
  53. IntSummaryStatistics stats = integers.stream().mapToInt((x) ->x).summaryStatistics();
  54. System.out.println("列表中最大的数 : " + stats.getMax());
  55. System.out.println("列表中最小的数 : " + stats.getMin());
  56. System.out.println("所有数之和 : " + stats.getSum());
  57. System.out.println("平均数 : " + stats.getAverage());
  58. System.out.println("随机数: ");
  59. random.ints().limit(10).sorted().forEach(System.out::println);
  60. // 并行处理
  61. count = strings.parallelStream().filter(string -> string.isEmpty()).count();
  62. System.out.println("空字符串的数量为: " + count);
  63. }
  64. private static int getCountEmptyStringUsingJava7(List<String> strings){
  65. int count = 0;
  66. for(String string: strings){
  67. if(string.isEmpty()){
  68. count++;
  69. }
  70. }
  71. return count;
  72. }
  73. private static int getCountLength3UsingJava7(List<String> strings){
  74. int count = 0;
  75. for(String string: strings){
  76. if(string.length() == 3){
  77. count++;
  78. }
  79. }
  80. return count;
  81. }
  82. private static List<String> deleteEmptyStringsUsingJava7(List<String> strings){
  83. List<String> filteredList = new ArrayList<String>();
  84. for(String string: strings){
  85. if(!string.isEmpty()){
  86. filteredList.add(string);
  87. }
  88. }
  89. return filteredList;
  90. }
  91. private static String getMergedStringUsingJava7(List<String> strings, String separator){
  92. StringBuilder stringBuilder = new StringBuilder();
  93. for(String string: strings){
  94. if(!string.isEmpty()){
  95. stringBuilder.append(string);
  96. stringBuilder.append(separator);
  97. }
  98. }
  99. String mergedString = stringBuilder.toString();
  100. return mergedString.substring(0, mergedString.length()-2);
  101. }
  102. private static List<Integer> getSquares(List<Integer> numbers){
  103. List<Integer> squaresList = new ArrayList<Integer>();
  104. for(Integer number: numbers){
  105. Integer square = new Integer(number.intValue() * number.intValue());
  106. if(!squaresList.contains(square)){
  107. squaresList.add(square);
  108. }
  109. }
  110. return squaresList;
  111. }
  112. private static int getMax(List<Integer> numbers){
  113. int max = numbers.get(0);
  114. for(int i=1;i < numbers.size();i++){
  115. Integer number = numbers.get(i);
  116. if(number.intValue() > max){
  117. max = number.intValue();
  118. }
  119. }
  120. return max;
  121. }
  122. private static int getMin(List<Integer> numbers){
  123. int min = numbers.get(0);
  124. for(int i=1;i < numbers.size();i++){
  125. Integer number = numbers.get(i);
  126. if(number.intValue() < min){
  127. min = number.intValue();
  128. }
  129. }
  130. return min;
  131. }
  132. private static int getSum(List numbers){
  133. int sum = (int)(numbers.get(0));
  134. for(int i=1;i < numbers.size();i++){
  135. sum += (int)numbers.get(i);
  136. }
  137. return sum;
  138. }
  139. private static int getAverage(List<Integer> numbers){
  140. return getSum(numbers) / numbers.size();
  141. }
  142. }

执行以上脚本,输出结果为:

  1. $ javac Java8Tester.java
  2. $ java Java8Tester
  3. 使用 Java 7:
  4. 列表: [abc, , bc, efg, abcd, , jkl]
  5. 空字符数量为: 2
  6. 字符串长度为 3 的数量为: 3
  7. 筛选后的列表: [abc, bc, efg, abcd, jkl]
  8. 合并字符串: abc, bc, efg, abcd, jkl
  9. 平方数列表: [9, 4, 49, 25]
  10. 列表: [1, 2, 13, 4, 15, 6, 17, 8, 19]
  11. 列表中最大的数 : 19
  12. 列表中最小的数 : 1
  13. 所有数之和 : 85
  14. 平均数 : 9
  15. 随机数:
  16. -393170844
  17. -963842252
  18. 447036679
  19. -1043163142
  20. -881079698
  21. 221586850
  22. -1101570113
  23. 576190039
  24. -1045184578
  25. 1647841045
  26. 使用 Java 8:
  27. 列表: [abc, , bc, efg, abcd, , jkl]
  28. 空字符串数量为: 2
  29. 字符串长度为 3 的数量为: 3
  30. 筛选后的列表: [abc, bc, efg, abcd, jkl]
  31. 合并字符串: abc, bc, efg, abcd, jkl
  32. Squares List: [9, 4, 49, 25]
  33. 列表: [1, 2, 13, 4, 15, 6, 17, 8, 19]
  34. 列表中最大的数 : 19
  35. 列表中最小的数 : 1
  36. 所有数之和 : 85
  37. 平均数 : 9.444444444444445
  38. 随机数:
  39. -1743813696
  40. -1301974944
  41. -1299484995
  42. -779981186
  43. 136544902
  44. 555792023
  45. 1243315896
  46. 1264920849
  47. 1472077135
  48. 1706423674
  49. 空字符串的数量为: 2