zl程序教程

您现在的位置是:首页 >  后端

当前栏目

Java 8 Stream实用篇,玩转集合的筛选、归约、分组、聚合

JAVA集合 实用 玩转 分组 聚合 stream 筛选
2023-09-14 09:14:51 时间

Java 8 Stream实用篇,玩转集合的筛选、归约、分组、聚合

image

什么是Stream?

Stream将要处理的元素集合看作一种流,在流的过程中,借助Stream API对流中的元素进行操作,比如:筛选、排序、聚合等。

Stream可以由数组或集合创建,对流的操作分为两种:

  1. 中间操作,每次返回一个新的流,可以有多个。
  2. 终端操作,每个流只能进行一次终端操作,终端操作结束后流无法再次使用。终端操作会产生一个新的集合或值。

另外,Stream有几个特性:

  1. stream不存储数据,而是按照特定的规则对数据进行计算,一般会输出结果。
  2. stream不会改变数据源,通常情况下会产生一个新的集合或一个值。
  3. stream具有延迟执行特性,只有调用终端操作时,中间操作才会执行。

下面开始我们的Stream

数据封装类:

package com.xie.stream;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;

import java.util.ArrayList;
import java.util.List;

/**
 * @Description
 * @Date 2022-04-22 10:00
 * @Author xie
 */
@Data
@NoArgsConstructor
@AllArgsConstructor
public class Person {

    private String name; // 姓名
    private int salary; // 薪资
    private int age; // 年龄
    private String sex; //性别
    private String area; // 地区

    public static List<Person> generatorPersons() {
        List<Person> personList = new ArrayList<Person>();
        personList.add(new Person("Tom", 8900, 20, "male", "New York"));
        personList.add(new Person("Jack", 7000, 30, "male", "Washington"));
        personList.add(new Person("Lily", 7800, 25, "female", "Washington"));
        personList.add(new Person("Anni", 8200, 40, "female", "New York"));
        personList.add(new Person("Owen", 9500, 18, "male", "New York"));
        personList.add(new Person("Alisa", 7900, 68, "female", "New York"));
        return personList;
    }
}


1. 通过 java.util.Collection.stream() 方法用集合创建流

/**
 * 1. 通过 java.util.Collection.stream() 方法用集合创建流
 */
@Test
public void test1() {
    List<String> stringList = Arrays.asList("a", "b", "c");

    // 创建一个顺序流
    Stream<String> stringStream = stringList.stream();

    // 创建一个并行流
    Stream<String> parallelStream = stringList.parallelStream();
}

2. 使用java.util.Arrays.stream(T[] array)方法用数组创建流

/**
 * 2. 使用java.util.Arrays.stream(T[] array)方法用数组创建流
 */
@Test
public void test2() {
    int[] intArray = {1, 3, 5, 6, 8};
    IntStream intStream = Arrays.stream(intArray);
}

3. 使用Stream的静态方法:of()、iterate()、generate()

/**
 * 3. 使用Stream的静态方法:of()、iterate()、generate()
 */
@Test
public void test3() {
    int[] intArray = {1, 3, 5, 6, 8};
    Stream<int[]> stream = Stream.of(intArray);

    // ------of 生成流
    Stream<Integer> integerStream = Stream.of(1, 3, 5, 6, 8);

    //-----------------------------------------------------------------------------------

    // ------iterate 循环生成流
    Stream<Integer> iterateStream = Stream.iterate(0, integer -> integer + 3).limit(4);
    iterateStream.forEach(System.out::println);

    //-----------------------------------------------------------------------------------

    // ------generate 生产对象生成流
    Stream<Double> generateStream = Stream.generate(Math::random).limit(3);
    generateStream.forEach(System.out::println);

}

输出结果:
0
3
6
9
0.3795058375911119
0.5861217374662204
0.9820936418960214

stream和parallelStream的简单区分:
stream是顺序流,由主线程按顺序对流执行操作,
而parallelStream是并行流,内部以多线程并行执行的方式对流进行操作,但前提是流中的数据处理没有顺序要求。例如筛选集合中的奇数,两者的处理不同之处:
image
如果流中的数据量足够大,并行流可以加快处速度。除了直接创建并行流,还可以通过parallel()把顺序流转换成并行流:

Optional<Integer> findFirst = list.stream().parallel().filter(x->x>6).findFirst();

4. 遍历/匹配(foreach/find/match)

Stream也是支持类似集合的遍历和匹配元素的,只是Stream中的元素是以Optional类型存在的。Stream的遍历、匹配非常简单。
image

/**
 * 4. 遍历/匹配(foreach/find/match)
 */
@Test
public void test4() {

    List<Integer> list = Arrays.asList(7, 6, 9, 3, 8, 2, 1);

    // 遍历输出符合条件的元素
    list.stream().filter(x -> x > 6).forEach(System.out::println);

    //-----------------------------------------------------------------------------------

    // 匹配第一个
    Optional<Integer> optionalFirst = list.stream().filter(x -> x > 6).findFirst();
    optionalFirst.ifPresent(x -> System.out.println("查询匹配到的第一个值:" + x));

    //-----------------------------------------------------------------------------------

    // 匹配任意(适用于并行流)
    Optional<Integer> optionalAny = list.parallelStream().filter(x -> x > 6).findAny();
    optionalAny.ifPresent(x -> System.out.println("查询匹配到的任意一个值:" + x));

    //-----------------------------------------------------------------------------------

    // 是否包含符合特定条件的元素
    boolean anyMatch = list.parallelStream().anyMatch(x -> x > 6);
    System.out.println("是否存在大于6的数值:" + anyMatch);
}

5. 筛选(filter)

筛选,是按照一定的规则校验流中的元素,将符合条件的元素提取到新的流中的操作。
image

/**
 * 5. 筛选(filter)
 */
@Test
public void test5() {
    List<Integer> list = Arrays.asList(6, 7, 3, 8, 1, 2, 9);

    // 筛选出Integer集合中大于7的元素,并打印出来
    list.stream().filter(x -> x > 7).forEach(System.out::println);

    //-----------------------------------------------------------------------------------

    // 筛选员工中工资高于8000的人,并形成新的集合。 形成新集合依赖collect(收集)
    List<Person> personList = Person.generatorPersons();
    List<String> filterName =
    personList.stream()
    .filter(person -> person.getSalary() > 8000)
    .map(person -> person.getName())
    .collect(Collectors.toList());
    System.out.println(filterName);
}

6. 聚合(max/min/count)

max、min、count这些字眼你一定不陌生,没错,在mysql中我们常用它们进行数据统计。
Java stream中也引入了这些概念和用法,极大地方便了我们对集合、数组的数据统计工作。
image

/**
 * 6. 聚合(max/min/count)
 */
@Test
public void test6() {

    // 获取String集合中最长的元素。
    List<String> stringList = Arrays.asList("adnm", "admmt", "pot", "xbangd", "weoujgsd");
    Optional<String> optionalStrMax = stringList.stream().max(Comparator.comparing(String::length));
    optionalStrMax.ifPresent(s -> System.out.println("最长的字符串:" + s));

    //-----------------------------------------------------------------------------------

    // 获取Integer集合中的最大值。
    List<Integer> integerList = Arrays.asList(7, 6, 9, 4, 11, 6);
    // 自然排序
    Optional<Integer> optionalIntMax = integerList.stream().max(Integer::compareTo);
    optionalIntMax.ifPresent(x -> System.out.println("集合最大值是:" + x));
    // 自定义排序
    Optional<Integer> optionalIntMax1 = integerList.stream().max(Comparator.naturalOrder());
    optionalIntMax1.ifPresent(x -> System.out.println("集合最大值是1:" + x));

    //-----------------------------------------------------------------------------------

    // 获取员工工资最高的人。
    List<Person> personList = Person.generatorPersons();
    Optional<Person> optionalSalaryMax = personList.stream().max(Comparator.comparingInt(Person::getSalary));
    optionalSalaryMax.ifPresent(p -> System.out.println("工资最高的人:" + p.getName() + " 工资:" + p.getSalary()));

    //-----------------------------------------------------------------------------------

    // 计算Integer集合中大于6的元素的个数。
    long count = integerList.stream().filter(x -> x > 6).count();
    System.out.println("list中大于6的元素个数:" + count);

}

7. 映射(map/flatMap)

映射,可以将一个流的元素按照一定的映射规则映射到另一个流中。分为map和flatMap:

  • map:接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素。
  • flatMap:接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流。
    image

image

/**
 * 7. 映射(map/flatMap)
 */
@Test
public void test7() {

    // 英文字符串数组的元素全部改为大写。
    String[] strArr = { "abcd", "bcdd", "defde", "fTr" };
    List<String> stringList = Arrays.stream(strArr).map(s -> s.toUpperCase()).collect(Collectors.toList());
    System.out.println("每个元素大写:" + stringList);

    //-----------------------------------------------------------------------------------

    // 整数数组每个元素+3。
    List<Integer> intList = Arrays.asList(1, 3, 5, 7, 9, 11);
    List<Integer> integerList = intList.stream().map(x -> x + 3).collect(Collectors.toList());
    System.out.println("每个元素+3:" + integerList);


    //-----------------------------------------------------------------------------------

    List<Person> personList = Person.generatorPersons();
    // 将员工的薪资全部增加1000。
    // 不改变原来员工集合的方式
    List<Person> personListNew =
            personList.stream()
                        .map(person -> {
                                Person personNew = new Person(person.getName(), 0, 0, null, null);
                                personNew.setSalary(person.getSalary() + 1000);
                                return personNew;
                            })
                        .collect(Collectors.toList());
    System.out.println("一次改动前:" + personList.get(0).getName() + "-->" + personList.get(0).getSalary());
    System.out.println("一次改动后:" + personListNew.get(0).getName() + "-->" + personListNew.get(0).getSalary());

    // 改变原来员工集合的方式(这样会改变原来集合的值)
    List<Person> personListNew2  =
            personList.stream()
                        .map(person -> {
                                person.setSalary(person.getSalary() + 1000);
                                return person;
                            })
                        .collect(Collectors.toList());

    System.out.println("二次改动前:" + personList.get(0).getName() + "-->" + personList.get(0).getSalary());
    System.out.println("二次改动后:" + personListNew2.get(0).getName() + "-->" + personListNew.get(0).getSalary());

    //-----------------------------------------------------------------------------------

    // 将两个字符数组合并成一个新的字符数组。
    List<String> list = Arrays.asList("m,k,l,a", "1,3,5,7");
    List<String> listNew = list.stream().flatMap(s -> Arrays.stream(s.split(","))).collect(Collectors.toList());
    System.out.println("处理前的集合:" + list);
    System.out.println("处理后的集合:" + listNew);

    }

8. 归约(reduce)

归约,也称缩减,顾名思义,是把一个流缩减成一个值,能实现对集合求和、求乘积和求最值操作。
image

/**
 * 8. 归约(reduce)
 */
@Test
public void test8() {
    // 求Integer集合的元素之和、乘积和最大值。
    List<Integer> list = Arrays.asList(1, 3, 2, 8, 11, 4);
    // 求和方式1
    Optional<Integer> optionalSum1 = list.stream().reduce((x, y) -> x + y);
    // 求和方式2
    Optional<Integer> optionalSum2 = list.stream().reduce(Integer::sum);
    // 求和方式3
    Integer sum3 = list.stream().reduce(0, Integer::sum);
    System.out.println("list求和:" + optionalSum1.get() + "," + optionalSum2.get() + "," + sum3);

    //-----------------------------------------------------------------------------------

    // 求乘积
    Optional<Integer> optionalProduct = list.stream().reduce((x, y) -> x * y);
    System.out.println("list求积:" + optionalProduct.get());

    //-----------------------------------------------------------------------------------

    // 求最大值方式1
    Optional<Integer> optionalMax1 = list.stream().reduce((x, y) -> x > y ? x : y);
    // 求最大值方式2
    Integer max2 = list.stream().reduce(0, Integer::max);
    System.out.println("list最大值:" + optionalMax1.get() + "," + max2);

    //-----------------------------------------------------------------------------------

    // 求所有员工的工资之和和最高工资。
    List<Person> personList = Person.generatorPersons();
    // 求工资之和方式1:
    Optional<Integer> optionalSum = personList.stream().map(Person::getSalary).reduce(Integer::sum);
    // 求工资之和方式2:
    Integer sumSalary2 = personList.stream().reduce(0, (sum, p) -> sum += p.getSalary(), (sum1, sum2) -> sum1 + sum2);
    // 求工资之和方式3:
    Integer sumSalary3 = personList.stream().reduce(0, (sum, p) -> sum += p.getSalary(), Integer::sum);

    //-----------------------------------------------------------------------------------

    // 求最高工资方式1:
    Integer maxSalary = personList.stream().reduce(0, (max, p) -> max > p.getSalary() ? max : p.getSalary(), Integer::max);
    // 求最高工资方式2:
    Integer maxSalary2 = personList.stream().reduce(0, (max, p) -> max > p.getSalary() ? max : p.getSalary(), (max, max1) -> max > max1 ? max1 : max1);

    System.out.println("工资之和:" + optionalSum.get() + "," + sumSalary2 + "," + sumSalary3);
    System.out.println("最高工资:" + maxSalary + "," + maxSalary2);
}

9. 收集(collect)

collect,收集,可以说是内容最繁多、功能最丰富的部分了。从字面上去理解,就是把一个流收集起来,最终可以是收集成一个值也可以收集成一个新的集合。

collect主要依赖java.util.stream.Collectors类内置的静态方法。

/**
 * 9. 收集(collect)
 */
@Test
public void test9() {
    List<Integer> list = Arrays.asList(1, 3, 2, 8, 11, 4);
    List<Integer> integerList = list.stream().map(x -> x + 3).collect(Collectors.toList());
    System.out.println(integerList);
}

10. 归集(toList/toSet/toMap)

因为流不存储数据,那么在流中的数据完成处理后,需要将流中的数据重新归集到新的集合里。toList、toSet和toMap比较常用,另外还有toCollection、toConcurrentMap等复杂一些的用法。

/**
 * 10. 归集(toList/toSet/toMap)
 */
@Test
public void test10() {
    List<Integer> list = Arrays.asList(1, 6, 3, 4, 6, 7, 9, 6, 20);
    List<Integer> toList = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toList());
    Set<Integer> toSet = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toSet());

    System.out.println("toList:" + toList);
    System.out.println("toSet:" + toSet);

    //-----------------------------------------------------------------------------------

    List<Person> personList = Person.generatorPersons();
    Map<String, Integer> map = personList.stream().collect(Collectors.toMap(Person::getName, Person::getSalary));
    System.out.println(map);
    map.entrySet().stream().forEach(entry -> System.out.println(entry.getKey() + ":" + entry.getValue()));
}

11. 统计(count/averaging)

Collectors提供了一系列用于数据统计的静态方法:

  • 计数:count
  • 平均值:averagingInt、averagingLong、averagingDouble
  • 最值:maxBy、minBy
  • 求和:summingInt、summingLong、summingDouble
  • 统计以上所有:summarizingInt、summarizingLong、summarizingDouble
/**
 * 11. 统计(count/averaging)
 */
@Test
public void test11() {
    // 统计员工人数、平均工资、工资总额、最高工资。
    List<Person> personList = Person.generatorPersons();
    // 求总数
    int size = personList.size();
    long size1 = personList.stream().count();
    long size2 = personList.stream().collect(Collectors.counting());
    System.out.println("总数:" + size + " ,"  + size1 + " ," + size2);

    //-----------------------------------------------------------------------------------

    // 求平均工资
    Double averag = personList.stream().map(Person::getSalary).collect(Collectors.averagingDouble(d -> d));
    Double averag1 = personList.stream().collect(Collectors.averagingDouble(Person::getSalary));
    System.out.println("平均工资:" + averag + " ,"  + averag1);

    //-----------------------------------------------------------------------------------

    // 求最高工资
    Optional<Person> max = personList.stream().max(Comparator.comparingInt(Person::getSalary));
    Optional<Integer> max1 = personList.stream().map(Person::getSalary).collect(Collectors.maxBy(Integer::compare));
    System.out.println("最高工资:" + max.get().getSalary() + " ,"  + max1.get());

    //-----------------------------------------------------------------------------------

    // 求工资之和
    Optional<Integer> sum = personList.stream().map(Person::getSalary).reduce(Integer::sum);
    Integer sum1 = personList.stream().collect(Collectors.summingInt(Person::getSalary));
    System.out.println("工资之和:" + sum.get() + " ,"  + sum1);

    //-----------------------------------------------------------------------------------

    // 一次性统计所有信息
    DoubleSummaryStatistics summaryStatistics = personList.stream().collect(Collectors.summarizingDouble(Person::getSalary));
    System.out.println(summaryStatistics);
}

12. 分组(partitioningBy/groupingBy)

  • 分区:将stream按条件分为两个Map,比如员工按薪资是否高于8000分为两部分。
  • 分组:将集合分为多个Map,比如员工按性别分组。有单级分组和多级分组。
    image
/**
 * 12. 分组(partitioningBy/groupingBy)
 */
@Test
public void test12() {
    // 将员工按薪资是否高于8000分为两部分;将员工按性别和地区分组
    List<Person> personList = Person.generatorPersons();

    // 将员工按薪资是否高于8000分组
    Map<Boolean, List<Person>> part = personList.stream().collect(Collectors.partitioningBy(x -> x.getSalary() > 8000));
    System.out.println("员工按薪资是否高于8000分组:" + part);

    //-----------------------------------------------------------------------------------

    // 将员工按性别分组
    Map<String, List<Person>> group = personList.stream().collect(Collectors.groupingBy(Person::getSex));
    System.out.println("员工按性别分组:" + group);

    //-----------------------------------------------------------------------------------

    // 将员工先按性别分组,再按地区分组
    Map<String, Map<String, List<Person>>> group1 =
    personList.stream().collect(Collectors.groupingBy(Person::getSex, Collectors.groupingBy(Person::getArea)));
    System.out.println("员工先按性别分组,再按地区分组:" + group1);
}

13. 接合(joining)

joining可以将stream中的元素用特定的连接符(没有的话,则直接连接)连接成一个字符串。

/**
 * 13. 接合(joining)
 */
@Test
public void test13() {
    List<Person> personList = Person.generatorPersons();
    String join = personList.stream().map(Person::getName).collect(Collectors.joining(","));
    System.out.println("所有员工的姓名:" + join);

    //-----------------------------------------------------------------------------------

    List<String> list = Arrays.asList("A", "B", "C");
    String string = list.stream().collect(Collectors.joining("-"));
    System.out.println("拼接后的字符串:" + string);

}

14. 归约(reducing)

Collectors类提供的reducing方法,相比于stream本身的reduce方法,增加了对自定义归约的支持。

/**
 * 14. 归约(reducing)
 */
@Test
public void test14() {
    List<Person> personList = Person.generatorPersons();
    // 每个员工减去起征点后的薪资之和(这个例子并不严谨,但一时没想到好的例子)
    Integer reducing = personList.stream().collect(Collectors.reducing(0, Person::getSalary, (i, j) -> (i + j - 5000)));
    System.out.println("员工扣税薪资总和:" + reducing);

    //-----------------------------------------------------------------------------------

    // stream的reduce
    Integer reducing1 = personList.stream().map(Person::getSalary).reduce(0, (x, y) -> x + y - 5000);
    System.out.println("员工扣税薪资总和:" + reducing1);
}

15. 排序(sorted)

sorted,中间操作。有两种排序:

  • sorted():自然排序,流中元素需实现Comparable接口
  • sorted(Comparator com):Comparator排序器自定义排序
/**
 * 15. 排序(sorted)
 */
@Test
public void test15() {
    // 将员工按工资由高到低(工资一样则按年龄由大到小)排序
    List<Person> personList = Person.generatorPersons();

    //-----------------------------------------------------------------------------------

    // 按工资升序排序(自然排序)
    List<Person> personList1 = personList.stream().sorted(Comparator.comparing(Person::getSalary)).collect(Collectors.toList());
    System.out.println("按工资升序排序:" + personList1);

    //-----------------------------------------------------------------------------------

    // 按工资倒序排序
    List<Person> personList2 = personList.stream().sorted(Comparator.comparing(Person::getSalary).reversed()).collect(Collectors.toList());
    System.out.println("按工资降序排序:" + personList2);

    //-----------------------------------------------------------------------------------

    // 先按工资再按年龄升序排序
    List<String> list = personList.stream()
                                    .sorted(Comparator.comparing(Person::getSalary).thenComparing(Person::getAge))
                                    .map(Person::getName)
                                    .collect(Collectors.toList());
    System.out.println("先按工资再按年龄升序排序:" + list);

    //-----------------------------------------------------------------------------------

    // 先按工资再按年龄自定义排序(降序)
    List<String> list1 =
                personList.stream()
                        .sorted((o1, o2) -> {
                                    if (o1.getSalary() == o2.getSalary()) {
                                        return o2.getAge() - o1.getAge();
                                    } else {
                                        return o2.getSalary() - o1.getSalary();
                                    }
                                })
                        .map(Person::getName)
                        .collect(Collectors.toList());
    System.out.println("先按工资再按年龄自定义降序排序:" + list1);
}

16. 提取/组合

流也可以进行合并、去重、限制、跳过等操作。
image
image
image

/**
 * 16. 提取/组合
 */
@Test
public void test16() {

    String[] arr1 = { "a", "b", "c", "d" };
    String[] arr2 = { "d", "e", "f", "g" };

    Stream<String> stream1 = Stream.of(arr1);
    Stream<String> stream2 = Stream.of(arr2);

    //-----------------------------------------------------------------------------------

    // concat:合并两个流 distinct:去重
    List<String> list = Stream.concat(stream1, stream2).distinct().collect(Collectors.toList());
    System.out.println("流合并:" + list);

    //-----------------------------------------------------------------------------------

    // limit:限制从流中获得前n个数据
    List<Integer> list1 = Stream.iterate(1, x -> x + 2).limit(10).collect(Collectors.toList());
    System.out.println("limit:" + list1);

    //-----------------------------------------------------------------------------------

    // skip:跳过前n个数据
    List<Integer> list2 = Stream.iterate(1, x -> x + 2).skip(1).limit(5).collect(Collectors.toList());
    System.out.println("skip:" + list2);
}