图片 15

Java 8中的Stream API使用指南

Java 8引入了全新的Stream
API。这里的Stream和I/O流不同,它更像具有Iterable的集合类,但行为和集合类又有所不同。

Java 8
API添加了一个新的抽象称为流Stream,可以让你以一种声明的方式处理数据。

Stream
API引入的目的在于弥补Java函数式编程的缺陷。对于很多支持函数式编程的语言,map()、reduce()基本上都内置到语言的标准库中了,不过,Java
8的Stream
API总体来讲仍然是非常完善和强大,足以用很少的代码完成许多复杂的功能。

Stream 使用一种类似用 SQL 语句从数据库查询数据的直观方式来提供一种对
Java 集合运算和表达的高阶抽象。

创建一个Stream有很多方法,最简单的方法是把一个Collection变成Stream。我们来看最基本的几个操作:

Stream
API可以极大提供Java程序员的生产力,让程序员写出高效率、干净、简洁的代码。

public static void main(String[] args) {
    List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
    Stream<Integer> stream = numbers.stream();
    stream.filter((x) -> {
        return x % 2 == 0;
    }).map((x) -> {
        return x * x;
    }).forEach(System.out::println);
}

这种风格将要处理的元素集合看作一种流, 流在管道中传输,
并且可以在管道的节点上进行处理, 比如筛选, 排序,聚合等。

集合类新增的stream()方法用于把一个集合变成Stream,然后,通过filter()、map()等实现Stream的变换。Stream还有一个forEach()来完成每个元素的迭代。

图片 1

为什么不在集合类实现这些操作,而是定义了全新的Stream
API?Oracle官方给出了几个重要原因:

`

一是集合类持有的所有元素都是存储在内存中的,非常巨大的集合类会占用大量的内存,而Stream的元素却是在访问的时候才被计算出来,这种“延迟计算”的特性有点类似Clojure的lazy-seq,占用内存很少。

元素流在管道中经过中间操作(intermediate
operation)的处理,最后由最终操作(terminal
operation)得到前面处理的结果。

二是集合类的迭代逻辑是调用者负责,通常是for循环,而Stream的迭代是隐含在对Stream的各种操作中,例如map()。

图片 2

要理解“延迟计算”,不妨创建一个无穷大小的Stream。

以上的流程转换为 Java 代码为:

如果要表示自然数集合,显然用集合类是不可能实现的,因为自然数有无穷多个。但是Stream可以做到。

图片 3

自然数集合的规则非常简单,每个元素都是前一个元素的值+1,因此,自然数发生器用代码实现如下:

图片 4

class NaturalSupplier implements Supplier<Long> {

    long value = 0;

    public Long get() {
        this.value = this.value + 1;
        return this.value;
    }
}

什么是 Stream?

反复调用get(),将得到一个无穷数列,利用这个Supplier,可以创建一个无穷的Stream:

Stream(流)是一个来自数据源的元素队列并支持聚合操作

public static void main(String[] args) {
    Stream<Long> natural = Stream.generate(new NaturalSupplier());
    natural.map((x) -> {
        return x * x;
    }).limit(10).forEach(System.out::println);
}

元素是特定类型的对象,形成一个队列。
Java中的Stream并不会存储元素,而是按需计算。

对这个Stream做任何map()、filter()等操作都是完全可以的,这说明Stream
API对Stream进行转换并生成一个新的Stream并非实时计算,而是做了延迟计算。

数据源 流的来源。 可以是集合,数组,I/O channel, 产生器generator
等。

当然,对这个无穷的Stream不能直接调用forEach(),这样会无限打印下去。但是我们可以利用limit()变换,把这个无穷Stream变换为有限的Stream。

聚合操作 类似SQL语句一样的操作, 比如filter, map, reduce, find,
match, sorted等。

利用Stream
API,可以设计更加简单的数据接口。例如,生成斐波那契数列,完全可以用一个无穷流表示(受限Java的long型大小,可以改为BigInteger):

和以前的Collection操作不同, Stream操作还有两个基础的特征:

class FibonacciSupplier implements Supplier<Long> {

    long a = 0;
    long b = 1;

    @Override
    public Long get() {
        long x = a + b;
        a = b;
        b = x;
        return a;
    }
}

public class FibonacciStream {

    public static void main(String[] args) {
        Stream<Long> fibonacci = Stream.generate(new FibonacciSupplier());
        fibonacci.limit(10).forEach(System.out::println);
    }
}

Pipelining: 中间操作都会返回流对象本身。
这样多个操作可以串联成一个管道, 如同流式风格(fluent style)。
这样做可以对操作进行优化, 比如延迟执行(laziness)和短路(
short-circuiting)。

如果想取得数列的前10项,用limit(10),如果想取得数列的第20~30项,用:

内部迭代: 以前对集合遍历都是通过Iterator或者For-Each的方式,
显式的在集合外部进行迭代, 这叫做外部迭代。 Stream提供了内部迭代的方式,
通过访问者模式(Visitor)实现。

List<Long> list = fibonacci.skip(20).limit(10).collect(Collectors.toList());

生成流

最后通过collect()方法把Stream变为List。该List存储的所有元素就已经是计算出的确定的元素了。

在 Java 8 中, 集合接口有两个方法来生成流:

用Stream表示Fibonacci数列,其接口比任何其他接口定义都要来得简单灵活并且高效。

stream() − 为集合创建串行流。

计算π可以利用π的展开式:

parallelStream() − 为集合创建并行流。

π/4 = 1 - 1/3 + 1/5 - 1/7 + 1/9 - ...

图片 5

把π表示为一个无穷Stream如下:

forEach

class PiSupplier implements Supplier<Double> {

    double sum = 0.0;
    double current = 1.0;
    boolean sign = true;

    @Override
    public Double get() {
        sum += (sign ? 4 : -4) / this.current;
        this.current = this.current + 2.0;
        this.sign = ! this.sign;
        return sum;
    }
}

Stream<Double> piStream = Stream.generate(new PiSupplier());
piStream.skip(100).limit(10)
        .forEach(System.out::println);

Stream 提供了新的方法 ‘forEach’ 来迭代流中的每个数据。以下代码片段使用
forEach 输出了10个随机数:

这个级数从100项开始可以把π的值精确到3.13~3.15之间:

图片 6

3.1514934010709914
3.1317889675734545
3.1513011626954057
3.131977491197821
3.1511162471786824
3.1321589012071183
3.150938243930123
3.132333592767332
3.1507667724908344
3.1325019323081857

map

利用欧拉变换对级数进行加速,可以利用下面的公式:

map 方法用于映射每个元素到对应的结果,以下代码片段使用 map
输出了元素对应的平方数:

图片 7

图片 8

用代码实现就是把一个流变成另一个流:

filter

class EulerTransform implements Function<Double, Double> {

    double n1 = 0.0;
    double n2 = 0.0;
    double n3 = 0.0;

    @Override
    public Double apply(Double t) {
        n1 = n2;
        n2 = n3;
        n3 = t;
        if (n1 == 0.0) {
            return 0.0;
        }
        return calc();
    }

    double calc() {
        double d = n3 - n2;
        return n3 - d * d / (n1 - 2 * n2 + n3);
    }
}

Stream<Double> piStream2 = Stream.generate(new PiSupplier());
piStream2.map(new EulerTransform())
         .limit(10)
         .forEach(System.out::println);

filter 方法用于通过设置的条件过滤出元素。以下代码片段使用 filter
方法过滤出空字符串:

可以在10项之内把π的值计算到3.141~3.142之间:

图片 9

0.0
0.0
3.166666666666667
3.1333333333333337
3.1452380952380956
3.13968253968254
3.1427128427128435
3.1408813408813416
3.142071817071818
3.1412548236077655

limit

还可以多次应用这个加速器:

limit 方法用于获取指定数量的流。 以下代码片段使用 limit 方法打印出 10
条数据:

Stream<Double> piStream3 = Stream.generate(new PiSupplier());
piStream3.map(new EulerTransform())
         .map(new EulerTransform())
         .map(new EulerTransform())
         .map(new EulerTransform())
         .map(new EulerTransform())
         .limit(20)
         .forEach(System.out::println);

图片 10

20项之内可以计算出极其精确的值:

sorted

...
3.14159265359053
3.1415926535894667
3.141592653589949
3.141592653589719

sorted 方法用于对流进行排序。以下代码片段使用 sorted 方法对输出的 10
个随机数进行排序:

可见用Stream
API可以写出多么简洁的代码,用其他的模型也可以写出来,但是代码会非常复杂。

图片 11

作者简介

廖雪峰,十年软件开发经验,业余产品经理,精通Java/Python/Ruby/Visual
Basic/Objective C/Lisp等编程语言,对开源框架有深入研究,著有《Spring
2.0核心技术与最佳实践》一书,多个业余开源项目托管在GitHub。

并行(parallel)程序

parallelStream 是流并行处理程序的代替方法。以下实例我们使用
parallelStream 来输出空字符串的数量:

图片 12

我们可以很容易的在顺序运行和并行直接切换。

Collectors

Collectors
类实现了很多归约操作,例如将流转换成集合和聚合元素。Collectors
可用于返回列表或字符串:

图片 13

统计

另外,一些产生统计结果的收集器也非常有用。它们主要用于int、double、long等基本类型上,它们可以用来产生类似如下的统计结果。

图片 14

图片 15

总之,Stream 的特性可以归纳为:

不是数据结构

它没有内部存储,它只是用操作管道从 source(数据结构、数组、generator
function、IO channel)抓取数据。

它也绝不修改自己所封装的底层数据结构的数据。例如 Stream 的 filter
操作会产生一个不包含被过滤元素的新 Stream,而不是从 source
删除那些元素。

所有 Stream 的操作必须以 lambda 表达式为参数

不支持索引访问

你可以请求第一个元素,但无法请求第二个,第三个,或最后一个。不过请参阅下一项。

很容易生成数组或者 List

惰性化

很多 Stream 操作是向后延迟的,一直到它弄清楚了最后需要多少数据才会开始。

Intermediate 操作永远是惰性化的。

并行能力

当一个 Stream
是并行化的,就不需要再写多线程代码,所有对它的操作会自动并行进行的。

可以是无限的

集合有固定大小,Stream 则不必。limit(n) 和 findFirst() 这类的
short-circuiting 操作可以对无限的 Stream 进行运算并很快完成。

Java程序员学习交流群607225654,既有技术大佬,又有老司机开车,各位对Java感兴趣的可以来交流学习一下,快乐与技术一起进步。

本文完,欢迎关注!

发表评论

电子邮件地址不会被公开。 必填项已用*标注