就在前几天,java21正式版发布了,作为继java17之后的又一个长期支持版本 (LTS),为我们带来了很多新的特性,其中我最感兴趣的就是虚拟线程(virtual thread),相信大家对虚拟线程也很好奇。趁着空闲时间安装了jdk21来体验一把,顺便把我查到的关于java21虚拟线程相关的资料也分享下。

虚拟线程的使用

  首先来看下虚拟线程怎么使用,jdk21在Thread类中,专门提供了虚拟线程和虚拟线程工厂的创建入口,我们挨个看下。首先就是虚拟线程的创建和启动,使用lambda也就几行代码:

        Thread.ofVirtual().start(() -> {
            System.out.println("Hello, virtual thread!");
        });
        // 也可以指定虚拟线程的名字
        Thread.ofVirtual().name("virtual thread").start(() -> {
            System.out.println("Hello, virtual thread!");
        });

  Thread也提供了虚拟线程工厂,有了虚拟线程工程,我们就可以在ExecutorService中使用虚拟线程。当然Executors已经提供好了封装,我们直接调用即可:

        try (var executor = Executors.newVirtualThreadPerTaskExecutor()) {
            IntStream.range(1, 10_000).forEach(i -> {
                executor.submit(() -> {
                    Thread.sleep(Duration.ofSeconds(0));
                    return i;
                });
            });
        }

  可以看得出来,虚拟线程几乎没有啥使用门槛,那他到底和普通线程有啥区别?我在查阅了一些资料后,我的理解如下:(可能理解浅薄或者有些错误,请指正)

什么是虚拟线程

  虚拟线程是一种轻量化的线程封装,由jvm直接调度和管理。反之普通的线程其实是调用的操作系统的能力,对应的是操作系统级的线程。相对虚拟线程来说操作系统级的线程持有成本很高,而且受操作系统调度和管理的。实际在普通多线程情况下,如果出现IO阻塞,这个线程就必须得跟着阻塞,这个线程对应的操作系统就被阻塞,而他却持有大量的内存。另外,要处理大量的IO就得新建更多线程,而大量的线程会在操作系统切换时因上下文切换导致大量的CPU被浪费。

  如果我们能在某个普通线程在等待IO返回的情况下,让其运行其他的任务,是不是就可以用少量的线程处理大量的IO?思路很美好,那具体怎么实施呢!在计算机科学领域,解决问题最简单的方式就是加一层,比如操作系统中,代码访问内存中间就有一层虚拟内存,如果代码到线程中间加一层虚拟线程,每个虚拟线程只有在真正需要CPU运行的时候,才会被映射到真正的线程上去运行,而IO阻塞时会换其他非阻塞的虚拟线程上来,这样就不需要创建大量的线程了,而虚拟线程只需要持有少量的上下文信息即可。

  这种实现方式带来了很多优势,比如:

  • 轻量级:虚拟线程占用内存更少,创建和切换代价更低。
  • 支持异步:虚拟线程支持异步非阻塞编程模型。
  • 扩展性好:可以在少量线程上运行大量虚拟线程。
  • 无上下文切换:协程在同一线程中运行,没有线程上下文切换。

虚拟线程和协程

  Java21实际上在实现虚拟线程时,兼容了普通线程(不确定是否完全兼容),像ThreadLocal、Semaphore之类的工具完全可以在虚拟线程中使用,基本上大部分使用线程的地方应该都可以替换成虚拟线程,也就是说以后可以肆无忌惮创建虚拟线程而不用担心过多创建线程了。以上的内容看起来很像是go或者python中的协程,但在medium上看到一篇文章,解释了Java中的虚拟线程和协程之间的异同,摘抄下来方便大家更深入理解,如果有兴趣也可以去看原文

相同之处:

  • 虚拟线程和协程都很轻量级,它们的创建和销毁开销小于传统的操作系统线程。
  • 虚拟线程和协程都可以通过暂停和恢复在线程之间切换,从而避免线程上下文切换的开销。
  • 虚拟线程和协程都可以以异步和非阻塞的方式处理任务,提高应用程序性能和响应速度。

不同之处:

  • 虚拟线程在JVM级别实现,而协程在语言级别实现。因此,虚拟线程的实现可以用于任何支持JVM的语言,而协程的实现需要特定编程语言的支持。
  • 虚拟线程是协程的基于线程的实现,因此可以使用线程相关的API,如ThreadLocal,Lock和Semaphore。协程不依赖于线程,通常需要特定的异步编程框架和API。
  • 虚拟线程的调度由JVM管理,而协程的调度由编程语言或异步编程框架管理。因此,虚拟线程可以更好地与其他线程合作,而协程更适合处理异步任务。

总结

  有了虚拟线程,我们可以用虚拟线程替换许多使用线程的场景,任何需要异步或者多线程运行的情况下,我们都直接直接扔给虚拟线程去运行,丝毫不用顾虑的过度创建线程的问题。虚拟线程是否能完全替代普通线程,这点肯定是不可能的,比较很多时候还是需要操作系统去做任务调度的,而目前操作系统最小的调度单位依旧是线程。

  总之,Java21正式推迟了虚拟线程,我相信在很多高IO的场景下肯定可以提升性能的,至于具体能提升多少,还是有待于具体数据的。 最后用两句老梗来结束本篇文章。

09-26 10:26