前段时间,为了优化某个有点复杂的功能,我采用了shared workers + indexDB,构建了一个高性能的多页面共享的服务。由于是第一次真正意义上的运用workers,比以前单纯的学习有更多体会,所以这里就分享出来!

各种worker概要

有三种worker:普通的worker、shared worker、service worker。(有极少的文档说有四种,多了一个 audio worker,但其实所谓的audio worker 就是 audio context,用于构建强大的音/视频处理系统)

  • 普通worker,也叫专用worker,仅能被生成它的脚本所使用,全局对象this是DedicatedWorkerGlobalScope对象
  • 共享worker,即sharedworker,能被不同的window页面,iframe,以及worker访问(当然要遵循同源限制),全局对象this是 SharedWorkerGlobalScope 对象。
  • serviceWorker,专为PWA应用而生的worker,构建一个PWA必须要基于https,且所使用的密钥签名必须是经过CA认证的,否则你的浏览器都将认为不安全,而不会加载你的service worker。由于这个特殊性,我并没有深入了解service worker!

作为官方标准,3种worker当前的浏览器支持性都非常良好,可以放心使用! 呃,等一下,shared worker的支持性好像不太好哟:

深入web workers (上)-LMLPHP

不用紧张,不支持的主要是应用场景不多的移动端(移动端应用谁会开启多窗口?)和ios了,总体可以忽略(如果必须考虑ios的web端,那就要考虑回退方案了)。

如果你要实现的功能中,用户多窗口操作是很正常的;有数据库(如indexDB)、socket等链接;大量相同的可共用的变量……毫无疑问你应该使用shared worker!
我所要优化的功能就有这些特点,这就是采用shared worker的原因。

worker与主线程的交互

这里只讲专用worker 和 sharedWorker两种(service worker没有深入了解)。专用worker和sharedWorker差别很小,所以接下来先详细的把专用worker讲解清楚,再讲解sharedWorker的不同点。

专用worker和主线程的交互

示例:

// 主线程:
const worker = new Worker('./worker.js')
worker.onmessage = (e) => {
    console.log('[main receive]:',e.data )
}
worker.postMessage('Hello ,this is main thread')


// worker.js:
addEventListener('message', function (e) {
    console.log('[worker receive]:', e.data )
    postMessage('Hi,this is worker thread')
});
  1. 主线程和worker 都是通过 postMessage 方法向对方发送消息。
  2. 双方也都是通过监听 message 事件来接收消息(上面分别有两种监听方法: addEventListener 和 onmessage ,就是个DOM Event )。
  3. 事件句柄的data字段的值就是发送消息时传递的内容。

运行结果:

深入web workers (上)-LMLPHP

 postMessage发送 + 监听message事件接收——交互原理就这么简单,这也是唯一的交互方式!

深入消息的数据传递

数据绝对不会以引用的方式“共享”过去,要么被复制,要么被转移

拷贝

普通的数据传递,是通过拷贝来进行的。也就是发过去的是一份拷贝而非引用,如果是个对象,那么修改对象属性是互不影响的——数据能独立变化,互不影响。

和indexDB一样,拷贝是采用结构化克隆的规范的,经过测试它至少有以下副作用:

  • 对象里不能含有方法,也不能拷贝方法
  • 对象里不能含有symbol,也不能拷贝symbol,键为symbol的属性会被忽略
  • 大多数对象的类信息会丢失。如:传递一个 obj=new Person() 收到的数据将没有 Person这个类信息。
    但是如果是一个内置对象,如Number,Boolean这样的对象,则不会丢失!(注意:这一点和mdn描述的不一样)
  • 不可枚举的属性(enumerable为false)将会被忽略。
  • 属性的可写性配置(writable配置)将丢失。
  • 经过测试,所有通过 Object.defineProperties 新增的(注意 是新增的!)属性都将被忽略。

转移

拷贝在某些情况下会存在性能问题,比如拷贝一个500M的文件,肯定会花较多时间。除了拷贝还提供通过转移的方式来传递数据。

目前只有4种对象支持转移:ArrayBuffer, MessagePort, ImageBitmap OffscreenCanvas

ArrayBuffer是原始的二进制缓冲区,文件File,Blob,各种 TypedArray ,都是基于arrayBuffer的。接下来以ArrayBuffer来举例说明转移传递数据:

可以转移的数据,也可以通过拷贝来传递:

 1 // 主线程:
 2 const worker = new Worker('./worker.js')
 3 const u8 = new Uint8Array(new ArrayBuffer(1))  // 创建一个长度为1的TypedArray u8
 4 u8[0] = 1
 5 worker.onmessage = (e) => {
 6     const receive = e.data
 7     console.log('[main receive]:', receive, 'orginal:', u8)
 8 }
 9 worker.postMessage(u8)  // 通过普通的拷贝,将u8传给worker
10
11
12 // worker.js :
13 addEventListener('message', function (e) {
14     const receive = e.data
15     receive[0] = 9   // worker 收到u8后,改变里面的内容
16     console.log('[worker change]:',receive)
17     postMessage(receive)
18 });

console打印结果:

深入web workers (上)-LMLPHP

这个例子仅仅表明,可以转移的bufferArray也可以通过拷贝传递。注意看第二条打印:和预想中的一样,主线程和worker线程的数据会独立变化。

转移传递示例:

转移很简单,仅仅是在postMessage时,额外传入第二参数,表明要转移的对象,将上面例子稍加改造:

 1 // 主线程:
 2 const worker = new Worker('./worker.js')
 3 const u8 = new Uint8Array(new ArrayBuffer(1))
 4 u8[0] = 1
 5 worker.onmessage = (e) => {
 6     const receive = e.data
 7     console.log('[main receive]:', receive, 'orginal:', u8)
 8     worker.postMessage('finish')
 9 }
10 worker.postMessage(u8 , [u8.buffer])  // 第二个参数表示要转移的对象:注意这必须是一个数组;注意转移的是typedArray的buffer,而不是typedArray!
11
12
13
14 // worker.js :
15 let receive
16 addEventListener('message', function (e) {
17     if(e.data==='finish'){
18         console.log('[worker after transfer]',receive)
19         return;
20     }
21     receive = e.data
22     receive[0] = 9
23     console.log('[worker change]:',receive)
24     postMessage(receive,[receive.buffer])   // 转移typedArray的buffer,typedArray长度将变成0!
25
26 }, false);

console的打印结果(注意理解两个空的typedArray,为什么是空的数组,因为buffer的“使用权”被转移了!):

深入web workers (上)-LMLPHP

把二进制数据直接转移给子线程,一旦转移,主线程就无法再使用这些二进制数据了!

sharedWorker与专用worker的差异

消息交互的差异:

sharedWorker与主线程交互和专用worker基本一样,只是多了一个port:

 1 // 主线程:
 2 const worker = new SharedWorker('worker.js', { name: '公共服务' })
 3 // 创建worker时,除了文件路径,还可以传入一些额外的配置:如name。 
 4 // worker的name有id的功能,不同页面要想共享sharedWorker,名称相同是必要条件!
 5 const key = Math.random().toString(16).substring(2)
 6 worker.port.postMessage(key)        // 通过worker.port发送消息
 7 worker.port.onmessage = e => {        // 通过worker.port接收消息
 8     console.log(e.data)
 9 }
10
11
12 // worker.js:
13 const buf = []
14 onconnect = function (evt) {        // 当其他线程创建sharedWorker其实是向sharedWorker发了一个链接,worker会收到一个connect事件
15     const port = evt.ports[0]        // connect事件的句柄中evt.ports[0]是非常重要的对象port,用来向对应线程发送消息和接收对应线程的消息
16     port.onmessage = (m) => {
17         buf.push(m.data)
18         console.log(buf)        // 这个打印没看到?请看调试差异小节!
19         port.postMessage('worker receive:' + m.data)
20     }
21 }

注意看上面的注释,信息交互都是通过port进行!通常一个sharedWorker可以对应多个主线程,所以sharedWorker多了一个connect事件,通过这个事件获取各自的port与各自的主线程通信!

需要注意的是,在sharedWorker中,如果不是通过onmessage 而是通过addEventListener监听message来接收消息,必须显式调用start开启连接,否则将无法收到消息,只能发送消息。示例:

// sharedWorker内部:
port.start()
port.addEventListener('message',e=>{
    // ... 
})

// 主线程内部:
worker.port.start()
worker.port.addEventListener('message',e=>{
    // ...
})

调试的差异:

在上方的例子有两处打印,第8行 主线程打印worker传过来的消息,第18行worker内部打印缓存下来的[主线程传过来的]消息。奇怪的是,当你打开开发者工具,在Console中并没有看到第18行的打印信息!

要想看到第18行打印的信息对sharedWorker进行调试,需要进行下面两步:

启动一个新的标签页,网址输入:chrome://inspect/#workers 界面如下:

深入web workers (上)-LMLPHP

点击 inspect(千万不要点击terminate,这个是结束worker的),你会看到浏览器会打开一个新窗口,新窗口的界面就是开发者工具界面(做过web移动端开发的应该很熟悉这个界面):

深入web workers (上)-LMLPHP

切换到Sources页面,就可以对SharedWorker代码进行调试了! 

全局对象差异:

在主线程中,一切都很好理解,我们通过创建的worker来监听或发送消息,但在worker内部,则会发现直接调用 postMessage、onmessage等方法。

这是因为在worker内部,有一个全局对象 self,相当于globalThis(如果支持的话),相当于全局作用域下的this,直接调用相当于 self. 调用:

// 专用worker示例:
globalThis.addEventListener('message', function (e) {})
self.postMessage(msgObj)

// serviceWorker 示例:
// 顶级作用域:
this.onconnect = function(evt){}

上面的globalThis,self,this 均可以省略,类似于主线程的window!

正像前面提到过的:专用worker全局对象this是DedicatedWorkerGlobalScope对象,sharedWorker则是SharedWorkerGlobalScope 对象,这两者都是WorkerGlobalScope的派生类,所以可以这样判断:

console.log(this instanceof DedicatedWorkerGlobalScope) // 专用worker 中 true,  sharedWorker和主线程中报异常错误
console.log(this instanceof SharedWorkerGlobalScope)    // sharedWorker 中 true,  专用worker和主线程中报异常错误
console.log(this instanceof WorkerGlobalScope)          // 专用worker和sharedWorker中都是true,  主线程中异常错误

线程生命周期差异:

专用worker很好理解:每打开一个页面就创建一个worker线程,关闭页面worker就销毁,刷新一次页面worker就经历了一次销毁和创建的过程,不同页面互不干扰。

你也可以像下面这样主动销毁一个worker:

// 专用worker内部
self.close() // 主动关闭worker连接,后续发送消息将静默失败

// 外部主线程:
worker.terminate() // 或者外部这样关闭连接,注意:一旦关闭worker,worker将会被销毁,worker内的所有进行中的任务(如定时任务)都将直接销毁

一个sharedWorker可以对应多个主线程,所以:打开页面时,如果没有sharedWorker时才创建,否则就共用已经存在的sharedWorker;当只有当前页面和sharedWorker连接时,关闭当前页面sharedWorker才会被销毁,刷新当前页面sharedWorker才会先销毁后创建。

sharedWorker的连接也可以主动断开,但仅仅是断开链接,并不会销毁sharedWorker,即便是唯一使用sharedWorker的页面断开了链接。worker内部进行中的任务会正常进行,只是不能正常与主线程通信了!

// 主线程:
worker.port.close()    // 仅仅关闭连接

// worker内部(拿到port后):
port.close()           // 仅仅关闭连接

很多人喜欢像下面这样写代码,但请注意注释中的说明,:

const clients = new Set()    // 用于记录所有与worker连接的线程
this.onconnect = function (c) {
    let port = c.ports[0]
    clients.add(port)      // 没有任何方法知道 port 已经断开链接了(如页面关闭),所以clients只能无限添加port。这会引起内存泄露
    // 在你不得不这么做,以实现诸如“向所有页面发送消息”的需求时,注意控制内存泄露的幅度:
    // 所有port使用同一个onmessageHandler实例和onmessageerrorHandler实例,是个不错的选择!

    port.onmessage = onmessageHandler
    port.onmessageerror = onmessageerrorHandler
}

function onmessageHandler(evt){}
function onmessageerrorHandler(evt){}

事件和异常的交互

在面多异常和事件相关的问题时,你必须明白:worker 和 主线程是两个线程!那么就很好理解:
worker中的事件,主线程是没法监听到的,反之亦然;worker中的异常,主线程是无法感知的,反之亦然!再次强调,二者唯一的交互方式就是 postMessage和监听message事件。

// worker.js内部:

// ... other code
throw new Error('test error')
// 这个错误无法被主线程获取,相反 你会在worker的console中看到“错误未捕获提示”的错误提示,而不是主线程的console!

主线程中可以监听worker的error事件,但请注意这到底是什么error:

worker.onerror = e=>{
    // 请注意 这里主线程监听的是创建worker时的异常,而非worker创建成功后内部运行的异常
    // 创建时异常:如下载worker脚本错误,路径错误,worker脚本解析错误等
}

两边都能监听 messageerror 事件,但是经过测试一直都没法触发这个事件,按官方的解释是:当接收到一个消息,但是消息的数据无法成功解析时,会触发这个事件。请注意,这里是“接收”!我尝试发送一个无法拷贝的对象(如含有function字段),但是在发送时就失败了。

可以看到  onerror 和 onmessageerror事件都是和对方无关的事件!

结语

本文深入讲解了 worker 和 sharedWorker  与 主线程的交互。

现在你已经能用两种worker做一些简单的工作了,但是在面临较复杂的工作,以及在面临webpack这样的工程中,使用worker(或sharedWorker)会面临新的问题。敬请期待:深入web workers (下),我将与你详细探讨workers在工程化中的最佳实践。

11-08 08:25