闲话 Swift 协程(5):Task 的取消

但凡是个任务,就有可能被取消。取消了该怎么办呢?

Task 的取消就是个状态

Task 的取消其实非常简单,就是将 Task 标记为取消状态。那 Task 的执行体要怎么做才能让任务真正取消呢?我们先看个简单的例子:

1
2
3
4
5
6
7
8
9
let task = Task {
print("task start")
await Task.sleep(10_000_000_000)
print("task finish")
}

await Task.sleep(500_000_000)
task.cancel()
print(await task.result)

我们创建了一个 Task,正常情况下它应该很快被执行到,因此第一行日志可以打印出来,随即进入 10s 的睡眠状态。但我们在 Task 外部等了 500ms 之后把它取消了,如果不出什么意外的话,在 Task 睡眠时它就被取消了。

既然任务被取消了,凭我们主观的判断,第二句日志应该是打印不出来的,但实际的情况却是:

1
2
3
task start
task finish
success()

这说明 Task 的取消只是一个状态标记,它不会强制 Task 的执行体中断,换句话说 Task 的取消并不像杀进程那样粗暴。

实际上,我们可以在任务的执行体当中读取到 Task 的取消状态,我们把程序稍作修改如下:

1
2
3
4
5
6
7
8
9
let task = Task {
print("task start")
await Task.sleep(10_000_000_000)
print("task finish, isCancelled: \(Task.isCancelled)")
}

await Task.sleep(500_000_000)
task.cancel()
print(await task.result)

运行结果如下:

1
2
3
task start
task finish, isCancelled: true
success()

可以看到,Task 确实被取消了,我们也可以读取到这个状态,如果我们需要让我们的 Task 执行体响应它的取消状态,那就需要做出这个状态的判断,并且做出响应,例如:

1
2
3
4
5
6
7
8
9
Task {
if !Task.isCancelled {
print("task start")
await Task.sleep(10_000_000_000)
if !Task.isCancelled {
print("task finish, isCancelled: \(Task.isCancelled)")
}
}
}

当然,这个例子还不够理想,毕竟睡眠的 10s 是不能响应取消的。那如果让 sleep 函数内部也能响应取消,问题是不是就解决了?

通过抛 CancellationError 来响应取消

Task 的执行过程中,难免会存在多层异步函数的嵌套的情况,如果最深处的某一个函数响应了取消状态,怎样才能让外部的异步函数也能很好的配合好这个响应?这其实就是在回答上一节留下的 sleep 该如何响应取消的问题。如果想要优雅地给出这个答案,只能通过抛异常的方式了,因为任何条件分支的判断都无法实现有效的传播,而异常天然就具备这样的特性。

所以常见的异常响应方式非常简单,如果你在编写一个需要响应取消状态的异步函数,当你检查到 Task 被取消时,只需要抛一个 CancellationError 即可,大家都遵守这个规则,那么这个 Task 就能被优雅地结束。

实际上 Task 一共有两个 sleep 函数,我们仔细对比一下它们的定义:

1
2
public static func sleep(_ duration: UInt64) async
public static func sleep(nanoseconds duration: UInt64) async throws

二者的区别有两处:

  • 参数的 label
  • 是否会抛出异常

第二个函数明确通过参数的 label 告诉我们参数是纳秒,同时它还会抛出异常。什么异常?自然是在 Task 被取消时抛出 CancellationError。这么看来我们只需要稍微调整一下代码就能完美解决问题:

1
2
3
4
5
6
7
8
9
let task = Task {
print("task start")
try await Task.sleep(nanoseconds: 10_000_000_000)
print("task finish, isCancelled: \(Task.isCancelled)")
}

await Task.sleep(500_000_000)
task.cancel()
print(await task.result)

运行结果如下:

1
2
task start
failure(Swift.CancellationError())

符合预期。

实际上,如果大家仔细查阅 Swift 的文档,你就会发现第一个 sleep 函数已经被废弃了,它的问题想必大家也已经非常明白了吧。

checkCancellation:更方便地检查取消状态

前面的例子我们算是躺赢了,但如果实际的代码是下面这样呢?

1
2
3
4
5
6
7
let task = Task {
print("task start")
for i in 0...10000 {
doHardWork(i)
}
print("task finish, isCancelled: \(Task.isCancelled)")
}

不难,我们只需要加个判断嘛,这样在每次循环的开始,如果 Task 已经被取消,我们就能够及时地停止这个任务的执行:

1
2
3
4
5
6
7
8
9
10
let task = Task {
print("task start")
for i in 0...10000 {
if Task.isCancelled {
throw CancellationError()
}
doHardWork(i)
}
print("task finish, isCancelled: \(Task.isCancelled)")
}

其实,这里有个更方便的写法:

1
2
3
4
5
6
7
8
let task = Task {
print("task start")
for i in 0...10000 {
try Task.checkCancellation()
doHardWork(i)
}
print("task finish, isCancelled: \(Task.isCancelled)")
}

这个函数也没啥神秘的,因为它的实现非常直接:

1
2
3
4
5
public static func checkCancellation() throws {
if Task<Never, Never>.isCancelled {
throw _Concurrency.CancellationError()
}
}

注册取消回调

前面提到的响应取消的情况实际上是两种类型:

  • 调用其他支持响应取消的异步函数,在取消时它会抛出 CancellationError
  • 自己的代码当中主动检查取消状态,并抛出 CancellationError(或者直接退出执行逻辑)

但如果异步的逻辑封装在第三方代码当中,我们只能想办法在 Task 取消时调用第三方的取消逻辑来完成响应,这时候情况就复杂一些了。我们就以 GCD 的异步 API 为例,首先我们对 DispatchWorkItem 做个包装:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
class ContinuationWorkItem<T, E> where E: Error {

var continuation: CheckedContinuation<T, E>?
let block: (ContinuationWorkItem) -> T

lazy var dispatchItem: DispatchWorkItem = DispatchWorkItem {
self.continuation?.resume(returning: self.block(self))
}

var isCancelled: Bool {
get {
self.dispatchItem.isCancelled
}
}

init(block: @escaping (ContinuationWorkItem<T, E>) -> T) {
self.block = block
}

func installContinuation(continuation: CheckedContinuation<T, E>) {
self.continuation = continuation
}

func cancel() {
dispatchItem.cancel()
}

}

这个包装的目的在于支持 installContinuation,通过获取 Task 的 continuation 来实现异步结果的返回。

这里还有一个细节,block 的类型与 DispatchWorkItem 的 block 多了个参数:

1
let block: (ContinuationWorkItem) -> T

这主要是为了方面我们在 block 当中可以读取到 GCD 的任务是否被取消了。

接下来我们试着用 Task 来封装 GCD 的异步任务,并且实现对取消的响应:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
let task = Task { () -> Int in
let asyncRequest = ContinuationWorkItem<Int, Never> { item in
print("async start")
var i = 0
while i < 10 && !item.isCancelled {
// 单位 秒
Thread.sleep(forTimeInterval: 0.1)
i += 1
print("i = \(i)")
}
if item.isCancelled {
print("async cancelled, \(i)")
return 0
} else {
print("async finish")
return 1
}
}

return await withTaskCancellationHandler {
await withCheckedContinuation { (continuation: CheckedContinuation<Int, Never>) in
asyncRequest.installContinuation(continuation: continuation)
DispatchQueue.global().async(execute: asyncRequest.dispatchItem)
}
} onCancel: {
asyncRequest.cancel()
}
}

await Task.sleep(500_000_000)
task.cancel()
print(await task.result)

asyncRequest 其实就是我们创建的对 ContinuationWorkItem 实例,它对 DispatchWorkItem 做了包装,在后面的代码当中传给了 DispatchQueue 去异步执行。为了能够及时感知到 Task 的取消状态变化,我们用到了 withTaskCancellationHandler 这个函数,它的定义如下:

1
2
3
4
public func withTaskCancellationHandler<T>(
operation: () async throws -> T,
onCancel handler: @Sendable () -> Void
) async rethrows -> T

显然,这个函数也是个异步函数,它有两个参数,分别是:

  • operation,即我们要在当前 Task 当中执行的代码逻辑
  • onCancel,在 operation 执行时,如果 Task 被取消,该回调立即执行

有了这个函数,我们就可以在调用第三方异步操作时,及时感知到 Task 的取消状态,并通知第三方取消异步操作。

TaskGroup 的取消

TaskGroup 也可以被取消,很容易理解,所有从属于 TaskGroup 的 Task 在前者被取消以后也会被取消。下面我们给出一个非常简单的例子来说明这个问题:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
let max = 10
let taskCount = 10

await withTaskGroup(of: (Int, Int).self) { group -> Void in
for i in 0..<taskCount {
group.addTask {
var count = 0
while !Task.isCancelled && count < max {
await Task.sleep(1000_000_000 + UInt64(arc4random_uniform(500_000_000)))
count += 1

print("Task: \(i), count: \(count)")
}
return (i, count)
}
}

await Task.sleep(5500_000_000)
group.cancelAll()

for await result in group {
print("result: \(result)")
}
}

我们在 TaskGroup 当中启动了 10 个 Task, 这些 Task 每隔约 1 ~ 1.5 秒就会令 count 加 1,最终把 Task 的序号和 count 的值返回。TaskGroup 则在启动了所有的 Task 之后 5.5 秒的时候取消,因此前面的 Task 大多只能将 count 增加到 5 左右。运行结果如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Task: 4, count: 1
Task: 6, count: 1
...
Task: 2, count: 4
Task: 8, count: 4
result: (8, 4)
Task: 9, count: 4
result: (9, 4)
Task: 5, count: 4
Task: 7, count: 4
result: (5, 4)
result: (7, 4)
Task: 4, count: 5
result: (4, 5)
Task: 6, count: 5
Task: 3, count: 5
result: (6, 5)
result: (3, 5)
Task: 2, count: 5
Task: 0, count: 5
result: (2, 5)
result: (0, 5)
Task: 1, count: 5
result: (1, 5)

我们省略了部分相似的输出,大家只需要关注包含 result 的行,其中 Task 9 返回的 count 为 4,Task 1 返回的 count 为 5。这说明 TaskGroup 在取消时其中的 Task 确实都被取消了。

小结

本文我们重点讨论了 Task 的取消的设计,包括取消状态的概念,如何在不同情况下响应取消状态;最后也通过一个简单地例子了解了一下 TaskGroup 的取消。

大家只需要牢记一点,Task 的取消只是一个状态,需要内部执行逻辑的响应。


关于作者

霍丙乾 bennyhuo,Google 开发者专家(Kotlin 方向);《深入理解 Kotlin 协程》 作者(机械工业出版社,2020.6);《深入实践 Kotlin 元编程》 作者(机械工业出版社,2023.8);移动客户端工程师,先后就职于腾讯地图、猿辅导、腾讯视频。