基于Swow的Task组件,支持多种模式。轻松实现协程Task的队列、并发、Defer | Swow coroutine task kit - Swoole Humanization Library

v0.4 2021-12-21 04:42 UTC

This package is auto-updated.

Last update: 2024-03-21 11:15:55 UTC


README

Php Version Swow Version

感谢swlib-archer

简介

协程Task弓兵, Swow人性化组件库之PHP高性能Task队列, 基于Swow原生协程, 底层提供无额外I/O的高性能解决方案, 让开发者专注于功能开发, 从繁琐的传统Task队列或协程并发旋涡中解放。

  • 基于Swow协程开发, Swow Task提供的所有功能
  • 人性化使用风格, API简单易用, 符合传统同步代码开发逻辑习惯
  • 完备的Exception异常事件, 符合面向对象的基本思路, 避免陷入若类型陷阱
  • 多种Task模式(伪异步、协程同步、Defer模式多任务集合)等,满足各种开发情景
  • 轻松将任意协程代码变为Defer模式,不用刻意修改为defer()与recv()。
  • 可以将任意协程代码并发执行而不改变原先设计模式。
  • 基于协程实现的毫秒级计时器

安装

最好的安装方法是通过 Composer 包管理器 :

composer require serendipity-swow/archer

或者下载代码,并在autoloader中手动注册Archer:

$loader = include YOUR_BASE_PATH . '/vendor/autoload.php';
$loader->setPsr4('SwowCloud\\Archer\\', YOUR_PATH . '/src/');
$loader->addClassMap([
    'SwowCloud\\Archer' => YOUR_PATH . '/src/Archer.php'
]);

依赖

  • PHP 8.0 or later
  • **Swow development

协程调度

Swow底层实现协程调度, 业务层无需感知, 开发者可以无感知的用同步的代码编写方式达到异步IO的效果和超高性能,避免了传统异步回调所带来的离散的代码逻辑和陷入多层回调中导致代码无法维护。
Task队列循环与各Task的执行都处于独立的协程中,不会占用用户自己创建的协程。可以将任意协程变为Defer模式,无需手动触发defer()与recv()。
Archer运行于全协程的场景中,禁忌同步阻塞代码的出现,会影响队列的运行。

接口

所有模式的Task在执行时所处的协程与原协程不是同一个,所以所有基于Context的变量传递与维护会失效,务必注意这一点。

模式1:Defer模式 (即CSP模型)

获取Task:

/*定义*/ \SwowCloud\Archer\Archer::taskDefer(callable $task_callback, ?array $params = null): \SwowCloud\Archer\Task\Defer;
$task = \SwowCloud\Archer\Archer::taskDefer($task_callback, ['foo', 'bar']);
返回模式 异常处理
返回Task对象 若Task抛出了任何异常,Archer会捕获后在执行recv时抛出。

获取执行结果:

/*定义*/ \SwowCloud\Archer\Task\Defer->recv(?float $timeout = null);
$task->recv(0.5);
  • $timeout 超时时间,超时后函数会直接抛出SwowCloud\Archer\Exception\TaskTimeoutException。注意:超时返回后Task仍会继续执行,不会中断,不会移出队列。若缺省则表示不会超时
返回模式 异常处理
若Task已执行完则直接返回结果。否则协程挂起,等待执行完毕后恢复并返回结果。 若Task抛出了任何异常,Archer会捕获后会在此处抛出。

模式2:Task集模式

获取容器:

// $max_concurrent表示集内最大并行数量,缺省表示不限制
$container = \SwowCloud\Archer::getMultiTask(?int $max_concurrent = null);

向队列投递Task并立即返回Task id。

$container->addTask(callable $task_callback, ?array $params = null): int;

两种执行方式:

等待全部结果:等待所有Task全部执行完。返回值为键值对,键为Taskid,值为其对应的返回值
$container->waitForAll(?float $timeout = null): array;
  • $timeout 超时时间,超时后函数会直接抛出SwowCloud\Archer\Exception\TaskTimeoutException。注意:超时返回后所有Task仍会继续执行,不会中断,不会移出队列。若缺省则表示不会超时
返回模式 异常处理
若运行时所有Task已执行完,则会直接以键值对的形式返回所有Task的返回值。否则当前协程挂起。当所有Task执行完成后,会恢复投递的协程,并返回结果。 若某个Task抛出了任何异常,不会影响其他Task的执行,但在返回值中不会出现该Task id对应的项,需要通过getError(int $taskid)getErrorMap()方法获取异常对象
先完成先返回:各Task的执行结果会根据其完成的顺序,以键值对的形式yield出来

对于生成器(Generator)的定义:查看

$container->yieldEachOne(?float $timeout = null): \Generator;
  • $timeout 超时时间,超时后函数会直接抛出SwowCloud\Archer\Exception\TaskTimeoutException(该时间表示花费在本方法内的时间,外界调用该方法处理每个返回值所耗费的时间不计入)。注意:超时返回后所有Task仍会继续执行,不会中断,不会移出队列。若缺省则表示不会超时
  • 生成器遍历完成后,可以通过 Generator->getReturn() 方法获取返回值的键值对
返回模式 异常处理
若运行时已经有些Task已执行完,则会按执行完毕的顺序将他们先yield出来。若这之后仍存在未执行完的Task,则当前协程将会挂起,每有一个Task执行完,当前协程将恢复且其结果就会以以键值对的方式yield出来,然后协程会挂起等待下一个执行完的Task。 若某个Task抛出了任何异常,不会影响其他Task的执行,但这个Task不会被yield出来,需要通过getError(int $taskid)getErrorMap()方法获取异常对象

获取某Task抛出的异常(若Task未抛出异常则返回null)

$container->getError(int $id): ?\Throwable;

获取所有异常Task与他们抛出的异常,返回值为键值对,键为Taskid,值为其抛出的异常

$container->getErrorMap(): array;

在Task内获取当前的Taskid

\SwowCloud\Archer\Task::getCurrentTaskId(): ?int;

在Task执行中,调用该方法可以获取当前的Taskid,在其他地方调用会返回null(该方法基于协程uid缓存)

终止事件循环

调用此方法以防止循环使得进程事件循环不能结束

\SwowCloud\Archer\Queue::stop(): void;
\SwowCloud\Archer\TimerHeap::stop(): void;

注册一个全局回调函数

Swow>=4.2.9版本推荐在项目使用Context的时候通过Coroutine::defer()注册清理函数,无需在此注册

\SwowCloud\Archer\Task::registerTaskFinishFunc(callable $func): void;

这里注册的回调函数会在每个Task结束时执行,不论Task是否抛出了异常,不论Task模式,格式如下:

function (int $task_id, $task_return_value, ?\Throwable $e) {
    // $task_id 为\SwowCloud\Archer::task()或\SwowCloud\Archer\MultiTask->addTask() 返回的Task id。\SwowCloud\Archer::taskWait()由于无法获取Taskid,所以可以忽略该项。
    // $task_return_value 为Task闭包 $task_callback 的返回值,若没有返回值或抛出了异常,则该项为null
    // $e为Task闭包 $task_callback 中抛出的异常,正常情况下为null
}

不建议在该方法中执行会引起阻塞或协程切换的操作,因为会影响到Task运行结果的传递效率;也不要在该方法中抛出任何异常,会导致catch不到而使进程退出。
该方法所处的协程与Task所处的协程为同一个,所以可以利用该函数清理执行Task所留下的Context
- Task为伪异步模式时,该方法会在 $finish_callback 之前执行 - Task为协程同步返回模式或集模式时,该方法会在返回或抛出异常给原协程之前调用。

配置

\SwowCloud\Archer\Queue::setQueueSize(int $size): void;
\SwowCloud\Archer\Queue::setConcurrent(int $concurrent): void;
  • 队列的size,默认为8192。当待执行的Task数量超过size时,再投递Task会导致协程切换,直到待执行的Task数量小于size后才可恢复
  • 最大并发数concurrent,默认为2048,表示同时处于执行状态的Task的最大数量。
  • 这两个方法,必须在第一次投递任何Task之前调用。建议在 onWorkerStart 中调用

异常

Archer会抛出以下几种异常:

  • SwowCloud\Archer\Exception\AddNewTaskFailException 将task加入队列时发生错误,由 \Swow\Coroutine\Channel->pop 报错引起,这往往是由内核错误导致的
  • SwowCloud\Archer\Exception\RuntimeException Archer内部状态错误,通常由用户错误地调用了底层函数引起
  • SwowCloud\Archer\Exception\TaskTimeoutException Task超时,因用户在某些地方设置了timeout,Task排队+执行时间超过了该时间引发的异常。用户应该在需要设置timeout的地方捕获这个异常以完成超时逻辑。注意Task执行时间超时不会引起Task中断或被移出队列。

例子

*假设所有场景均已处于协程环境之中;场景都是理想化,简易化的;除了例子中使用的闭包,Archer支持所有callable类型

场景:执行某些协程Client(或由Runtime::enableCoroutine()变为协程的传统Client)时,未开启或无法开启Defer特性,但又想使用Defer功能。

$task_redis = \SwowCloud\Archer\Archer::taskDefer(function() {
    $redis = new \Swow\Coroutine\Redis();
    $redis->connect('127.0.0.1', 6379);
    return $redis->get('key');
});
$task_mysql = \SwowCloud\Archer\Archer::taskDefer(function() {
    $mysql = new \Swow\Coroutine\MySQL();
    $mysql->connect([
        'host' => '127.0.0.1',
        'user' => 'user',
        'password' => 'pass',
        'database' => 'test',
    ]);
    return $mysql->query('select sleep(1)');
});
$task_http = \SwowCloud\Archer\Archer::taskDefer(function(string $url): string {
    $httpclient = new \Swow\Coroutine\Http\Client('0.0.0.0', 9599);
    $httpclient->setHeaders(['Host' => "api.mp.qq.com"]);
    $httpclient->set(['timeout' => 1]);
    $httpclient->get('/');
    return $httpclient->body;
}, ['api.mp.qq.com']);
var_dump($task_redis->recv());
var_dump($task_mysql->recv());
var_dump($task_http->recv());

场景:并发20条SQL并一起获取返回值

$container = \SwowCloud\Archer\Archer::getMultiTask();
$task_callback = function(int $id): int {
    $mysql = new Swow\Coroutine\MySQL();
    $mysql->connect([
        'host' => '127.0.0.1',
        'user' => 'user',
        'password' => 'pass',
        'database' => 'test',
    ]);
    $result = $mysql->query('SELECT COUNT(*) AS `c` FROM `order` WHERE `user`='.id);
    if (empty($result)) return 0;
    return current($result)['c'] ?? 0;
};
$map = [];
$map2 = [];
$results = [];
for ($id=1; $id<=20; ++$id) {// 虽然用 GROUP BY 一条SQL实现,这里只是举个例子
    $taskid = $container->addTask($task_callback, [$id]);
    $map[$taskid] = $id;
    $map2[$id] = $taskid;
}

foreach ($container->waitForAll(10) as $taskid=>$count)
    $results[$map[$taskid]] = $count;
    
for ($id=1; $id<=20; ++$id)
    if (array_key_exists($id, $results))
        echo "id:{$id} count:{$results[$id]}\n";
    else
        echo "id:{$id} error:". $container->getError($map2[$id])->getMessage() ."\n";

场景:并发20条SQL,并将结果发给20个用户,每条运行完就立刻发送。

$container = \SwowCloud\Archer\Archer::getMultiTask();
$task_callback = function(int $id): int {
    $mysql = new Swow\Coroutine\MySQL();
    $mysql->connect([
        'host' => '127.0.0.1',
        'user' => 'user',
        'password' => 'pass',
        'database' => 'test',
    ]);
    $result = $mysql->query('SELECT COUNT(*) AS `c` FROM `order` WHERE `user`='.id);
    if (empty($result)) return 0;
    return current($result)['c'] ?? 0;
};
$map = [];
for ($id=1; $id<=20; ++$id) {
    $taskid = $container->addTask($task_callback, [$id]);
    $map[$taskid] = $id;
}

foreach ($container->yieldEachOne(10) as $taskid=>$count) {
    $server->send($map[$taskid], $count); // 假设 fd 和 id 取值一样,这只是一个简化的场景例子,正式应用肯定更复杂
    unset($map[$taskid]);
}

foreach ($map as $taskid => $id)
    $server->send($id, 'Error: ' . $container->getError($taskid)->getMessage());

重中之重

欢迎提交issue和PR.