hulang/php-pscws

There is no license information available for the latest version (1.0.3) of this package.

基于PSCWS4的中文分词工具

1.0.3 2022-12-12 05:33 UTC

This package is auto-updated.

Last update: 2024-04-12 08:40:54 UTC


README

主要是收藏起来

基于PSCWS4词库的PHP中文分词工具

词库官方网址:http://www.xunsearch.com/scws/
XDB 词典文件[简体中文(UTF-8) (3.9MB,28万词,2016/02/24更新)]
这是用纯 PHP 代码实现的 C 版 Libscws 的全部功能,即第四版的 PSCWS
PSCWS4 使用文档:http://www.xunsearch.com/scws/docs.php#pscws4

安装

composer require hulang/php-pscws

使用

/**
 * SCWS中文分词
 *
 * @param string $text 分词字符串
 * @param number $number 权重高的词数量(默认5个)
 * @param string $type 返回类型,默认字符串
 * @param string $delimiter 分隔符
 * @return string|array 字符串|数组
 */
$scws = new Scws();
$scws -> scws('能做到柔和、善解、忍辱,才有办法与人结好缘。——证严法师《静思语》');

运行结果

静思 善解 法师 柔和 做到

其它说明

  1. 默认返回结果为字符串,返回字符串支持自定义分隔符,默认为空格
  2. 支持返回结果为数组
  3. 支持返回词数量自定义,默认为5个

版权申明:这里只是把PSCWS4封装成composer包,词库版权属于原作者