toulen/tspider

spider with php cli

dev-master 2017-10-26 01:46 UTC

This package is auto-updated.

Last update: 2024-04-07 00:38:15 UTC


README

基于PHP开发的简易爬虫,适用于爬取各类资源,只需要创建一个自己的Item类,继承自TspiderItem,并编写爬取规则,实现handle方法就可以获取到你想要的资源.

爬取规则

就有DOMDocment 和 Zend\dom插件.可以像编写CSS一样获取到对应的DOM元素