PHPackages                             blogdaren/webman-phpcreeper - PHPackages - PHPackages  [Skip to content](#main-content)[PHPackages](/)[Directory](/)[Categories](/categories)[Trending](/trending)[Leaderboard](/leaderboard)[Changelog](/changelog)[Analyze](/analyze)[Collections](/collections)[Log in](/login)[Sign up](/register)

1. [Directory](/)
2. /
3. [Queues &amp; Workers](/categories/queues)
4. /
5. blogdaren/webman-phpcreeper

ActiveLibrary[Queues &amp; Workers](/categories/queues)

blogdaren/webman-phpcreeper
===========================

PHPCreeper plugin for webman

v1.0.6(1y ago)143471[1 issues](https://github.com/blogdaren/webman-phpcreeper/issues)MITPHP

Since Apr 1Pushed 1y agoCompare

[ Source](https://github.com/blogdaren/webman-phpcreeper)[ Packagist](https://packagist.org/packages/blogdaren/webman-phpcreeper)[ Docs](http://www.phpcreeper.com)[ RSS](/packages/blogdaren-webman-phpcreeper/feed)WikiDiscussions master Synced 3w ago

READMEChangelog (7)Dependencies (1)Versions (8)Used By (0)

简介
--

[](#简介)

webman的爬山虎插件，[PHPCreeper | 爬山虎](https://github.com/blogdaren/PHPCreeper)：让爬取工作变得更加简单高效。

更新
--

[](#更新)

- 本插件的使用说明最近一次更新时间是：`2024-10-20`，由于爬山虎迭代版新增了许多新特性和API，而且完全向下兼容，所以建议将本插件更新至最新版`v1.0.6`，同时确保将爬山虎同步更新至最新版`v1.9.6`。
- 重大更新：自爬山虎`v1.8.7`开始，爬山虎开始支持无头浏览器即支持运行JavaScript代码及其渲染的动态页面。使用非常简单，无缝切换，只需要通过`$context`上下文启用或禁用无头浏览器开关即可。

安装
--

[](#安装)

```
composer require blogdaren/webman-phpcreeper

```

使用说明
----

[](#使用说明)

- 首先要明确一个概念：爬山虎有三种容器分别是：生产器、下载器、解析器。
- 编写一个爬虫非常简单: 配置搞定以后，只需要在对应容器内的`onXXXX`回调方法内编写业务逻辑即可。
- 由于爬虫应用相对WEB应用而言比较独立，所以app内的爬虫目录结构建议自行独立部署。
- 首先在自己的app项目下手动创建有效的爬虫目录，比如：app/spider。
- 然后在爬虫目录内(app/spider)创建相应的容器句柄类Hanlder。
- 最后在对应容器内的`onXXXX`回调方法内编写业务逻辑。
- 若启用无头开关，默认使用无头chrome驱动，反之使用默认的guzzle驱动，若爬取的不是动态页，建议禁用。

举个例子
----

[](#举个例子)

模拟抓取未来3天内北京的天气预报

开发步骤
----

[](#开发步骤)

1、创建爬虫目录：app/spider

2、创建生产器句柄类文件：app/spider/Myproducer.php

```
