PHPackages                             xinrui5577/beanbun - PHPackages - PHPackages  [Skip to content](#main-content)[PHPackages](/)[Directory](/)[Categories](/categories)[Trending](/trending)[Leaderboard](/leaderboard)[Changelog](/changelog)[Analyze](/analyze)[Collections](/collections)[Log in](/login)[Sign up](/register)

1. [Directory](/)
2. /
3. [Framework](/categories/framework)
4. /
5. xinrui5577/beanbun

ActiveApplication[Framework](/categories/framework)

xinrui5577/beanbun
==================

老版本2018年4月份没有维护了.有bug,自己fork分支,自己维护,原来:Beanbun 是用 PHP 编写的多进程网络爬虫框架，具有良好的开放性、高可扩展性

1.1.0(7y ago)219MITPHPPHP &gt;=7.0

Since Apr 13Pushed 7y ago1 watchersCompare

[ Source](https://github.com/xinrui5577/beanbun)[ Packagist](https://packagist.org/packages/xinrui5577/beanbun)[ RSS](/packages/xinrui5577-beanbun/feed)WikiDiscussions master Synced 2w ago

READMEChangelogDependencies (3)Versions (8)Used By (0)

### 说明

[](#说明)

这是对Beanbun的运行中的更新.原始版本很久没更新.在linux 服务器运行有bug ,$count 属性不存在.php版本 7以下. 根据自己运行需求.把几个问题修改了下.PHP版本升级到php7+,依赖库也升级了下.把Parser集成都一个项目,反正都要解析. 后续如果有问题在更新

一下是原始信息:

### 简介

[](#简介)

Beanbun 是一个简单可扩展的爬虫框架，支持分布式，支持守护进程模式与普通模式，守护进程模式基于 [Workerman](http://www.workerman.net)，下载器基于 [Guzzle](http://guzzlephp.org)。

### 特点

[](#特点)

- 支持守护进程与普通两种模式（守护进程模式只支持 Linux 服务器）
- 默认使用 guzzle 进行爬取
- 支持分布式
- 支持内存、Redis 等多种队列方式
- 支持自定义URI过滤
- 支持广度优先和深度优先两种爬取方式
- 遵循 PSR-4 标准
- 爬取网页分为多步，每步均支持自定义动作（如添加代理、修改 user-agent 等）
- 灵活的扩展机制，可方便的为框架制作插件：自定义队列、自定义爬取方式...

[![](https://camo.githubusercontent.com/aaee181d3b15de9975af231c86a62595ee365e2480ae035f6df9daf04177f2ae/687474703a2f2f6f74656b31356965612e626b742e636c6f7564646e2e636f6d2f666c6f775f332e6a7067)](https://github.com/kiddyuchina/Beanbun)

### 安装

[](#安装)

Beanbun 可以通过 composer 进行安装。

```
$ composer require kiddyu/beanbun

```

### 快速开始

[](#快速开始)

创建一个文件 start.php，包含以下内容

```
