PHPackages                             qwen/image-ocr - PHPackages - PHPackages  [Skip to content](#main-content)[PHPackages](/)[Directory](/)[Categories](/categories)[Trending](/trending)[Leaderboard](/leaderboard)[Changelog](/changelog)[Analyze](/analyze)[Collections](/collections)[Log in](/login)[Sign up](/register)

1. [Directory](/)
2. /
3. [Image &amp; Media](/categories/media)
4. /
5. qwen/image-ocr

ActiveLibrary[Image &amp; Media](/categories/media)

qwen/image-ocr
==============

基于通义千问大模型的图片文字识别与JSON结构化输出库

v0.0.3(1mo ago)010MITPHPPHP &gt;=7.2

Since May 5Pushed 1mo agoCompare

[ Source](https://github.com/zeng444/aliocr)[ Packagist](https://packagist.org/packages/qwen/image-ocr)[ RSS](/packages/qwen-image-ocr/feed)WikiDiscussions main Synced 3w ago

READMEChangelogDependencies (4)Versions (4)Used By (0)

Qwen Image OCR
==============

[](#qwen-image-ocr)

基于通义千问视觉大模型（qwen-vl-ocr）的图片文字识别与 JSON 结构化输出 PHP 库。

通过调用阿里云 DashScope API，将图片中的文字内容智能识别并自动解析为结构化 JSON 数据。内置 9 种中国常见证件/票据类型的专用识别模板，开箱即用。

特性
--

[](#特性)

- 基于 PHP 7.2+，使用 Guzzle HTTP 客户端
- 调用通义千问视觉模型（qwen-vl-ocr）识别图片中的文字
- 自动解析模型返回的 JSON 结构化数据（支持纯 JSON 和 Markdown 代码块格式）
- 内置 9 种证件/票据类型专用 Prompt 模板，精准提取字段
- 支持自定义 Prompt 指令和 PromptBuilder 替换
- 完善的异常处理（区分 API 请求异常和 JSON 解析异常）
- 支持 URL 和 Base64 两种图片输入方式

支持的证件类型
-------

[](#支持的证件类型)

类型类名标识符说明车牌`VehicleLicense``vehicle_license`车牌号码身份证正面`FrontIdCard``frontIdCard`姓名、性别、民族、出生日期、住址、身份证号身份证背面`BackIdCard``backIdCard`签发机关、有效期限营业执照`BusinessLicense``businessLicense`统一社会信用代码、企业名称、法人、经营范围等 14 个字段车辆合格证`Certificate``certificate`合格证编号、车架号、发动机号等 38 个字段发票`CarInvoice``carInvoice`发票代码、金额、购销双方信息、明细行等 27 个字段行驶证正页`FrontLicense``frontLicense`号牌号码、车辆类型、所有人、VIN 等 11 个字段行驶证副页`BackLicense``backLicense`核定载人数、总质量、外廓尺寸等 12 个字段驾驶证正面`FrontDrivingLicense``frontDrivingLicense`证号、姓名、准驾类型、有效期限等 11 个字段驾驶证背面`BackDrivingLicense``backDrivingLicense`姓名、档案编号、记录、证号安装
--

[](#安装)

```
composer require qwen/image-ocr
```

阿里云 Qwen 模型计费价格
---------------

[](#阿里云-qwen-模型计费价格)

模型类型输入价格输出价格qwen-vl-ocr视觉识别 · OCR 专项¥0.3 / 百万 token¥0.5 / 百万 tokenqwen-vl-plus视觉理解 · 多模态增强¥0.8 / 百万 token¥2.0 / 百万 tokenqwen3.6-flash视觉理解 · 多模态增强¥1.2 / 百万 token¥7.2 / 百万 token> 计费单位：元（CNY）/ 每百万 token

仅需 OCR 文字识别，降低成本，默认使用 `qwen-vl-ocr` 模型；存在手写识别可切换为 `qwen-vl-plus`

```
$client = new Client('sk-xxxxxxxx', [
    'model' => 'qwen-vl-plus',
]);
```

快速开始
----

[](#快速开始)

### 1. 通用文字识别

[](#1-通用文字识别)

使用默认 Prompt，识别图片中所有文字并输出结构化 JSON：

```