当前位置：工具盒子 > 白嫖帮 > 正文

【转载】Docker部署trwebocr | 自建一个文字识别服务

2024-12-23 分类：白嫖帮阅读(264) 评论(0)

Important：本文章原始发布地址为微信公众号：时光历程，点击链接访问原文。

大家好，平时我们想提取图片的文字，可能用微信自带的提取就很方便了，但是我们是否可以自己自建一个这样的服务呢？今天给大家分享一下。

特性

中文识别
快速高识别率
文字检测
支持一定角度的旋转
并发请求
由于模型本身不支持并发，但通过tornado多进程的方式，能支持一定数量的并发请求。
具体并发数取决于机器的配置。

最低配置要求

CPU: 1核
内存: 2G
SWAP: 2G

运行平台

✔ Python 3.6+
✔ Ubuntu 16.04
✔ ️Ubuntu 18.04
✔ CentOS 7
✔ Docker

搭建trwebocr

绿联 DX4600 为例，首先我们打开 Docker 管理器，进入镜像管理，然后在镜像仓库中搜索 mmmz/trwebocr，选择 latest 版本并下载。

下载完成后，我们在本地镜像中找到刚刚下载的镜像，点击创建容器，起一个英文名，勾选创建后启动容器，点击下一步。

【转载】Docker部署trwebocr | 自建一个文字识别服务

在基础设置中，重启策略选择"容器退出时总是重启容器"。

【转载】Docker部署trwebocr | 自建一个文字识别服务

设置一个喜欢的本地端口号。

【转载】Docker部署trwebocr | 自建一个文字识别服务

此时，输入我们的 IP+端口或者域名+端口即可在线访问。

【转载】Docker部署trwebocr | 自建一个文字识别服务

来测试一下效果

【转载】Docker部署trwebocr | 自建一个文字识别服务

命令部署

                    # 从 dockerhub pull
docker pull mmmz/trwebocr:latest
`# 运行镜像
docker run -itd --rm -p 8089:8089 --name trwebocr mmmz/trwebocr:latest 
`

这里把容器的8089端口映射到了物理机的8089上，但如果你不喜欢映射，去掉run后面的-p 8089:8089 也可以使用docker的IP加8089来访问

接口调用示例

Python 使用File上传文件

                    import requests
url = 'http://192.168.31.108:8089/api/tr-run/'
img1_file = {
    'file': open('img1.png', 'rb')
}
res = requests.post(url=url, data={'compress': 0}, files=img1_file)

Python 使用Base64

                    import requests
import base64
def img_to_base64(img_path):
    with open(img_path, 'rb')as read:
        b64 = base64.b64encode(read.read())
    return b64
url = 'http://192.168.31.108:8089/api/tr-run/'
img_b64 = img_to_base64('./img1.png')
res = requests.post(url=url, data={'img': img_b64})

接口说明

描述： 进行文字识别与检测的接口

地址： /api/tr-run/

方法：POST

请求参数：

| 参数名称 | 是否必选 | 数据类型 | 描述 | |----------|------------|--------|----------------------------------------------------------| | file | 和 img 二选一 | file | 通过上传的方式来发送图片的字段 | | img | 和 file 二选一 | string | 图片的base64值，不需要前缀。 | | compress | 否 | int | 值为空时，默认将图片最长边压缩到1600px。值为 0 时，不压缩图片。值为非0 时，将最长边压缩到该值的大小。 | | is_draw | 否 | int | 值为 0 时，不返回图片。（没有data['img_detected']返回） |

返回参数：

| 参数名称 | 是否必选 | 数据类型 | 描述 | |------------------------|------|--------|----------------------------| | code | 是 | int | 识别结果的状态码，识别成功为200，有异常为 400 | | msg | 是 | string | 识别结果的文字信息 | | data | 否 | dict | 识别结果，若识别异常则没有此字段 | | data['img_detected'] | 是 | string | 画出文字区域的图片base64值 | | data['raw_out'] | 是 | list | 识别结果的输出 | | data['speed_time'] | 是 | float | 识别的耗时 |

返回示例：

                    {"code": 200,
 "msg": "\u6210\u529f", 
 "data": {
   "img_detected": "data:image/jpeg;base64,/9j/4AAQSkZJR5t...",
   "raw_out": [[[11, 13, 402, 36], "\u753b\u51fa\u6587\u5b57\u533a\u57df\u7684\u56fe\u7247base64\u503c", 0.9999545514583588], [[11, 112, 215, 36], "\u8bc6\u522b\u7ed3\u679c\u7684\u8f93\u51fa", 0.999962397984096], [[11, 171, 158, 36], "\u8bc6\u522b\u7684\u8017\u65f6", 0.999971580505371]], 
   "speed_time": 0.67}}

开源地址： https://github.com/alisen39/TrWebOCR

感谢各位小伙伴阅读本文！希望这篇文章能对大家有所帮助。如果大家觉得这篇文章还不错，别忘了点赞、评论和关注哦！你们的支持是我最大的动力，我会继续努力，为大家带来更多优质内容。非常感谢大家的三连，咱们下期再见！

未经允许不得转载：工具盒子 » 【转载】Docker部署trwebocr | 自建一个文字识别服务

标签： trwebocr

厉飞雨

众生皆苦，唯有自渡！

相关推荐