简介:
一个强大的光学字符识别 (OCR) 扩展,用于捕获图像并将其转换为文本
一个强大的光学字符识别 (OCR) 扩展,用于捕获图像并将其转换为文本
此扩展程序向您的浏览器添加一个工具栏按钮以执行 OCR。按下此操作按钮时,它允许用户在当前活动窗口中选择一个区域。该扩展程序捕获该区域并尝试使用内部强大的 OCR 引擎(Tesseract 引擎)识别该区域内的文本。此扩展使用支持 100 多种语言、自动文本方向和脚本检测的"tesseract.js"库。
此扩展程序在页面上加载 JS 库,并在您完成后将其删除。这样,就没有长期的资源使用。
笔记:
- 第一次运行时,扩展可能需要几分钟才能从互联网上获取训练数据。由于此资源已缓存,因此所有后续调用都将很快。
2.光学字符识别(OCR)速度慢,所以这个扩展显示每个检测模块的进度条。 - 此扩展离线进行 OCR 处理。没有服务器端交互。它只获取一次语言培训数据库。
- 此工具可用于提取图像、PDF 文档、Powerpoint 幻灯片中的文本内容,或在禁止用户部分的情况下提取网页内容。
- 如果文本提取置信度低,扩展会反转图像并重试(对深色主题特别有用)
6.如果文字提取不准确,可以修改图片拖放到界面中重试。
插件下载: