tesseract::TessBaseAPI ocr;参数设置说明 -Go服务器开发

tesseract::TessBaseAPI 是 Tesseract OCR 库中的一个类，用于处理光学字符识别（OCR）任务。在使用该类时，您可以通过一系列参数和方法进行配置。以下是一些常用的参数设置和说明：

1. 初始化

tesseract::TessBaseAPI *ocr = new tesseract::TessBaseAPI();

在创建 TessBaseAPI 实例后，您需要初始化它。

2. 初始化语言和数据路径

ocr->Init("path/to/tessdata", "eng");

路径：指定训练数据所在的目录。
语言：指定要使用的语言，例如 "eng" 表示英语。

3. 设置页面 segmentation mode (PSM)

可以通过 SetPageSegMode 方法来设置页面分割模式。不同的模式适用于不同类型的文本布局。

ocr->SetPageSegMode(tesseract::PSM_AUTO);

常用的 PSM 模式包括：

PSM_SINGLE_BLOCK: 单个块（文本）
PSM_SINGLE_LINE: 单行文本
PSM_SINGLE_WORD: 单词
PSM_AUTO: 自动检测

4. 设置 OCR 引擎模式 (OEM)

可以选择不同的 OCR 引擎模式以优化性能和准确性。

ocr->SetVariable("tessedit_char_whitelist", "0123456789"); // 设置允许识别的字符集合
ocr->SetVariable("oem", "1"); // OEM_TESSERACT_ONLY = 1, 默认值是3（默认引擎 + LSTM）。

可选值为：

0: Legacy Tesseract only.
1: Neural nets LSTM only.
2: Both.

5. 提供图像并进行 OCR

在完成上述设置后，可以提供图像并执行识别操作。

Pix *image = pixRead("image.png"); // 读取图片文件 
ocr->SetImage(image);                // 设置图像
char *text = ocr->GetUTF8Text();    // 获取识别结果为 UTF-8 字符串

6. 清理资源

完成 OCR 后，确保释放资源：

delete [] text;       // 删除识别结果字符串
pixDestroy(&image);   // 销毁 Pix 对象
ocr->End();           // 结束 API 使用 
delete ocr;          // 删除 TessBaseAPI 实例

总结

这些是使用 Tesseract 的基本步骤和常见参数设置。具体应用中，可能还会根据需求调整其他变量或者添加更多功能。例如，可以调整字符白名单、黑名单、行间距等，以提高特定应用场景下的识别效果。

内容由零声教学AI助手提供，问题来源于学员提问

tesseract::TessBaseAPI ocr;参数设置说明

1. 初始化

2. 初始化语言和数据路径

3. 设置页面 segmentation mode (PSM)

4. 设置 OCR 引擎模式 (OEM)

5. 提供图像并进行 OCR

6. 清理资源

总结

golang云原生

diff --git a/mtk/package/kernel/wlan_driver/gen4m/mt6639_driver/os/linux/gl_kal.c b/mtk/package/kernel/wlan_driver/gen4m/mt6639_driver/os/linux/gl_kal.c 解释此命令

git 如何把更改提交到本地

执行什么命令可以输出 git diff 命令的输出片段，显示两个文件之间的差异

raco@ubuntu_2204:~/data/mtk_code/T830/T830/openwrt/build_dir/target-aarch64-openwrt-linux-musl_musl/linux-gem6xxx_evb6990_cpe_mt7992_emmc/hw_nat$ git diff hwnat_ioctl.c > temp_patch.patch raco@ubuntu_2204:~/data/mtk_code/T830/T830/openwrt/build_di...

PG主节点挂了，为什么备节点不会自动升主

git 拉取指定commit id的代码

WordPress自定义分享插件可以分享到微信朋友圈的那种我要自己写插件

如何在一个docker中运行多个程序

golang ipv6 地址转整数

Vue.prototype.zipMedia = async function(media) { const zip = new JSZip(); console.log("media.length: ", media.length); console.log("zipMedia_media: ", media); if (!media || media.length === 0) { return null; // 返回 null 表示没...

golang 布隆过滤器

golang + rdp 协议+tls，实现远程桌面服务端和客户端

git 拉取指定commit id的代码

golang为什么将method写在类外?

git clone错误 fatal: unable to update url base from redirection:

golang gorm time.Time类型，如何赋值当前时间戳？

grpc-gateway 传递http header 数据到grpc 元数据

filebeat 配置 fields 的作用

kubectl logs查询指定时间段的日志并输出到指定文件

git insteadOf 通配符

gorm 同时过滤多个string类型的字段

k3s 安装nginx版本的ingress

update mysql.user set authentication_string=password('root') where user='root' and Host ='localhost';哪里有语法错误，该如歌更改

golang glog 打印输出日志并指定路径

联系我们

tesseract::TessBaseAPI ocr;参数设置说明

1. 初始化

2. 初始化语言和数据路径

3. 设置页面 segmentation mode (PSM)

4. 设置 OCR 引擎模式 (OEM)

5. 提供图像并进行 OCR

6. 清理资源

总结

相关推荐

git 拉取指定commit id的代码

WordPress自定义分享插件 可以分享到微信朋友圈的那种 我要自己写插件

如何在一个docker中运行多个程序

golang ipv6 地址转整数

Vue.prototype.zipMedia = async function(media) { const zip = new JSZip(); console.log("media.length: ", media.length); console.log("zipMedia_media: ", media); if (!media || media.length === 0) { return null; // 返回 null 表示没...

golang 布隆过滤器

golang + rdp 协议+tls，实现远程桌面服务端和客户端

git 拉取指定commit id的代码

golang为什么将method写在类外?

联系我们

登录

注册

WordPress自定义分享插件可以分享到微信朋友圈的那种我要自己写插件