Ubuntu C++ ocr识别cv::Mat-Go服务器开发

在Ubuntu中使用C++进行OCR（光学字符识别），通常可以利用OpenCV库和Tesseract OCR引擎。下面是一个简单的示例，展示如何将cv::Mat图像传递给Tesseract进行文本识别。

环境准备

安装依赖项：首先确保你的系统上安装了OpenCV和Tesseract。如果还没有安装，可以使用以下命令：

   sudo apt-get update
   sudo apt-get install libopencv-dev tesseract-ocr libleptonica-dev

安装CMake（如果尚未安装）：

   sudo apt-get install cmake

示例代码

#include <iostream>
#include <opencv2/opencv.hpp>
#include <tesseract/baseapi.h>
#include <tesseract/leptonica.h>

int main() {
    // 读取图像到cv::Mat
    cv::Mat image = cv::imread("path/to/your/image.jpg");

    if (image.empty()) {
        std::cerr << "Could not open or find the image!" << std::endl;
        return -1;
    }

    // 转换为灰度图像（可选）
    cv::Mat grayImage;
    cv::cvtColor(image, grayImage, cv::COLOR_BGR2GRAY);

    // 创建Tesseract API实例
    tesseract::TessBaseAPI *ocr = new tesseract::TessBaseAPI();
    
    // 初始化tesseract-ocr
    if (ocr->Init(NULL, "eng")) { // 使用默认路径并选择英语语言
        std::cerr << "Could not initialize tesseract." << std::endl;
        return -1;
    }

    // 将cv::Mat转换为Pix格式，以便与Tesseract一起使用
    Pix *pixImage = pixCreate(grayImage.cols, grayImage.rows, 8); // 8位深度，单通道图像

    for (int y = 0; y < grayImage.rows; ++y) {
        for (int x = 0; x < grayImage.cols; ++x) {
            int pixelValue = grayImage.at<uchar>(y, x);
            pixSetPixel(pixImage, x, y, pixelValue);
        }
    }

    ocr->SetImage(pixImage); // 设置图片用于OCR处理
    
    char* outText = ocr->GetUTF8Text(); // 获取识别结果
    std::cout << "OCR Output:\n" << outText << std::endl;

    // 清理资源
    delete[] outText;
    
    pixDestroy(&pixImage);
    
    ocr->End();

    return 0;
}

编译和运行

创建一个CMakeLists.txt文件：

cmake_minimum_required(VERSION 3.10)
project(OCRExample)

find_package(OpenCV REQUIRED)
find_package(TESSERACT REQUIRED)

include_directories(${OpenCV_INCLUDE_DIRS} ${TESSERACT_INCLUDE_DIRS})

add_executable(ocr_example main.cpp)
target_link_libraries(ocr_example ${OpenCV_LIBS} ${TESSERACT_LIBRARIES})

然后用以下命令编译并运行程序：

mkdir build && cd build
cmake ..
make
./ocr_example

请确保将代码中的 path/to/your/image.jpg 替换为你自己的图像路径。运行程序后，它会输出OCR识别的文本。

注意事项

确保输入的图像质量较高，以提高OCR的准确性。
Tesseract支持多种语言，你可以下载对应语言的训练数据并在初始化时指定。
对于更复杂的应用场景，可以考虑对输入图像进行预处理以提高识别率，比如去噪、二值化等操作。

内容由零声教学AI助手提供，问题来源于学员提问

Ubuntu C++ ocr识别cv::Mat

环境准备

示例代码

编译和运行

注意事项

golang云原生

没有ipvsadm命令

LVS负载后端两台服务器，使用IPIP包，有一台能正常收到包，有一台后端服务能收到IPIP的包，但是应用层没有收到包，需要如何排查配置

重启网络后依旧只有local 172.22.132.134 dev tunl0 table local proto kernel scope host src 172.22.132.134 multicast ff00::/8 dev tunl0 table local proto kernel metric 256 pref medium

link/ipip 0.0.0.0 brd 0.0.0.0 inet 172.22.132.134/32 brd 172.22.132.134 scope global tunl0 valid_lft forever preferred_lft forever 这是正常的这台的配置，tunl0@NONE: mtu 1480 qdisc noop state DOWN group default qlen 1000 link/ipip 0.0....

异常的这台tunl0的ip地址变为了0.0.0.0,正常的那台ip为172.22.132.134

git 拉取指定commit id的代码

WordPress自定义分享插件可以分享到微信朋友圈的那种我要自己写插件

如何在一个docker中运行多个程序

golang ipv6 地址转整数

Vue.prototype.zipMedia = async function(media) { const zip = new JSZip(); console.log("media.length: ", media.length); console.log("zipMedia_media: ", media); if (!media || media.length === 0) { return null; // 返回 null 表示没...

golang 布隆过滤器

golang + rdp 协议+tls，实现远程桌面服务端和客户端

git 拉取指定commit id的代码

golang为什么将method写在类外?

虚拟化公司有没有

chenjx@LAPTOP-MQJFEFTJ:/mnt/e/waibao$ sudo ./center 2025-08-02 16:11:01.954 INFO --- AOT mode enabled 2025-08-02 16:11:01.956 INFO --- Starting Center using Java 17.0.7 on LAPTOP-MQJFEFTJ with PID 2978 (/mnt/e/waibao/center started by root in /m...

Qt 库的 QLabel的 text 和 pixmap 是否只能显示其一？设置了 pixmap 后，如何转为显示 text ？

在使用reactor网络模型与redis交互的时候，与redis连接返回-1的时候，放入epoll来监听。为什么要注册写事件

详细介绍fmt库

curl -s --max-time 10 http://127.0.0.1:8001/ha/establish/exec -X POST -d '{"type":31,"operation_type":"get_spilit_vip"}' 这个curl存在什么问题？为什么nginx报错invalid URL prefix in "http://", client: 127.0.0.1, server: , request: "POST /ha/establish/exec HTTP/1....

Linux安装git

void HttpBase::Start(PNetworkInfo _pInfo, qint64 buffSize) {//pInfo is an in-class pointer to make it easier to call the passed pointer QElapsedTimer timerout; timerout.start(); QUrl url; bool ret = false; QTimer timer; ...

在vscode中编写了tasks.json之后，就能使用scode来调试和运行了么

联系我们

Ubuntu C++ ocr识别cv::Mat

环境准备

示例代码

编译和运行

注意事项

相关推荐

git 拉取指定commit id的代码

WordPress自定义分享插件 可以分享到微信朋友圈的那种 我要自己写插件

如何在一个docker中运行多个程序

golang ipv6 地址转整数

Vue.prototype.zipMedia = async function(media) { const zip = new JSZip(); console.log("media.length: ", media.length); console.log("zipMedia_media: ", media); if (!media || media.length === 0) { return null; // 返回 null 表示没...

golang 布隆过滤器

golang + rdp 协议+tls，实现远程桌面服务端和客户端

git 拉取指定commit id的代码

golang为什么将method写在类外?

联系我们

登录

注册

WordPress自定义分享插件可以分享到微信朋友圈的那种我要自己写插件