ZBLOG

windows环境C++ opencv 如何在屏幕截图中找到想要的字符串例如”丰饶之间”,返回该字符串的最左坐标、最右坐标、最上坐标、最下坐标

在 Windows 环境下使用 C++ 和 OpenCV 进行屏幕截图并识别指定字符串,可以按照以下步骤进行:

  1. 使用 OpenCV 的 cv::VideoCapture 类打开屏幕录制设备,获取屏幕的帧图像。
cv::VideoCapture capture(0); // 0 表示默认屏幕设备
if (!capture.isOpened()) {
    std::cerr << "无法打开屏幕录制设备" << std::endl;
    return -1;
}
  1. 在循环中读取每一帧图像,并将其转换为灰度图像,以便进行文本识别。
while (true) {
    cv::Mat frame;
    capture >> frame;

    if (frame.empty()) {
        std::cerr << "无法从屏幕捕获到图像" << std::endl;
        break;
    }

    cv::Mat grayFrame;
    cv::cvtColor(frame, grayFrame, cv::COLOR_BGR2GRAY);
    
    // 在这里进行文本识别和坐标计算操作
}
  1. 使用 OCR(光学字符识别)库或者自定义的文本识别算法对灰度图像进行处理,提取其中的文本信息。

你可以选择使用 Tesseract OCR 库作为一个开源的 OCR 解决方案。在使用之前,请确保已经安装了 Tesseract 并设置好相关的环境变量。

#include <tesseract/baseapi.h>

tesseract::TessBaseAPI tess;
tess.Init(NULL, "eng"); // 初始化 Tesseract,使用英文语言模型

// 将灰度图像传递给 Tesseract 进行识别
tess.SetImage(grayFrame.data, grayFrame.cols, grayFrame.rows, 1, grayFrame.step);
char* recognizedText = tess.GetUTF8Text();
std::string result(recognizedText); // 转换为 std::string

delete[] recognizedText; // 释放内存
  1. 对提取到的文本进行处理和匹配,找到目标字符串并计算其最左、最右、最上、最下坐标。
std::size_t found = result.find("丰饶之间");
if (found != std::string::npos) {
    int left = found % grayFrame.cols;
    int top = found / grayFrame.cols;

    int right = left + targetString.length() - 1;
    int bottom = top;

    std::cout << "左坐标:" << left << std::endl;
    std::cout << "右坐标:" << right << std::endl;
    std::cout << "上坐标:" << top << std::endl;
    std::cout << "下坐标:" << bottom << std::endl;
}

请注意,以上代码仅为示例,并未经过详细测试。你可能需要根据实际情况进行调整和完善。同时,确保已正确配置和安装了 OpenCV 和 Tesseract 库,并在编译时链接相应的库文件。


内容由零声教学AI助手提供,问题来源于学员提问

本站部分文章来源于网络,版权归原作者所有,如有侵权请联系站长删除。
转载请注明出处:https://golang.0voice.com/?id=8015

分享:
扫描分享到社交APP
上一篇
下一篇
发表列表
游客 游客
此处应有掌声~
评论列表

还没有评论,快来说点什么吧~

联系我们

在线咨询: 点击这里给我发消息

微信号:3007537140

上班时间: 10:30-22:30

关注我们
x

注册

已经有帐号?