当前位置: 首页 > news >正文

建设维护网站 未签订合同互联网广告行业分析

建设维护网站 未签订合同,互联网广告行业分析,如何自己做网站挣钱,羽毛球赛事介绍一、简介 主要用于通过OCR(光学字符识别)在图像中查找特定文本,并绘制矩形框突出显示。旨在识别图像中的特定文本并标记其位置。。 代码包括: OCRMatch类:用于初始化OCR引擎并查找文本坐标。 ocr_match函数&#xff1…

一、简介

  • 主要用于通过OCR(光学字符识别)在图像中查找特定文本,并绘制矩形框突出显示。旨在识别图像中的特定文本并标记其位置。。

    代码包括:

    1. OCRMatch类:用于初始化OCR引擎并查找文本坐标。

    2. ocr_match函数:简化调用OCRMatch,查找文本坐标。

    3. draw_rectangle函数:在图像上绘制矩形框并标记中心点。

  • 存在潜在问题:边界框坐标提取可能不准确,建议优化为计算最小和最大x、y值以适应非轴对齐文本。


二、代码功能概述

1. OCRMatch类

OCRMatch类是核心组件,用于初始化OCR引擎并执行文本匹配。其功能包括:

  • 初始化: 设置OCR语言,默认俄语(‘ru’),支持中文(‘ch’)、英语(‘en’)等。

  • 字符串比较:使用difflib.SequenceMatcher计算两个字符串的相似度,范围为0到1。

  • 坐标查找: 通过OCR识别图像中的文本,过滤置信度低于0.75的结果,基于相似度阈值(默认0.8)返回匹配文本的坐标。

代码片段:

注意: PaddleOCR返回的边界框为四个点的坐标(x1, y1, x2, y2, x3, y3, x4, y4)

class OCRMatch:def __init__(self, ocr_language='ru'):self.ocr_language = ocr_languageself._ocr = PaddleOCR(use_angle_cls=True, lang=self.ocr_language)@staticmethoddef _compare_strings(str1, str2):seq_matcher = difflib.SequenceMatcher(None, str1, str2)return seq_matcher.ratio()def find_text_coordinates(self, image, text, threshold=0.8):result = self._ocr.ocr(image, cls=True)for idx in result[0]:if not isinstance(idx[1][0], str) and idx[1][1] < 0.75:continuesimilarity = self._compare_strings(idx[1][0], text)if similarity >= threshold:# 计算矩形对角点坐标x_coords = [idx[0][0], idx[0][2], idx[0][4], idx[0][6]]y_coords = [idx[0][1], idx[0][3], idx[0][5], idx[0][7]]x_min, x_max = min(x_coords), max(x_coords)y_min, y_max = 4. min(y_coords), max(y_coords)points = ((x_min, y_min), (x_max, y_max))conf = idx[1][1]return points, conf

2. ocr_match函数

ocr_match函数是OCRMatch类的包装,简化调用过程。它接受图像、目标文本、阈值和语言参数,返回匹配文本的坐标。

代码片段:

def ocr_match(image, text, threshold=0.8, language='ru'):points, conf = OCRMatch(language).find_text_coordinates(image, text, threshold)return points

3. draw_rectangle函数

draw_rectangle函数用于在图像上绘制矩形框,标记文本位置,并计算并返回矩形中心点。它使用OpenCV加载图像,绘制矩形,并标记中心点。

代码片段:

def draw_rectangle(image_path, start_point, end_point, color=(0, 255, 0), thickness=2):image = cv2.imread(image_path)if image is None:raise ValueError(f"无法加载图片: {image_path}")cv2.rectangle(image, start_point, end_point, color, thickness)center_x = (start_point[0] + end_point[0]) // 2center_y = (start_point[1] + end_point[1]) // 2center_point = (center_x, center_y)return image, center_point

三、技术细节与分析

1. PaddleOCR与EasyOCR对比

  • EasyOCR:简单易用,支持多语言,基于深度学习,安装命令为pip install easyocr。

  • PaddleOCR:百度开源,支持中文,准确性高,安装命令为pip install paddlepaddle paddleocr。

2. 总结与建议

思路构建一个OCR框架,结合PaddleOCR的高准确性和字符串相似度匹配,实现在图像中查找并可视化特定文本


http://www.cadmedia.cn/news/2488.html

相关文章:

  • 西宁市建设委员会网站武汉软件测试培训机构排名
  • wordpress上传sh文件夹重庆seo海洋qq
  • 深圳东门大厦网站整站优化公司
  • 好用的ppt模板网站seo外链网
  • 静态做头像的网站网站seo诊断技巧
  • 宝鸡网站seo网址提交百度
  • jsp电商购物网站开发网络营销研究背景及意义
  • 网站建设的结构设计会员制营销
  • 做收款二维码的网站长春网站优化哪家好
  • 手机免费平面设计软件成都seo培训班
  • 网站建设 m.ykn.cc拓客渠道有哪些
  • 山西建设厅报名网站软文案例300字
  • 当当网网站内容建设的分析郑州网站seo外包
  • 番禺外贸网站建设搜狗站长工具平台
  • 网站建设在作用是什么搜客
  • 网站制作生成器推手平台哪个靠谱
  • 电脑怎么做网站服务器自动外链发布工具
  • 网站外包建设 请示百度账号个人中心
  • 好乐买网站推广方式永久免费二级域名申请
  • 专业网站设计服务近期国内新闻热点事件
  • 做个网站需要什么步骤百度云网站入口
  • 深圳龙华邮政编码是多少常德网站优化公司
  • 如何建造企业网站全国培训机构排名前十
  • 武汉网站建设公司排名北京百度推广优化排名
  • 推广业务网站建设申请网站怎样申请
  • 创建网站 英文安阳seo
  • 驰业传媒网站建设seo排名哪家正规
  • 微信网站建设合同百度信息流投放
  • 文网文许可证办理条件苏州百度快速排名优化
  • 成都微信公司地址在哪里优化营商环境评价