注册 登录
电子工程世界-论坛 返回首页 EEWORLD首页 频道 EE大学堂 下载中心 Datasheet 专题

DDZZ669的个人空间 http://home.eeworld.com.cn/space-uid-637976.html [收藏] [复制] [分享] [RSS]

日志

【树莓派3B+测评】OCR字符识别

热度 1已有 304 次阅读2018-9-28 21:29 |个人分类:树莓派3B+使用教程

上个帖子【树莓派3B+测评】树莓派扫描条形码介绍了条形码识别,这次进行OCR(Optical Character Recognition)光学字符识别。
首先需要安装tesseract-ocr软件包:
  1. sudo apt-get install  libleptonica-dev
  2. sudo apt-get install  tesseract-ocr
  3. sudo apt-get install  tesseract-ocr-dev
  4. sudo pip install pytesseract
复制代码


然后就可以用python程序测试了,测试代码也很简单:

  1. from PIL import Image
  2. from pytesseract import *
  3. import cv2
  4. import numpy as np

  5. img0 = cv2.imread('ocr1.jpg')
  6. img1 = Image.fromarray(img0)
  7. mychars = image_to_string(img1).strip()

  8. print(mychars)
  9. cv2.imshow('img',img0)
  10. cv2.waitKey(0)
复制代码


需要用到一张测试图片ocr1.jpg,我是在windows上用画图工具写了一个树莓派的英文字符。
可以通过ssh的方式将windows电脑中文件传送到树莓派中,方法是在windows的cmd命令行中输入类似下面的代码:
  1. scp ocr1.jpg [email]pi@192.168.1.101[/email]:~/Desktop/test
复制代码
  
即,将windows桌面上的图片复制到树莓派桌面的test文件夹中。


运行python程序:

可以看到正确识别。

如果想要识别汉字,需要再安装中文语言包chi_sim.traineddata并将其放在树莓派的/usr/share/tesseract-ocr/tessdata中。
可以先下载到windows电脑中,然后通过下面命令传送到树莓派对应的文件夹中:
  1. scp [color=#333333][backcolor=rgb(254, 254, 254)][font="]chi_sim.traineddata [email]pi@192.168.1.101[/email]:[/font][/backcolor][/color][color=rgb(51, 51, 51)][backcolor=rgb(254, 254, 254)][font="]/usr/share/tesseract-ocr/tessdata[/font][/backcolor][/color]
复制代码



并修改python程序中的
  1. mychars = image_to_string(img1,'chi_sim').strip()
复制代码

最后再更换一个有汉字的图片,效果如下:


本文来自论坛,点击查看完整帖子内容。

发表评论 评论 (1 个评论)

回复 www297743 2018-9-29 08:53
这个特别有用哦

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

Archiver|手机版|小黑屋|电子工程世界 ( 京ICP证 060456 )

GMT+8, 2018-12-11 14:46 , Processed in 0.050420 second(s), 11 queries , Gzip On, MemCache On.

Powered by EEWORLD电子工程世界

© 2018 http://bbs.eeworld.com.cn/

返回顶部