最近做项目需要用到识别图片中攵字的功能本来用的Tesseract这个写的,不过效果不是很理想
随后上网搜了一下OCR接口,就准备使用腾讯云、百度的OCR接口试一下效果不过这个騰讯云OCR就折腾了一天!
通用OCR技术提供图片整体文字的检测和识别服务,返回文字框位置与文字内容支持多场景、任意版面下整图文字的識别,以及中英文、字母、数字的识别被广泛应用于印刷文档识别、广告图文字识别、街景店招识别、菜单识别、视频标题识别、互联網头像文字识别等。
接口采用http协议支持指定图片URL和上传本地图片文件两种方式。
所有请求都要求含有下列的头部信息:
這里需要注意的一点是设置Host值的时候不能使用
这个方法否则会有异常。
1、文中使用的appid、bucket、secret_id、
secret_key需要注册后財能得到。至于如何得到文档中说的很清楚,有详细的步骤
希望你在调用腾讯云-OCR通用印刷体识别Api的时候可以少走些弯路,少踩一些坑当然了这些可能算不上坑,可能是个人一些基础知识没掌握不管怎么样,如果你在使用OCR的时候本文对你有一点帮助,那它就发挥了應有的作用
本文的源代码有兴趣的可以。