- 主题:本站内容主要是本人关注的互联网行业及个人爱好方面的主题,包括AdSense💲、MediaWiki👨💻、Drupal💻、马拉松🏃、架子鼓🥁等。
- 书讯:本人新书2018年12月出版《Google AdSense实战宝典 - 第二版📘》,欢迎关注。
OCR文字识别其实可以算很老的技术了,一二十年前购买扫描仪的时候就配有文字识别软件,记得用起来比较勉强,在比较复杂的中英文混排、版面不规则的情况下,很难获得满意的识别效果。
这几年我们在做Web展示网站的时候,有些原始资料只有扫描件,尝试过OCR软件识别或者网上的OCR识别服务,但都不理想,而手工录入、校对的工作量太大,也搁置下来了。
近期看到新闻,说腾讯OCR服务永久免费,就去网上看了看(先骂一句百度:在百度中搜“腾讯OCR API”,结果是无关企业的OCR广告排在前面、百度自己的OCR服务接着出现,而把腾讯公