- 主題:本站内容主要是本人關注的互聯網行業及個人愛好方面的主題,包括AdSense💲、MediaWiki👨💻、Drupal💻、馬拉松🏃、架子鼓🥁等。
- 書訊:本人新書2018年12月出版《Google AdSense實戰寶典 - 第二版📘》,歡迎關注。
OCR文字識别其實可以算很老的技術了,一二十年前購買掃描儀的時候就配有文字識别軟件,記得用起來比較勉強,在比較複雜的中英文混排、版面不規則的情況下,很難獲得滿意的識别效果。
這幾年我們在做Web展示網站的時候,有些原始資料隻有掃描件,嘗試過OCR軟件識别或者網上的OCR識别服務,但都不理想,而手工錄入、校對的工作量太大,也擱置下來了。
近期看到新聞,說騰訊OCR服務永久免費,就去網上看了看(先罵一句百度:在百度中搜“騰訊OCR API”,結果是無關企業的OCR廣告排在前面、百度自己的OCR服務接着出現,而把騰訊公