西西河

主题:从PDF文件中提取文字的问题。 -- johny

共:💬31 🌺5
全看分页树展 · 主题 跟帖
家园 我很早以前用过清华OCR来识别过扫描的文件。

印象中对扫描的分辨率有要求,当时好像是必需150DPI的分辨率以上。

你可以试着扫描,然后OCR。不过我觉得按照OCR 原理,你把PDF文件想法转成图像文件(比如拷屏)应该可以用来OCR。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河