對印刷質(zhì)量不好的文檔最好是在圖形處理軟件中以灰度格式掃描獲取圖片后再轉(zhuǎn)換成單色位圖進(jìn)行識別,識別的準(zhǔn)確率高了很多。
通常大家在掃描識別時都喜歡在識別軟件中進(jìn)行掃描,直接獲取單色位圖進(jìn)行識別。其實這樣效率并不高。一般識別軟件幾乎沒什么圖形處理能力,為了得到滿意的識別效果不得不多次調(diào)整亮度重復(fù)進(jìn)行預(yù)掃描,而每掃描一頁需要的時間又相當(dāng)長。此外,一些識別軟件還會在每次掃描后退出掃描程序,反復(fù)重新啟動掃描程序也會浪費不少時間。
因此,最好是在圖形處理軟件中以灰度格式掃描獲取圖片后再轉(zhuǎn)換成單色位圖進(jìn)行識別,雖然多了一道工序,但識別的準(zhǔn)確率高了很多。筆者一直使用HyperSnap DX進(jìn)行這樣的工作。
1.運行HyperSnap DX,按“Ctrl+A”鍵啟動掃描程序,以200dpi分辨率、默認(rèn)亮度、對比度和“灰度”模式進(jìn)行掃描。
2.切換到HyperSnap DX窗口,單擊菜單欄“顏色/黑白…”,在彈出的“轉(zhuǎn)為黑白圖像”窗口中拖動中間的黑色級別滑塊,你可以立即看到轉(zhuǎn)換后黑白圖像效果,滿意后單擊確定完成轉(zhuǎn)換。然后把圖片保存為tiff格式的文件,注意不要關(guān)掉程序以便過后修改。
3.啟動識別軟件,單擊“文件”,打開保存的圖形進(jìn)行識別。如果效果不好可回到HyperSnap窗口按“Ctrl+Z”鍵撤消剛才的設(shè)置,再重復(fù)第二步的工作進(jìn)行細(xì)化調(diào)整,這比重新掃描要快得多。
如果要掃描識別的是一大批質(zhì)量相似的頁面,那么每張都這樣處理也不太方便。此時可以按第一步方法,以標(biāo)準(zhǔn)亮度、對比度進(jìn)行掃描,使用 HyperSnap DX獲取圖片處理后轉(zhuǎn)換成單色位圖,然后記下“黑色級別”數(shù)值,參照數(shù)值設(shè)置掃描程序中的亮度,即可獲得近似的效果。不過,為了最大限度提高識別率,最好還是逐一設(shè)置比較好,反正在HyperSnap DX中要調(diào)整也很簡單,要多做的只有圖片轉(zhuǎn)換、保存和打開這三步而已,但換來的是文字識別效率成倍的提高。
提示:此方法特別適合對一些印刷質(zhì)量不好或者是保存時間比較久的文字材料進(jìn)行高識別率掃描識別的時候采用。