基于圖像的OMR技術(shù)的實現(xiàn)
發(fā)布時間:2007/4/23 0:00:00 訪問次數(shù):1218
摘要:在分析OMR與OCR的應用特點后,提出了基于圖像的OMR方式。詳細討論了該方法的硬件設(shè)計和工作原理,并在軟件處理方面著重介紹了傾斜校正和圖像分割。它具有對紙張質(zhì)量要求低和識別準確度高等特點。
關(guān)鍵詞:OMR OCR 信號處理 傾斜校正 圖像分割
目前,許多文檔是以紙質(zhì)文檔的形式存在,例如銀行票據(jù)、稅務報表、標準化考試中的機讀卡、人口普查表、彩標投注單、選票、定貨單等。而紙質(zhì)文檔不便于保存、檢索、統(tǒng)計和修改。將這些信息錄入計算機是一件非常繁瑣的事情。長期以來人們通過鍵盤手工輸入,不但費時費力且容易出錯。在實時性要求較高的場合(如選舉中的統(tǒng)計選票)自動、快速、準確地處理文檔顯得尤為重要。因此,對這些文檔進行計算機自動錄入具有重要的實現(xiàn)意義。
計算機自動錄入是解決這個同瓶頸的關(guān)鍵所在。其中,光學字符識別OCR(Optical Character Recognition)和光學標記識別OMR(Optical Mark Recognition)是解決信號自動錄入的有效方法。它們利用光學方法將信息錄入到計算機并進行識別處理,能極大地提高數(shù)據(jù)信息的采集速度,便于計算機存儲、管理與檢索。
1 OCR與OMR
(1)OCR的工作原理
OCR首先將要識別的文字和圖像掃描進計算機,然后進行圖像的預處理,再抽取字符特片進行識別,轉(zhuǎn)變?yōu)橛嬎銠C能夠識別的字符信息。圖像預處理包括去除噪聲、歪斜校畫龍點睛、圖像分割、平滑及規(guī)范化等。其中圖像分割是一個重要的步驟,它的作用是將要識別的單個字符的圖像找到并分割出來。OCR技術(shù)主要應用于文字圖像識別及處理,例如用于印刷體和限制手寫體字符的識別。OCR技術(shù)已成為大規(guī)模數(shù)據(jù)錄入的首選方案,它將隨著計算機技術(shù)的發(fā)展而更加成熟。
(2)OMR的工作原理
OMR識別“涂點”上有無標記兩種狀態(tài)。“涂點”就是信息卡上可以涂寫標記的地址!巴奎c”所代表的含義可以事先定義,可以代表一個阿拉伯數(shù)字,也可以表示一個英文字母或符號。OMR技術(shù)快速簡單,識別率高且成本低,廣泛應用于標準化考慮自動閱卷、各類調(diào)查問卷的統(tǒng)計、選舉結(jié)果的統(tǒng)計等,是自動識別領(lǐng)域中應用較多的一種方法。
2 基于圖像的OMR技術(shù)
目前OMR一般采用光電對管閱讀技術(shù)。識別用的器件是半導體發(fā)光管及光敏管。發(fā)光管是光源器件,由它發(fā)出的光照射到“涂點”上。光敏管是接收器件,接收來自“涂點”位置的反射光。因為涂有標記的地方反光弱,未涂標記的地方反光強,所以光敏管接收到的光信號強度不同。不同強度的光信號可以代表有無標記兩種狀態(tài)。將“涂點”位置處的發(fā)光管和光敏這組成一只電眼,可識別一個涂點。若干個電眼排列起來組成光電頭可完成對一排涂點的識別。
該方法實現(xiàn)應用中有如下限制:信息卡上的“涂點”要與電眼完全對齊,即信息卡在錄入時不能傾斜;信息卡不能折皺;紙張質(zhì)量、印刷技術(shù)要求高;填寫標記要規(guī)范,否則就要影響識別結(jié)果。實際應用中,信息卡在錄入時由于走紙機構(gòu)機械誤差而略有傾斜,會造成識別出錯。
OCR由于采用了圖像處理技術(shù),信息卡在錄入時的傾斜能自動校正,保證錄入的高精度,也能處理略有折皺的信息卡。因此,OCR對所用紙張的質(zhì)量、印刷技術(shù)要求不高,降低了運行成本。同時可以保留填寫的原始圖像備查,進行復核或重新識別。
在借鑒OCR優(yōu)點的基礎(chǔ)上,筆者在課題《彩標閱讀及識別系統(tǒng)》中采用了基于圖像的OMR技術(shù)。所謂基于圖像的OMR技術(shù),就是將信息卡經(jīng)光電變換,形成二值化圖像;再經(jīng)歪斜校正、圖像分割,對分割出的小塊圖像(含“涂點”)中的黑點數(shù)進行計數(shù)。若大于某個閾值,就認為有標記,否則就沒有標記,從而完成了標記識別。相對OCR而言,它省去了最耗時的字符特征抽取步驟。
3 硬件組成
本系統(tǒng)框圖如圖1所示。
(1)圖像傳感器
采用國產(chǎn)的CIS(Contact Image Sensor)圖像傳感器,其光學分辨率比CCD略低,但是其驅(qū)動電路、光學系統(tǒng)和機械結(jié)構(gòu)卻比CCD簡單。光學系統(tǒng)中采用特殊光源實現(xiàn)光學濾波,消除或減輕了信息卡背景信息對分割、識別的影響。工作時,由CPLD(Complex Programable Logic Device)產(chǎn)生一個周期
摘要:在分析OMR與OCR的應用特點后,提出了基于圖像的OMR方式。詳細討論了該方法的硬件設(shè)計和工作原理,并在軟件處理方面著重介紹了傾斜校正和圖像分割。它具有對紙張質(zhì)量要求低和識別準確度高等特點。
關(guān)鍵詞:OMR OCR 信號處理 傾斜校正 圖像分割
目前,許多文檔是以紙質(zhì)文檔的形式存在,例如銀行票據(jù)、稅務報表、標準化考試中的機讀卡、人口普查表、彩標投注單、選票、定貨單等。而紙質(zhì)文檔不便于保存、檢索、統(tǒng)計和修改。將這些信息錄入計算機是一件非常繁瑣的事情。長期以來人們通過鍵盤手工輸入,不但費時費力且容易出錯。在實時性要求較高的場合(如選舉中的統(tǒng)計選票)自動、快速、準確地處理文檔顯得尤為重要。因此,對這些文檔進行計算機自動錄入具有重要的實現(xiàn)意義。
計算機自動錄入是解決這個同瓶頸的關(guān)鍵所在。其中,光學字符識別OCR(Optical Character Recognition)和光學標記識別OMR(Optical Mark Recognition)是解決信號自動錄入的有效方法。它們利用光學方法將信息錄入到計算機并進行識別處理,能極大地提高數(shù)據(jù)信息的采集速度,便于計算機存儲、管理與檢索。
1 OCR與OMR
(1)OCR的工作原理
OCR首先將要識別的文字和圖像掃描進計算機,然后進行圖像的預處理,再抽取字符特片進行識別,轉(zhuǎn)變?yōu)橛嬎銠C能夠識別的字符信息。圖像預處理包括去除噪聲、歪斜校畫龍點睛、圖像分割、平滑及規(guī)范化等。其中圖像分割是一個重要的步驟,它的作用是將要識別的單個字符的圖像找到并分割出來。OCR技術(shù)主要應用于文字圖像識別及處理,例如用于印刷體和限制手寫體字符的識別。OCR技術(shù)已成為大規(guī)模數(shù)據(jù)錄入的首選方案,它將隨著計算機技術(shù)的發(fā)展而更加成熟。
(2)OMR的工作原理
OMR識別“涂點”上有無標記兩種狀態(tài)!巴奎c”就是信息卡上可以涂寫標記的地址!巴奎c”所代表的含義可以事先定義,可以代表一個阿拉伯數(shù)字,也可以表示一個英文字母或符號。OMR技術(shù)快速簡單,識別率高且成本低,廣泛應用于標準化考慮自動閱卷、各類調(diào)查問卷的統(tǒng)計、選舉結(jié)果的統(tǒng)計等,是自動識別領(lǐng)域中應用較多的一種方法。
2 基于圖像的OMR技術(shù)
目前OMR一般采用光電對管閱讀技術(shù)。識別用的器件是半導體發(fā)光管及光敏管。發(fā)光管是光源器件,由它發(fā)出的光照射到“涂點”上。光敏管是接收器件,接收來自“涂點”位置的反射光。因為涂有標記的地方反光弱,未涂標記的地方反光強,所以光敏管接收到的光信號強度不同。不同強度的光信號可以代表有無標記兩種狀態(tài)。將“涂點”位置處的發(fā)光管和光敏這組成一只電眼,可識別一個涂點。若干個電眼排列起來組成光電頭可完成對一排涂點的識別。
該方法實現(xiàn)應用中有如下限制:信息卡上的“涂點”要與電眼完全對齊,即信息卡在錄入時不能傾斜;信息卡不能折皺;紙張質(zhì)量、印刷技術(shù)要求高;填寫標記要規(guī)范,否則就要影響識別結(jié)果。實際應用中,信息卡在錄入時由于走紙機構(gòu)機械誤差而略有傾斜,會造成識別出錯。
OCR由于采用了圖像處理技術(shù),信息卡在錄入時的傾斜能自動校正,保證錄入的高精度,也能處理略有折皺的信息卡。因此,OCR對所用紙張的質(zhì)量、印刷技術(shù)要求不高,降低了運行成本。同時可以保留填寫的原始圖像備查,進行復核或重新識別。
在借鑒OCR優(yōu)點的基礎(chǔ)上,筆者在課題《彩標閱讀及識別系統(tǒng)》中采用了基于圖像的OMR技術(shù)。所謂基于圖像的OMR技術(shù),就是將信息卡經(jīng)光電變換,形成二值化圖像;再經(jīng)歪斜校正、圖像分割,對分割出的小塊圖像(含“涂點”)中的黑點數(shù)進行計數(shù)。若大于某個閾值,就認為有標記,否則就沒有標記,從而完成了標記識別。相對OCR而言,它省去了最耗時的字符特征抽取步驟。
3 硬件組成
本系統(tǒng)框圖如圖1所示。
(1)圖像傳感器
采用國產(chǎn)的CIS(Contact Image Sensor)圖像傳感器,其光學分辨率比CCD略低,但是其驅(qū)動電路、光學系統(tǒng)和機械結(jié)構(gòu)卻比CCD簡單。光學系統(tǒng)中采用特殊光源實現(xiàn)光學濾波,消除或減輕了信息卡背景信息對分割、識別的影響。工作時,由CPLD(Complex Programable Logic Device)產(chǎn)生一個周期
熱門點擊
- 基于圖像的OMR技術(shù)的實現(xiàn)
- 顏色傳感器TCS230及顏色識別電路
- 線陣CCD圖像傳感器驅(qū)動電路的設(shè)計
- 嵌入式WebServer技術(shù)及其實現(xiàn)
- 基于FPGA和RTOS的嵌入式碼流分析設(shè)計方
- CAMC—IP型二軸運動控制電路的功能及應用
- MAX6625型溫度傳感器的原理及應用
- 嵌入式系統(tǒng)中的內(nèi)存壓縮技術(shù)
- 汽車LIN總線物理接口器件MC33399的原
- 用AT89C系列單片機實現(xiàn)5英寸TFT-LC
推薦技術(shù)資料
- DFRobot—玩的就是
- 如果說新車間的特點是“靈動”,F(xiàn)QPF12N60C那么... [詳細]
- PCB嵌入式功率芯片封裝工作原理
- 莫仕儲能連接器技術(shù)結(jié)構(gòu)應用詳情
- 新款 Snapdragon X
- Intel 18A(1.8nm
- 業(yè)界首款STM32配套無線物聯(lián)網(wǎng)模塊
- 2025年全球半導體產(chǎn)業(yè)十大熱門看點
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計
- dsPIC及其在交流變頻調(diào)速中的應用研究