中文 EN

常用知識

當(dāng)前位置：首頁>常用知識

產(chǎn)品簡介

什么是OCR光學(xué)字符識別？

OCR （Optical Character Recognition，光學(xué)字符識別）是指電子設(shè)備（例如掃描儀或數(shù)碼相機(jī)）檢查紙上打印的字符，通過檢測暗、亮的模式確定其形狀，然后用字符識別方法將形狀翻譯成計算機(jī)文字的過程。衡量一個OCR系統(tǒng)性能好壞的主要指標(biāo)有：拒識率、誤識率、識別速度、用戶界面的友好性，產(chǎn)品的穩(wěn)定性，易用性及可行性等。

在工業(yè)領(lǐng)域，光學(xué)字符識別（OCR）是一項機(jī)器視覺任務(wù)，包括從圖像中提取文本信息。

OCR 最先進(jìn)的技術(shù)提供高精度的文本識別，并且對中等顆粒圖形噪聲無懈可擊。它們還適用于識別使用點陣打印機(jī)制作的字符。該技術(shù)為部分遮擋或變形的字符提供了令人滿意的結(jié)果。

識別過程的效率主要取決于文本分割結(jié)果的質(zhì)量。大多數(shù)識別案例都可以使用提供的一組識別模型完成。在其他情況下，可以輕松準(zhǔn)備新的識別模型。

OCR光學(xué)字符識別技術(shù)步驟

為了實現(xiàn)最準(zhǔn)確的識別，有必要進(jìn)行仔細(xì)的文本提取和分段。從圖像獲取文本的總體過程包括以下步驟：

從圖像中讀取文本

壹 \| 貳 \| 叁 \| 肆 \| 伍 \|	獲取文本位置從背景中提取文本分段文本使用準(zhǔn)備好的OCR模型字符識別

獲取文本位置

文本的位置是固定的，它由稱為掩碼的框描述。例如，個人身份證是按照正式規(guī)范制作的。每個數(shù)據(jù)字段的位置是已知的。經(jīng)過良好校準(zhǔn)的視覺系統(tǒng)可以拍攝文本位置幾乎恒定的圖像。

文本位置不是固定的，但它與輸入圖像上的特征元素或特殊標(biāo)記（光學(xué)標(biāo)記）相關(guān)。要獲取文本的位置，必須找到光學(xué)標(biāo)記。這可以通過模板匹配、1D 邊緣檢測或其他技術(shù)完成。

未指定文本的位置，但可以通過圖像閾值輕松地從背景中分離字符。然后可以使用 Blob 分析技術(shù)找到正確的字符。

從背景中提取文本

文本提取過程中的主要復(fù)雜情況可能是光線不均勻。某些技術(shù)（如光規(guī)范化或邊緣銳化）有助于查找字符。

原始圖像

光規(guī)范化后的圖像

使用 Fourier 變換進(jìn)行低頻圖像阻尼后的圖像

使用不均勻的光線采樣圖

經(jīng)過光規(guī)范化處理的不均勻光線圖像

此時，已提取的文本區(qū)域已準(zhǔn)備好進(jìn)行分段。

分段文本

文本區(qū)域分割是將區(qū)域拆分為行和單個字符的過程。只有當(dāng)每個區(qū)域包含一個字符時，識別才可能實現(xiàn)。

使用區(qū)域形態(tài)過濾器將文本拆分為行的過程

當(dāng)文本文本行分開時，每行必須拆分為單獨的字符。

使用拆分區(qū)域得到多個字符的字符分割

接下來，提取的字符將從圖形表示形式轉(zhuǎn)換為文本表示形式。

調(diào)用OCR模型庫

通過調(diào)用OCR模型庫，使識別到的字符以文本形式與模型庫進(jìn)行比對，匹配數(shù)據(jù)最相似的模板，得出準(zhǔn)確的字符信息。

字符識別

通常來說需要選擇適當(dāng)?shù)淖址?guī)范大小，來分類字符的大小。

【來源：光虎光學(xué)內(nèi)部培訓(xùn)資料】

光虎光學(xué)專業(yè)生產(chǎn)由德國設(shè)計的工業(yè)鏡頭。

以高精度雙遠(yuǎn)心鏡頭為核心，涵蓋高性能FA定焦鏡頭、變倍鏡頭等產(chǎn)品。

可實現(xiàn)為客戶定制化研發(fā)生產(chǎn)。光虎光學(xué)還代理歐美日機(jī)器視覺全系列產(chǎn)品。

如面陣與線掃工業(yè)相機(jī)、智能相機(jī)、3D相機(jī)、紅外與紫外相機(jī)、光源、圖像采集卡、機(jī)器視覺軟件及其他周邊產(chǎn)品。

http://www.andrewberkeley.com/