在檔案管理應(yīng)用當(dāng)中,有一個(gè)大家都非常關(guān)注的功能:檔案管理系統(tǒng)搜索引擎,是否可以直接搜索PDF文件?對(duì)于這個(gè)問(wèn)題,會(huì)博通的回答是肯定的。
會(huì)博通通過(guò)專項(xiàng)開(kāi)發(fā)接口,可將百度OCR功能調(diào)用到檔案管理系統(tǒng)中,將存放于系統(tǒng)的證照、票據(jù)等圖片識(shí)別為文字,實(shí)現(xiàn)了圖片檔案的快速檢索。
使用效果如下圖。直接在會(huì)博通搜索引擎上輸入搜索文字,結(jié)果反饋除了文檔格式之外,還包括PDF等圖片格式。
OCR技術(shù)指的是,對(duì)文本資料的圖像文件,進(jìn)行分析識(shí)別處理,獲取版面信息的過(guò)程。在眾多OCR應(yīng)用當(dāng)中,基于對(duì)識(shí)別準(zhǔn)確率、場(chǎng)景覆蓋面、語(yǔ)種豐富度等因素的考量,會(huì)博通選擇了百度OCR。
在圖片文字識(shí)別上,百度OCR不僅能夠識(shí)別常規(guī)PDF文件,還能識(shí)別存在背景豐富、低亮度、低對(duì)比度、光照不均、透視變形、字號(hào)、字重、顏色不一等多重問(wèn)題的圖片,精準(zhǔn)度可以說(shuō)是非常高的。
同時(shí),百度OCR也適用于卡證驗(yàn)核、財(cái)會(huì)報(bào)銷、交通物流、教育培訓(xùn)、內(nèi)容審核等多種文字識(shí)別場(chǎng)景,滿足檔案管理的多種需求。此外,百度OCR還支持英、日、韓、法、德、意等20多種語(yǔ)種,對(duì)于多語(yǔ)言識(shí)別也不在話下。
在配置了OCR功能的會(huì)博通檔案系統(tǒng)當(dāng)中,圖片資料一經(jīng)上傳,系統(tǒng)便會(huì)分配一個(gè)后臺(tái)任務(wù),在系統(tǒng)空閑的時(shí)候,對(duì)文件進(jìn)行識(shí)別成為文本文件。 文本文件識(shí)別完成后,內(nèi)容就會(huì)自動(dòng)接入到會(huì)博通搜索平臺(tái)當(dāng)中,與搜索內(nèi)容進(jìn)行匹配,便于用戶精準(zhǔn)快速獲取包含圖片在內(nèi)的信息。
在會(huì)博通檔案管理軟件當(dāng)中,OCR功能屬于選配組件。如果您的檔案當(dāng)中存在大量的PDF、JPG等圖片資料,為方便后期檢索,我們建議您最好選配OCR功能。
如果您對(duì)于檔案全文檢索需求不大,或檔案資料以電子化的文檔為主,那么也可以暫且不配置該功能;如果您的系統(tǒng)安裝沒(méi)有配置OCR功能,但隨著業(yè)務(wù)的發(fā)展,對(duì)于圖片搜索的需求增加,那么也可以隨時(shí)聯(lián)系我們進(jìn)行系統(tǒng)升級(jí)。
圖片資料,為方便后期檢索,我們建議您最好選配OCR功能;如果您對(duì)于檔案全文檢索需求不大,或檔案資料以電子化的文檔為主,那么也可以暫且不配置該功能;如果您的系統(tǒng)安裝沒(méi)有配置OCR功能,但隨著業(yè)務(wù)的發(fā)展,對(duì)于圖片搜索的需求增加,那么也可以隨時(shí)聯(lián)系我們進(jìn)行系統(tǒng)升級(jí)。
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請(qǐng)發(fā)送郵件至 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除。