您的位置:首頁 > 宏觀 >

新基建帶來新機遇 OCR技術(shù)發(fā)展三大趨勢

2020-09-29 17:18:28 來源: 中國新聞網(wǎng)

在工業(yè)和信息化部、北京市人民政府、國際電信聯(lián)盟ITU-T指導(dǎo)的2020AIIA人工智能開發(fā)者大會上,主辦方正式發(fā)布國內(nèi)首份智能文字識別(OCR)能力

在工業(yè)和信息化部、北京市人民政府、國際電信聯(lián)盟ITU-T指導(dǎo)的2020AIIA人工智能開發(fā)者大會上,主辦方正式發(fā)布國內(nèi)首份智能文字識別(OCR)能力測評與應(yīng)用白皮書。白皮書從OCR發(fā)展背景、技術(shù)沿革、產(chǎn)業(yè)發(fā)展現(xiàn)狀、技術(shù)標(biāo)準(zhǔn)化、發(fā)展趨勢等多個維度,對當(dāng)前國內(nèi)OCR產(chǎn)業(yè)進(jìn)行了一次詳細(xì)梳理,全面助推OCR技術(shù)產(chǎn)業(yè)化加速落地及可持續(xù)發(fā)展。

OCR是光學(xué)字符識別(Optical Character Recognition)的縮寫,指利用機器將圖像中手寫體或印刷體的文本轉(zhuǎn)換為計算機可以直接處理的格式。作為計算機視覺領(lǐng)域的重要分支,OCR典型應(yīng)用是通過圖像文字識別實現(xiàn)信息錄入。同時,由于文字和符號包含豐富的語義信息,基于OCR提取文字信息繼而進(jìn)行分析,能夠幫助機器更好地理解圖像。

據(jù)了解,這份白皮書是由中國信息通信研究院、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟、騰訊云AI計算機視覺中心、騰訊安全戰(zhàn)略研究部、騰訊優(yōu)圖實驗室聯(lián)合起草。

新基建帶來新機遇,OCR技術(shù)發(fā)展三大趨勢

借助人工智能技術(shù),近年來OCR性能的不斷提升為產(chǎn)業(yè)數(shù)字化催生出的更復(fù)雜的OCR應(yīng)用場景提供了堅實支撐。同時,覆蓋手機、電子產(chǎn)品以及云服務(wù)在內(nèi)的更加多樣化的服務(wù)載體,進(jìn)一步加快了OCR的普及,持續(xù)向社會生產(chǎn)生活的更多領(lǐng)域滲透。

尤其是今年4月,發(fā)改委明確將人工智能基礎(chǔ)設(shè)施列入“新基建”范圍,作為人工智能應(yīng)用中最接“地氣”,商業(yè)推廣較為成熟的領(lǐng)域,OCR產(chǎn)業(yè)在“新基建”背景下無疑將迎來新的發(fā)展機遇,相關(guān)技術(shù)也將迎來新一輪的變革。

報告指出,OCR技術(shù)未來發(fā)展的三大方向主要包括一體化的端到端OCR模型、兼具高性能高效率的OCR、從感知到認(rèn)知的智能OCR。

詳細(xì)來說,構(gòu)建一體化的端到端網(wǎng)絡(luò),同時對文字檢測和識別進(jìn)行訓(xùn)練,將成為OCR技術(shù)發(fā)展的重要趨勢之一。端到端的網(wǎng)絡(luò)設(shè)計不僅能夠減少重復(fù)計算,又能夠提高特征的質(zhì)量,促進(jìn)任務(wù)性能的改善。同時,大量的OCR應(yīng)用需要在資源受限的移動端設(shè)備上運行,當(dāng)前移動端OCR算法大多以犧牲一定的算法精度來換取運行速度,針對移動設(shè)備設(shè)計兼顧性能和效率的輕量OCR模型將是未來發(fā)展的重要方向。

另外,從感知到認(rèn)知的智能OCR來說,OCR技術(shù)通常從計算機視覺領(lǐng)域出發(fā),未來與自然語言處理技術(shù)、知識圖譜等更廣領(lǐng)域的交叉融合,通過語義及知識的深度挖掘提升OCR性能是重要趨勢。此外,在OCR中引入強化學(xué)習(xí)和元學(xué)習(xí)等新的學(xué)習(xí)范式,讓機器自主學(xué)習(xí)如何識別文字,也將成為研究熱點。

市場規(guī)模達(dá)133.81億美元,OCR成科技巨頭標(biāo)配

目前,OCR技術(shù)已在金融、保險、醫(yī)療、交通、教育等諸多行業(yè)有了深入成熟的應(yīng)用。未來隨著傳統(tǒng)行業(yè)的數(shù)字化轉(zhuǎn)型,OCR應(yīng)用范圍和場景將進(jìn)一步擴展,市場規(guī)模將進(jìn)一步增大。有權(quán)威機構(gòu)預(yù)測,2025年全球OCR市場規(guī)模將達(dá)到133.81億美元。

早期受限于技術(shù)發(fā)展水平,OCR廠商通常從特定應(yīng)用切入,例如車牌識別系統(tǒng)等,形成了一系列專用設(shè)備。近年來,越來越多的終端設(shè)備及應(yīng)用均嵌入了OCR技術(shù),并逐漸形成了從基礎(chǔ)設(shè)施、基礎(chǔ)能力到終端應(yīng)用的完整產(chǎn)業(yè)鏈生態(tài),也衍生出了卡證、票據(jù)等一系列細(xì)分OCR能力,通過組合的方式服務(wù)于各個行業(yè)。

不難看出,OCR技術(shù)逐漸“下沉”為一項基本的能力,為上層不同的業(yè)務(wù)應(yīng)用提供底層技術(shù)支撐。以騰訊云為代表的科技巨頭和云計算廠商正在紛紛加速布局OCR,在滿足自身內(nèi)部業(yè)務(wù)需求的同時,不斷對外開放先進(jìn)的OCR能力,OCR已然成為科技巨頭能力標(biāo)配。

多行業(yè)場景成熟落地,首次發(fā)布OCR評測標(biāo)準(zhǔn)

在具體的落地應(yīng)用層面,目前卡證識別、票據(jù)識別等標(biāo)準(zhǔn)場景文字識別已經(jīng)相對成熟,手寫文字識別在教育、物流等行業(yè)的應(yīng)用也在不斷擴大。復(fù)雜動態(tài)場景下的OCR技術(shù)和應(yīng)用成為近兩年的熱門研究方向,比如在無人駕駛、機器人等場景利用OCR對視場中出現(xiàn)的文字進(jìn)行識別等。

在此次發(fā)布的白皮書中,騰訊云也公布了其多項OCR領(lǐng)域的典型落地案例。

豐巢快遞柜通過使用騰訊云聯(lián)合騰訊優(yōu)圖實驗室提供的身份證OCR技術(shù),身份證字段識別準(zhǔn)確率高達(dá)99%,大幅提高了用戶寄件、取件的效率;寧波銀行通過采用騰訊云聯(lián)合騰訊優(yōu)圖實驗室打造的智能票據(jù)OCR解決方案,將識別的字段準(zhǔn)確率提升至90%以上,更好地滿足了銀行業(yè)務(wù)場景的需要。搜狗廣告圖片文本審核借助OCR產(chǎn)品服務(wù)幫助客戶自動識別海量的圖片文字內(nèi)容,從而高效地進(jìn)行廣告圖片違法內(nèi)容識別,降低客戶業(yè)務(wù)的違規(guī)風(fēng)險。

值得一提的是,為全面降低OCR相關(guān)領(lǐng)域的應(yīng)用門檻,避免出現(xiàn)魚龍混雜局面,白皮書也首次公布OCR評測標(biāo)準(zhǔn)和規(guī)范。

今年4月,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟制定了《OCR服務(wù)智能化分級技術(shù)要求和評估方法》,規(guī)定了OCR服務(wù)在功能、性能、安全等方面的技術(shù)要求以及評估方法。7月,OCR服務(wù)要求及評估方法在國際電信聯(lián)盟ITU-T SG16組成功立項,標(biāo)志著深度學(xué)習(xí)背景下的OCR評測方法已經(jīng)逐漸被國際標(biāo)準(zhǔn)組織所接受。

在此之中,騰訊深度參與推動OCR領(lǐng)域技術(shù)革新和標(biāo)準(zhǔn)制定,幫助企業(yè)客觀、全面地評價不同OCR服務(wù)能力。目前,由中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟指導(dǎo),騰訊云開發(fā)的天鑒OCR服務(wù)引擎自動化評測平臺,不僅能夠為OCR技術(shù)供給方提供技術(shù)測試服務(wù),也將發(fā)布OCR技術(shù)或產(chǎn)品的測試結(jié)果,為需求方提供客觀公正的選型依據(jù)。

關(guān)鍵詞:

精選 導(dǎo)讀

募資55億港元萬物云啟動招股 預(yù)計9月29日登陸港交所主板

萬科9月19日早間公告,萬物云當(dāng)日啟動招股,預(yù)計發(fā)行價介乎每股47 1港元至52 7港元,預(yù)計9月29日登陸港交所主板。按發(fā)行1 167億股計算,萬

發(fā)布時間: 2022-09-20 10:39
管理   2022-09-20

公募基金二季度持股情況曝光 隱形重倉股多為高端制造業(yè)

隨著半年報披露收官,公募基金二季度持股情況曝光。截至今年二季度末,公募基金全市場基金總數(shù)為9794只,資產(chǎn)凈值為269454 75億元,同比上

發(fā)布時間: 2022-09-02 10:45
資訊   2022-09-02

又有上市公司宣布變賣房產(chǎn) 上市公司粉飾財報動作不斷

再有上市公司宣布變賣房產(chǎn)。四川長虹25日稱,擬以1 66億元的轉(zhuǎn)讓底價掛牌出售31套房產(chǎn)。今年以來,A股公司出售房產(chǎn)不斷。根據(jù)記者不完全統(tǒng)

發(fā)布時間: 2022-08-26 09:44
資訊   2022-08-26

16天12連板大港股份回復(fù)深交所關(guān)注函 股份繼續(xù)沖高

回復(fù)交易所關(guān)注函后,大港股份繼續(xù)沖高。8月11日大港股份高開,隨后震蕩走高,接近收盤時觸及漲停,報20 2元 股。值得一提的是,在7月21日

發(fā)布時間: 2022-08-12 09:56
資訊   2022-08-12

萬家基金再添第二大股東 中泰證券擬受讓11%基金股權(quán)

7月13日,中泰證券發(fā)布公告,擬受讓齊河眾鑫投資有限公司(以下簡稱齊河眾鑫)所持有的萬家基金11%的股權(quán),交易雙方共同確定本次交易的標(biāo)的資

發(fā)布時間: 2022-07-14 09:39
管理   2022-07-14

央行連續(xù)7日每天30億元逆回購 對債市影響如何?

央行12日再次開展了30億元逆回購操作,中標(biāo)利率2 10%。這已是央行連續(xù)7日每天僅進(jìn)行30億元的逆回購縮量投放,創(chuàng)下去年1月以來的最低操作規(guī)

發(fā)布時間: 2022-07-13 09:38
資訊   2022-07-13

美元指數(shù)創(chuàng)近20年新高 黃金期貨創(chuàng)出逾9個月新低

由于對美聯(lián)儲激進(jìn)加息的擔(dān)憂,美元指數(shù)11日大漲近1%創(chuàng)出近20年新高。受此影響,歐美股市、大宗商品均走弱,而黃金期貨創(chuàng)出逾9個月新低。美

發(fā)布時間: 2022-07-13 09:36
資訊   2022-07-13

美股三大股指全線下跌 納斯達(dá)克跌幅創(chuàng)下記錄以來最大跌幅

今年上半年,美股持續(xù)回落。數(shù)據(jù)顯示,道瓊斯指數(shù)上半年下跌15 3%,納斯達(dá)克綜合指數(shù)下跌29 5%,標(biāo)普500指數(shù)下跌20 6%。其中,納斯達(dá)克連續(xù)

發(fā)布時間: 2022-07-04 09:51
推薦   2022-07-04

融資客熱情回升 兩市融資余額月內(nèi)增加超344億元

近期A股走強,滬指6月以來上漲4%,融資客熱情明顯回升。數(shù)據(jù)顯示,截至6月16日,兩市融資余額1 479萬億元,月內(nèi)增加344 67億元,最近一個半

發(fā)布時間: 2022-06-20 09:41
資訊   2022-06-20

4個交易日凈買入超百億元 北向資金持續(xù)流入A股市場

北向資金凈流入態(tài)勢延續(xù)。繼6月15日凈買入133 59億元后,北向資金6月16日凈買入44 52億元。自5月27日至今,除6月13日以外,北向資金累計凈

發(fā)布時間: 2022-06-17 09:37
推薦   2022-06-17