全面盤點OCR行業發展趨勢,國內首部OCR白皮書發布

中新網9月29日電 28日,在工信部、北京市人民政府、國際電信聯盟ITU-T指導的2020 AIIA人工智能開發者大會上,主辦方正式發布了首屆AIIA人工智能開發者大會。國內智能文本識別(OCR)能力評估及應用白皮書。白皮書從OCR發展背景、技術演進、產業發展現狀、技術標準化、發展趨勢等多個維度對當前國內OCR行業進行了詳細梳理,全面推動OCR技術產業化加速落地和可持續發展。

OCR是光學字符識別(Optical Character Recognition)的縮寫,指利用機器將圖像中的手寫或打印文本轉換為計算機可以直接處理的格式。作為計算機視覺領域的一個重要分支,OCR的典型應用是通過圖像文本識別實現信息錄入。同時,由于文本和符號包含豐富的語義信息,基于 OCR 的文本信息提取和后續分析可以幫助機器更好地理解圖像。

據了解,這份白皮書是由中國信息通信研究院、中國人工智能產業發展聯盟、騰訊云AI計算機視覺中心、騰訊安全戰略研究部、騰訊優圖實驗室聯合起草。

新基建帶來新機遇,OCR技術發展三大趨勢

借助人工智能技術,近年來OCR性能的不斷提升,為工業數字化催生的更復雜的OCR應用場景提供了堅實的支撐。同時,涵蓋手機、電子產品、云服務等更多元化的服務載體,進一步加速了OCR的普及,不斷滲透到社會生產生活的更多領域。

尤其是今年4月,國家發改委明確將人工智能基礎設施列入“新基建”范圍。作為人工智能應用中最“本土化”、更成熟的商業推廣領域,OCR行業無疑處于“新基建”的大背景下。將迎來新的發展機遇,相關技術也將迎來新一輪變革。

報告指出,OCR技術未來發展的三大方向主要包括一體化的端到端OCR模型、兼具高性能高效率的OCR、從感知到認知的智能OCR。

具體來說,構建一體化的端到端網絡,同時訓練文本檢測識別將成為OCR技術發展的重要趨勢之一。端到端的網絡設計不僅可以減少重復計算,還可以提高特征質量,促進任務性能的提高。同時,大量的 OCR 應用程序需要在資源受限的移動設備上運行。目前的手機OCR算法大多犧牲了一定的算法精度來換取運行速度。為移動設備設計的兼顧性能和效率的輕量級OCR模型將是未來發展的重要方向。

另外,從智能OCR從感知到認知的角度來看,OCR技術通常從計算機視覺領域入手。未來,它將與自然語言處理技術、知識圖譜等更廣泛的領域進行交叉集成,通過對語義和知識的深度挖掘來提高OCR性能是一個重要趨勢。此外,在 OCR 中引入強化學習和元學習等新的學習范式,讓機器學習如何自行識別文本也將成為研究熱點。

市場規模達133.81億美元,OCR成科技巨頭標配

目前,OCR技術已經在金融、保險、醫療、交通、教育等多個行業得到了深入成熟的應用。未來,隨著傳統行業的數字化轉型,OCR的應用范圍和場景將進一步擴大,市場規模將進一步擴大。有權威機構預測,2025年全球OCR市場規模將達到133.81億美元。

早期,受技術發展水平的限制,OCR廠商通常從具體應用切入,比如車牌識別系統等,形成了一系列的專用設備。近年來,越來越多的終端設備和應用嵌入了OCR技術,逐步形成了從基礎設施、基礎能力到終端應用的完整產業鏈生態,也衍生出卡片、票據OCR能力等一系列細分服務各個行業以一種結合的方式。

OCR產業生態圖

不難看出,OCR技術作為一項基礎能力正在逐漸“下沉”,為不同的上層業務應用提供底層技術支撐。以騰訊云為代表的科技巨頭和云計算廠商正在加速OCR的部署。他們在滿足自身內部業務需求的同時,不斷向外界開放先進的OCR能力。 OCR 已成為科技巨頭的標準能力。

多行業場景成熟落地,首次發布OCR評測標準

在具體應用層面,目前卡片識別、票據識別等標準場景文本識別已經比較成熟,手寫文本識別在教育、物流等行業的應用也在不斷擴大。 OCR技術及其在復雜動態場景中的應用成為近兩年的熱門研究方向,例如在無人駕駛、機器人等場景中使用OCR識別出現在視野中的文字。

在此次發布的白皮書中,騰訊云也公布了其多項OCR領域的典型落地案例。

采用騰訊云和騰訊優圖實驗室提供的身份證OCR技術,豐巢快遞柜對身份證字段的識別準確率達到99%,大大提高了用戶郵寄和取件的效率;寧波銀行利用騰訊云結合騰訊優圖實驗室打造的智能票據OCR解決方案,將識別領域準確率提升至90%以上,更好地滿足銀行業務場景需求。搜狗廣告圖片文字審核利用OCR產品和服務,幫助客戶自動識別海量圖文內容,高效識別廣告圖片中的違法內容,降低客戶業務違規風險。

值得一提的是,為全面降低OCR相關領域的應用門檻,避免出現魚龍混雜局面,白皮書也首次公布OCR評測標準和規范。

今年4月,中國人工智能產業發展聯盟制定了《OCR服務智能分類技術要求及評價辦法》,規定了OCR服務在功能、性能、安全等方面的技術要求和評價辦法7月,國際電信聯盟ITU-T SG16組成功建立OCR業務要求和評估方法,標志著深度學習背景下的OCR評估方法逐漸被國際標準組織所接受。

其中,騰訊深度參與推動OCR領域的技術創新和標準制定,幫助企業客觀、全面地評估不同的OCR服務能力。目前,騰訊云在中國人工智能產業發展聯盟的指導下開發的天鑒OCR服務引擎自動評測平臺,不僅可以為OCR技術供應商提供技術測試服務,還可以發布OCR技術或產品的測試結果,因此為需求者提供技術支持。為選擇提供客觀公正的依據。

來源:中國新聞網