近日,中國平安旗下平安產(chǎn)險人工智能團隊在ICDAR(國際文檔分析與識別大會)上的國際票據(jù)掃描件文字識別和信息提取(SROIE)大賽中脫穎而出,擊敗了國內(nèi)外100多家參賽單位和隊伍,綜合檢測識別技術(shù)位列榜單第一位,榮獲世界第一。
ICDAR專注于文本領(lǐng)域的識別與應用,每兩年會舉辦一次各種文檔的識別競賽,至今吸引了89個國家的3500多支隊伍參與,Google、Microsoft、Amazon、 Facebook、北京大學、中國科學技術(shù)大學、騰訊、搜狗等均曾參與其中,具有OCR(智能單證識別)領(lǐng)域的奧斯卡盛會之稱。
SROIE大賽是由ICDAR主辦的國際頂級賽事,是目前OCR技術(shù)領(lǐng)域全球最具挑戰(zhàn)性的比賽。SROIE比賽在對購物小票做文本檢測和文本識別的基礎(chǔ)上還加入了極具挑戰(zhàn)的“關(guān)鍵信息抽取” 任務,包括“商店名稱”“商店地址”“購物物品”和“總價”4個信息的提取。這需要充分理解文檔、證件和小票等內(nèi)容,定位識別并將所需要的關(guān)鍵信息提取出來,相比常規(guī)的OCR具有更高準確度的要求。
本次比賽數(shù)據(jù)使用了真實的購物小票,票面質(zhì)量惡劣、格式不統(tǒng)一,是最貼近真實業(yè)務場景的一次,難度相當高。在本次比賽中,平安產(chǎn)險從檢測到文字識別到最后“關(guān)鍵信息抽取識別”的綜合能力比拼中力壓群雄,奪得第一,超過了眾多人工智能領(lǐng)先企業(yè)。
平安產(chǎn)險相關(guān)負責人介紹,在全面線上化、自動化、數(shù)據(jù)化轉(zhuǎn)型的過程中,公司眾多業(yè)務場景都需要實現(xiàn)各種單證識別和信息提取,而OCR技術(shù)是關(guān)鍵。目前,OCR技術(shù)已經(jīng)在產(chǎn)險承保、理賠等環(huán)節(jié)被廣泛應用,包括身份證、銀行卡、駕駛證、行駛證、新車合格證、發(fā)票等10余種業(yè)務場景,年總使用量超過兩千萬,還有數(shù)十種類的單證識別正在研發(fā)應用中。
在中國平安“金融+科技”“金融+生態(tài)”的戰(zhàn)略指引下,平安產(chǎn)險加大科技的投入,強化智慧化經(jīng)營。目前,平安產(chǎn)險的科技人才近千人,人工智能團隊70余人。基于人工智能等核心科技,平安產(chǎn)險已打造出智能機器人、OCR智能單證識別、IFD智能風控反欺詐平臺、KYD駕駛風險預測、營銷大腦、AI開放平臺等六大創(chuàng)新產(chǎn)品。未來,平安產(chǎn)險將持續(xù)探索AI技術(shù)的場景化落地應用,加速向科技轉(zhuǎn)型。