近日,中國(guó)平安旗下平安產(chǎn)險(xiǎn)人工智慧團(tuán)隊(duì)在ICDAR(國(guó)際文檔分析與識(shí)別大會(huì))上的國(guó)際票據(jù)掃描件文字識(shí)別和資訊提取(SROIE)大賽中脫穎而出,擊敗了國(guó)內(nèi)外100多家參賽單位和隊(duì)伍,綜合檢測(cè)識(shí)別技術(shù)位列榜單第一位,榮獲世界第一。
ICDAR專注于文本領(lǐng)域的識(shí)別與應(yīng)用,每?jī)赡陼?huì)舉辦一次各種文檔的識(shí)別競(jìng)賽,至今吸引了89個(gè)國(guó)家的3500多支隊(duì)伍參與,Google、Microsoft、Amazon、 Facebook、北京大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、騰訊、搜狗等均曾參與其中,具有OCR(智慧單證識(shí)別)領(lǐng)域的奧斯卡盛會(huì)之稱。
SROIE大賽是由ICDAR主辦的國(guó)際頂級(jí)賽事,是目前OCR技術(shù)領(lǐng)域全球最具挑戰(zhàn)性的比賽。SROIE比賽在對(duì)購(gòu)物小票做文本檢測(cè)和文本識(shí)別的基礎(chǔ)上還加入了極具挑戰(zhàn)的“關(guān)鍵資訊抽取” 任務(wù),包括“商店名稱”“商店地址”“購(gòu)物物品”和“總價(jià)”4個(gè)資訊的提取。這需要充分理解文檔、證件和小票等內(nèi)容,定位識(shí)別並將所需要的關(guān)鍵資訊提取出來(lái),相比常規(guī)的OCR具有更高準(zhǔn)確度的要求。
本次比賽資料使用了真實(shí)的購(gòu)物小票,票面品質(zhì)惡劣、格式不統(tǒng)一,是最貼近真實(shí)業(yè)務(wù)場(chǎng)景的一次,難度相當(dāng)高。在本次比賽中,平安產(chǎn)險(xiǎn)從檢測(cè)到文字識(shí)別到最後“關(guān)鍵資訊抽取識(shí)別”的綜合能力比拼中力壓群雄,奪得第一,超過(guò)了眾多人工智慧領(lǐng)先企業(yè)。
平安產(chǎn)險(xiǎn)相關(guān)負(fù)責(zé)人介紹,在全麵線上化、自動(dòng)化、資料化轉(zhuǎn)型的過(guò)程中,公司眾多業(yè)務(wù)場(chǎng)景都需要實(shí)現(xiàn)各種單證識(shí)別和資訊提取,而OCR技術(shù)是關(guān)鍵。目前,OCR技術(shù)已經(jīng)在產(chǎn)險(xiǎn)承保、理賠等環(huán)節(jié)被廣泛應(yīng)用,包括身份證、銀行卡、駕駛證、行駛證、新車合格證、發(fā)票等10餘種業(yè)務(wù)場(chǎng)景,年總使用量超過(guò)兩千萬(wàn),還有數(shù)十種類的單證識(shí)別正在研發(fā)應(yīng)用中。
在中國(guó)平安“金融+科技”“金融+生態(tài)”的戰(zhàn)略指引下,平安產(chǎn)險(xiǎn)加大科技的投入,強(qiáng)化智慧化經(jīng)營(yíng)。目前,平安產(chǎn)險(xiǎn)的科技人才近千人,人工智慧團(tuán)隊(duì)70餘人?;度斯ぶ腔鄣群诵目萍迹桨伯a(chǎn)險(xiǎn)已打造出智慧型機(jī)器人、OCR智慧單證識(shí)別、IFD智慧風(fēng)控反欺詐平臺(tái)、KYD駕駛風(fēng)險(xiǎn)預(yù)測(cè)、行銷大腦、AI開(kāi)放平臺(tái)等六大創(chuàng)新產(chǎn)品。未來(lái),平安產(chǎn)險(xiǎn)將持續(xù)探索AI技術(shù)的場(chǎng)景化落地應(yīng)用,加速向科技轉(zhuǎn)型。