易道博識(shi)掌握具有自(zi)主知識(shi)產權的核心(xin)算法,覆蓋文字(zi)識(shi)別、文檔處理(li)、圖像處理(li)、自(zi)然語言(yan)處理(li),結合領域模型(xing)學習能力(li),駕馭(yu)算力(li)資源,不斷(duan)實現數據驅動下的模型(xing)升(sheng)級,持續打造更強(qiang)大(da)的AI能力(li)。
文字識別
表格識別
印章識別
勾選識別
簽名比對
印刷、手寫、中文、英文、數字識別
基于深度學習全新DeepOCR識別流程,大幅提升識別速度及精度,
卡證類< 300ms,單張發票< 1s,A4幅面票據混掃< 3s,
漢字字符識別率> 99.5%,數字字符識別率> 99.9%,
英文字符識別率(lv)> 99.7%,手寫整行識別率(lv)> 95.2%
有(you)線(xian)、無(wu)線(xian)、列(lie)(lie)位偏(pian)移、多列(lie)(lie)重(zhong)疊(die)
多形狀、多方向、曲線行、模糊、遮擋
重疊 、小印章
符號檢測、內容識別
簽名檢測、簽名比對
版面分析:標題、段落、表格、印章、簽名、信息塊、圖表
文檔分類:固定格式、非固定格式、富格式文檔、長文本文檔
文檔抽取:實體、關系、表格、印章、簽名
文檔比對:關(guan)鍵信息、段落、表格、結構
圖像檢測、圖像分割
圖像質檢:模糊、反光、拍屏、水印、復印、篡改、變形、切邊、遠距離、遮擋
噪(zao)聲和干擾(rao)去(qu)除:圖(tu)像噪(zao)聲、水印、陰(yin)影(ying)、印章、痕(hen)跡去(qu)除
文本分析:分詞、詞向量表示、依存句法分析、命名體識別、文本相似度
語(yu)言理解:文本(ben)分類、信息(xi)抽取、情(qing)感分析
依托GPT、BERT等大規模語(yu)言(yan)模型,基于海(hai)量文本語(yu)料自(zi)動(dong)學習,具備更好的(de)文本理解和文本生成能力。
基于LayoutLM、ERNIE等大規模文檔版式預訓練模型,利用大量文檔樣本自監督學習,更好地(di)理(li)解各(ge)種文檔結(jie)構、內容和(he)語(yu)義。
以(yi)大規(gui)模(mo)(mo)語言模(mo)(mo)型(xing)(xing)和版(ban)式(shi)預訓(xun)練模(mo)(mo)型(xing)(xing)為基礎結合(he)領(ling)域數據,通過下游任務學(xue)習,快速生(sheng)成領(ling)域中小(xiao)規(gui)模(mo)(mo)模(mo)(mo)型(xing)(xing),并輸出場景AI能力。
針對本地化、私(si)有化等(deng)生產部署場(chang)景,利用知識蒸餾等(deng)模型輕量化技術(shu),解決算(suan)力局限性問(wen)題實現業務場(chang)景深度融合(he)。