永久免费a∨片在线观看_日韩人妻精品无码一区二区三区_精品久久久久久无码人妻热_日日噜噜夜夜狠狠久久蜜桃

首頁
核心技術
產品體系
解決方案
動態資訊
關于我們
搜索
首頁 動態資訊 公(gong)司新聞(wen)

以數據驅動模型,可訓練、可現場應用的賽博學習平臺

來源(yuan):易道博(bo)識 發(fa)布時間(jian):2022-11-18

日前,由江蘇省(sheng)支(zhi)付清算服務協(xie)(xie)會(hui)、山東省(sheng)支(zhi)付清算協(xie)(xie)會(hui)支(zhi)持的2022金融科技創新發展論壇(tan)在遵義成功召開。易道博(bo)識CTO康(kang)鐵鋼先生(sheng)受邀參會(hui),與來自銀行(xing)、保險、證(zheng)券等行(xing)業的100余位行(xing)業專家,分享以(yi)數據(ju)驅動模型(xing),可(ke)(ke)訓(xun)練、可(ke)(ke)現場應用的賽(sai)博(bo)深度學習平臺在行(xing)業中的應用創新。



行業痛點繁多,長尾(wei)憑證痛點難除


隨著金(jin)融業(ye)務(wu)的(de)發展,越來越多的(de)業(ye)務(wu)線中涉及的(de)紙質憑(ping)證影像需要用到OCR自動處理,來進(jin)一步提升(sheng)業(ye)務(wu)辦理的(de)效(xiao)率。從企業內部的數據類型(xing)來看,這些憑證影像按照格式(shi)可以分為兩類:一類是固定格式(shi)的憑證(戶口本、港澳臺身份證、外(wai)國人永久居留證等),占整體90%以上(shang);一類是非固定格式(shi)的憑證(銀行流(liu)水等)。這些憑證(zheng)存在以下特(te)點(dian):

1、種類多:內在各個業務(wu)受理過程中涉及(ji)到的(de)憑證都(dou)在百種(zhong)以上,甚至多達幾百種(zhong);

2、更新頻繁:不少憑證會隨著業務需求或者(zhe)監管制(zhi)度的(de)變化而(er)調(diao)整格式;

3、長尾憑證“雞(ji)肋”:存(cun)在(zai)很多使用頻率低,但總體數量大的憑證(zheng),這些憑證(zheng)單獨采購識(shi)別的價值不大但又無法解決;

4、數據安全:大多數(shu)情況下(xia),隱私數(shu)據(ju)是無(wu)法對外的,如何(he)在這種情況下(xia)做模型訓練是客觀需要面對的問題;


基于此類特點,對憑證的OCR識別工作就特別復雜。目前針對與此的解決方案都各有缺(que)陷:要(yao)(yao)(yao)么持(chi)續投入(ru)高(gao),需要(yao)(yao)(yao)廠商就每一種(zhong)憑證進行定制化開發,要(yao)(yao)(yao)么需要(yao)(yao)(yao)采購廠商底層能力,而且(qie)需要(yao)(yao)(yao)OCR專家團隊的支持(chi),投入(ru)成本更高(gao)。因(yin)此,行業迫切需要一個能夠減(jian)少后續(xu)投入(ru),自(zi)主可控(kong)的解決方案。


自我數據閉環,賽博自成有機整體


賽博學(xue)習平臺是易道博識基(ji)于深(shen)度(du)學(xue)習自主(zhu)研發(fa)的一站(zhan)式機(ji)器學(xue)習訓練平臺。賽博平臺集數據管理(li)、數據標注、模型(xing)訓(xun)練和模型(xing)應用于一身(shen),提供及(ji)時、現場(chang)化(hua)的(de)數據驅動模型(xing)應用解決(jue)方(fang)案。



論壇上,易道(dao)博識CTO康鐵鋼介(jie)紹道(dao):“賽博平(ping)臺充分利用了現(xian)(xian)有的經過長(chang)期迭代(dai)的基礎模型能(neng)力,包括圖像、OCR和NLP等(deng),在少量(liang)樣(yang)本的驅動(dong)下,利用遷移(yi)學習(xi)和小樣(yang)本學習(xi)等(deng)技術,高效(xiao)地完成增量(liang)模型的訓(xun)練,生成最優的模型文件(jian),并通過推理平(ping)臺來(lai)實現(xian)(xian)模型的快速部署與生產應用。


產品組成上,賽博(bo)平(ping)(ping)臺由管(guan)理(li)中心CyberCenter、數(shu)據標(biao)注平(ping)(ping)臺 CyberData、深度(du)(du)學習(xi)訓練(lian)平(ping)(ping)臺 CyberLearning和深度(du)(du)學習(xi)推(tui)理(li)平(ping)(ping)臺 CyberServing幾個子(zi)平(ping)(ping)臺組成,各子(zi)平(ping)(ping)臺依次承擔平(ping)(ping)臺管(guan)理(li)、數(shu)據管(guan)理(li)與標(biao)注、模型(xing)訓練(lian)和模型(xing)服務的功能,個子(zi)平臺之(zhi)間相互獨立又有效(xiao)配合(he),形成一個有機整體,從而有效(xiao)支撐數據驅動模(mo)型應(ying)用的整體功(gong)能。


數據標(biao)注平臺 CyberData


數(shu)據平(ping)臺(tai)主(zhu)要功能包括數(shu)據管理、數(shu)據處理、樣本擴充、數(shu)據標(biao)(biao)(biao)注與采集。數(shu)據平(ping)臺(tai)內置exLabeler標(biao)(biao)(biao)注客戶(hu)端,提(ti)供強大專業的CV、OCR、結構化和NLP任務標(biao)(biao)(biao)注功能。同時,數(shu)據平(ping)臺(tai)還(huan)支持單人和團隊標(biao)(biao)(biao)注模(mo)式。


用(yong)戶可以通過exLabeler客戶端完(wan)成樣本(ben)的標注。exLabeler支(zhi)持CV、OCR、結構化和NLP等(deng)領域(yu)算(suan)法(fa)的標注。標注完(wan)成的數據集可以直(zhi)接用(yong)于模(mo)型(xing)訓(xun)練,或進一步做后處理(li)(如圖像處理(li)、樣本(ben)擴充(chong)等(deng)),然后再用(yong)于模(mo)型(xing)訓(xun)練。


數據標注(zhu)平(ping)臺 CyberData工(gong)作流(liu)程


深(shen)度學(xue)習訓練平臺 CyberLearning


訓練平(ping)(ping)臺(tai)通(tong)過自身對于(yu)訓練資源池的集中(zhong)管(guan)理(li)(li)與分配,以及與管(guan)理(li)(li)平(ping)(ping)臺(tai)的無(wu)縫(feng)對接,可(ke)以方便地實(shi)現(xian)訓練基礎設(she)施的管(guan)理(li)(li),從(cong)而減(jian)輕用(yong)戶的管(guan)理(li)(li)維護工作(zuo)。同時,利用(yong)自動(dong)超參搜索(suo)等技術,訓練平(ping)(ping)臺(tai)可(ke)以自動(dong)搜索(suo)到最佳性能的模(mo)型。


通過分布式訓練(lian)(lian)與多框架支持,訓練(lian)(lian)平臺(tai)可(ke)以最大(da)化利用(yong)計算資源,加速模(mo)型訓練(lian)(lian)。同時(shi),利用(yong)自(zi)動超參搜索(suo)等技術,訓練(lian)(lian)平臺(tai)可(ke)以自(zi)動搜索(suo)到最佳性能(neng)的模(mo)型。最后,對于訓練(lian)(lian)所得的最優模(mo)型,訓練(lian)(lian)平臺(tai)支持一鍵部署到推(tui)理平臺(tai),實現模(mo)型的快速應用(yong)。


深度學習訓練平臺 CyberLearning工作(zuo)流程



深度學(xue)習推理平(ping)臺 CyberServing


推理(li)平(ping)臺主要完成(cheng)各(ge)種識別功能的(de)部署。業務(wu)系(xi)統(tong)通過調用推理(li)平(ping)臺提供的(de)RESTful API提交圖(tu)像(xiang)并獲(huo)得識別結果。整體上講,推理(li)平(ping)臺產品需求可分解為模型管理(li)、API過程定義、識別數據查看,接口統(tong)計和其它非功能項等部分。其中模型管理(li)和API管理(li)模塊(kuai)屬于基礎核心模塊(kuai)。


推理(li)平臺(tai)對(dui)同一(yi)模(mo)(mo)型(xing)(xing)(xing)不同版(ban)本的管理(li),并支(zhi)(zhi)持在模(mo)(mo)型(xing)(xing)(xing)服務(wu)(wu)中同時加載(zai)和運(yun)行多個(ge)版(ban)本的模(mo)(mo)型(xing)(xing)(xing)。推理(li)平臺(tai)還支(zhi)(zhi)持一(yi)個(ge)API綁定多個(ge)模(mo)(mo)型(xing)(xing)(xing)服務(wu)(wu)。模(mo)(mo)型(xing)(xing)(xing)升(sheng)級時,用(yong)戶可以選擇先在部分服務(wu)(wu)中激活新版(ban)本的模(mo)(mo)型(xing)(xing)(xing),完成測(ce)試驗證后(hou)再升(sheng)級其(qi)他服務(wu)(wu)。


深(shen)度學習(xi)推理平臺 CyberServing工(gong)作流程


值得一提的(de)是(shi),賽博(bo)平(ping)(ping)臺打造了數(shu)據(ju)驅動模(mo)型應用(yong)的(de)閉環。推理平(ping)(ping)臺支(zhi)持(chi)對于(yu)自身所產生的(de)生產數(shu)據(ju)根(gen)據(ju)不同的(de)條件進(jin)行自動采集的(de)功(gong)能(neng)(neng),采集后的(de)數(shu)據(ju)可(ke)以方便地導(dao)入(ru)標(biao)注(zhu)平(ping)(ping)臺,形成數(shu)據(ju)集,并支(zhi)持(chi)進(jin)一步的(de)數(shu)據(ju)處理與標(biao)注(zhu)。標(biao)注(zhu)完成的(de)數(shu)據(ju)集可(ke)以用(yong)于(yu)模(mo)型的(de)訓練調優,從而(er)得到性(xing)能(neng)(neng)更佳(jia)的(de)模(mo)型,用(yong)于(yu)更新推理平(ping)(ping)臺生產模(mo)型,從而(er)形成一個完整的(de)數(shu)據(ju)閉環。


《國民經濟和(he)(he)社(she)會發展第(di)十四個五(wu)年規劃和(he)(he)2035年遠(yuan)景目(mu)標(biao)綱要》提(ti)出加(jia)快數(shu)(shu)字(zi)化(hua)發展,人民銀行(xing)《金(jin)融科技發展規劃(2022-2025)》中明(ming)確了(le)“十四五(wu)”期間行(xing)業金(jin)融科技發展、數(shu)(shu)字(zi)化(hua)轉型目(mu)標(biao),要從治(zhi)理體(ti)系、業務(wu)創新(xin)、技術和(he)(he)數(shu)(shu)據能(neng)力(li)建設(she)、風險防范(fan)等多維度提(ti)出重(zhong)點(dian)任務(wu),推動行(xing)業數(shu)(shu)字(zi)化(hua)轉型落地實施(shi)。


如今,AI產(chan)(chan)業正(zheng)逐步進入低技術(shu)(shu)門檻(jian)、低部署(shu)成(cheng)本(ben)、各產(chan)(chan)業深度(du)參與雙向共建(jian)的效(xiao)率(lv)化生產(chan)(chan)階段。而作為(wei)支撐AI模型開發及落地的資源(yuan)型平(ping)臺,賽博平(ping)臺可在多方(fang)面提升(sheng)AI技術(shu)(shu)價值(zhi)釋放。從總體上看,賽(sai)博平臺(tai)可提(ti)供較為前(qian)沿的(de)技(ji)術、符合業務場景的(de)模型生(sheng)產經驗以及打(da)包的(de)數據(ju)與算(suan)法資源。


“具體(ti)而言(yan),一(yi)方面,賽博平臺一(yi)定(ding)程度上(shang)解決了(le)規模化多場(chang)景(jing)的業(ye)務不斷衍生出的長尾需求。另一(yi)方面,平臺采用自動機器學習(xi)技(ji)術,很大程度上(shang)降(jiang)低了(le)機器學習(xi)的編程工作量、節約(yue)了(le)AI 開發時(shi)間、減輕了(le)對專(zhuan)業(ye)數據科學家與算法工程師(shi)的依賴,讓缺(que)乏(fa)機器學(xue)習經(jing)驗的開發(fa)者(zhe)用上AI,加快了開發(fa)效率


“我(wo)們通過產品和服務(wu)來獲得行(xing)業認可。我(wo)們認真服務(wu)每一個客(ke)戶,認真解決客(ke)戶問題(ti)。”康鐵(tie)鋼說道:“我(wo)們會(hui)專注于人工智(zhi)能(neng)(neng)領(ling)域,致力于人工智(zhi)能(neng)(neng)領(ling)域的(de)理論研(yan)究與應用(yong)開(kai)發,不斷創新(xin),為企業降(jiang)本增效(xiao),通過人工智(zhi)能(neng)(neng)提升社(she)會(hui)的(de)運行(xing)效(xiao)率(lv)。”

在線留言