永久免费a∨片在线观看_日韩人妻精品无码一区二区三区_精品久久久久久无码人妻热_日日噜噜夜夜狠狠久久蜜桃

首頁
核心技術
產品體系
解決方案
動態資訊
關于我們
搜索
首頁 動態資訊 公司新聞

以數據驅動模型,可訓練、可現場應用的賽博學習平臺

來源(yuan):易道博識 發布時間:2022-11-18

日前,由江蘇省支付清算(suan)服務協(xie)會、山(shan)東省支付清算(suan)協(xie)會支持的(de)2022金(jin)融科(ke)技創新發展論(lun)壇在(zai)遵義成功召(zhao)開。易道博(bo)識(shi)CTO康鐵鋼先生受邀參(can)會,與來自銀(yin)行(xing)、保險、證券(quan)等行(xing)業的(de)100余(yu)位(wei)行(xing)業專家,分(fen)享(xiang)以數據驅動模型,可(ke)訓(xun)練、可(ke)現場(chang)應用的(de)賽博(bo)深(shen)度學習平臺在(zai)行(xing)業中的(de)應用創新。



行業痛點繁多,長尾憑證(zheng)痛點難除


隨著金(jin)融業(ye)務(wu)的(de)發展,越來(lai)越多(duo)的(de)業(ye)務(wu)線中涉及的(de)紙質憑證影像需要(yao)用到(dao)OCR自動處(chu)理(li),來(lai)進一步(bu)提升業(ye)務(wu)辦理(li)的(de)效率。從企業內(nei)部的數據類型來(lai)看(kan),這些憑證影像按照格式可以分為兩(liang)類:一類是固定格式的憑證(戶口本、港澳臺(tai)身(shen)份(fen)證、外國人(ren)永久居留證等),占整體90%以上(shang);一類是非固定格式的憑證(銀行流(liu)水等)。這些憑證(zheng)存在以下特點:

1、種(zhong)類(lei)多:內在(zai)各個(ge)業(ye)務受理過程(cheng)中涉(she)及到(dao)的憑證都在(zai)百種以上,甚至多達幾百種;

2、更新頻繁(fan):不少(shao)憑證會隨著業務需求或者監(jian)管制度的變(bian)化而調整格式;

3、長尾(wei)憑證(zheng)“雞肋”:存在很多使用(yong)頻(pin)率(lv)低,但(dan)總體數量(liang)大的憑(ping)證(zheng),這些憑(ping)證(zheng)單獨采(cai)購識別的價值不大但(dan)又無法解決(jue);

4、數據安(an)全:大多數情(qing)況下(xia),隱私數據是無(wu)法(fa)對(dui)外的,如何在這種(zhong)情(qing)況下(xia)做模(mo)型訓練是客(ke)觀需要面對(dui)的問題;


基于此類特點,對憑證的OCR識別工作就特別復雜。目前針對與此的解決方案都各有缺陷:要么持續投入(ru)高,需要廠商(shang)就每一種(zhong)憑證進行定制化開發,要么需要采購廠商(shang)底層能(neng)力(li),而且需要OCR專(zhuan)家團隊的支持,投入(ru)成本更高。因此,行業迫(po)切需要一(yi)個(ge)能夠減少后續投(tou)入,自主可控的解(jie)決(jue)方案(an)。


自我數據閉環,賽博自成有機整體


賽博(bo)學習平臺是易道博(bo)識基(ji)于深度學習自主研發的一站式(shi)機器學習訓練平臺。賽(sai)博平臺集(ji)數據管(guan)理、數據標(biao)注、模(mo)型訓練和(he)模(mo)型應用(yong)于一(yi)身,提供(gong)及時、現場化的數據驅動模(mo)型應用(yong)解決方案。



論壇(tan)上,易道博(bo)識CTO康鐵(tie)鋼介紹道:“賽(sai)博(bo)平臺充分利用了現有的經過(guo)(guo)長(chang)期迭代的基礎模型(xing)能(neng)力,包括圖像、OCR和(he)NLP等,在少量(liang)樣(yang)本的驅動下,利用遷移學習和(he)小樣(yang)本學習等技術,高效(xiao)地完成(cheng)增(zeng)量(liang)模型(xing)的訓(xun)練,生成(cheng)最優的模型(xing)文件,并通過(guo)(guo)推理(li)平臺來(lai)實現模型(xing)的快速部署與生產應用。


產(chan)品組成上(shang),賽博平(ping)(ping)(ping)(ping)臺(tai)(tai)由管理(li)中心(xin)CyberCenter、數據(ju)標注(zhu)平(ping)(ping)(ping)(ping)臺(tai)(tai) CyberData、深(shen)度(du)學(xue)習訓練平(ping)(ping)(ping)(ping)臺(tai)(tai) CyberLearning和(he)深(shen)度(du)學(xue)習推理(li)平(ping)(ping)(ping)(ping)臺(tai)(tai) CyberServing幾個子平(ping)(ping)(ping)(ping)臺(tai)(tai)組成,各(ge)子平(ping)(ping)(ping)(ping)臺(tai)(tai)依次承擔平(ping)(ping)(ping)(ping)臺(tai)(tai)管理(li)、數據(ju)管理(li)與標注(zhu)、模型(xing)訓練和(he)模型(xing)服務的功(gong)能,各(ge)個子平臺之間相互獨立又有(you)效配合,形成一個有(you)機整體(ti),從(cong)而有(you)效支撐數據驅動模型(xing)應(ying)用的(de)整體(ti)功能(neng)。


數據標注平臺(tai) CyberData


數(shu)據(ju)平臺(tai)主要功能(neng)包括數(shu)據(ju)管(guan)理(li)、數(shu)據(ju)處理(li)、樣本(ben)擴充、數(shu)據(ju)標注與采集。數(shu)據(ju)平臺(tai)內(nei)置exLabeler標注客戶端,提供強大(da)專業的CV、OCR、結構化和(he)(he)NLP任務標注功能(neng)。同時,數(shu)據(ju)平臺(tai)還支(zhi)持單人(ren)和(he)(he)團隊標注模式(shi)。


用戶(hu)可(ke)以通過exLabeler客(ke)戶(hu)端完成(cheng)樣(yang)本的(de)標注(zhu)。exLabeler支持CV、OCR、結(jie)構化和NLP等領域算(suan)法(fa)的(de)標注(zhu)。標注(zhu)完成(cheng)的(de)數據(ju)集(ji)可(ke)以直(zhi)接用于模型(xing)訓練,或進(jin)一步做后處(chu)理(li)(如圖像處(chu)理(li)、樣(yang)本擴充等),然后再用于模型(xing)訓練。


數據標注平臺 CyberData工作流程


深度學習訓練(lian)平臺 CyberLearning


訓(xun)練(lian)(lian)平(ping)(ping)臺通過(guo)自(zi)身對于訓(xun)練(lian)(lian)資源池的(de)集中管(guan)理與分配,以及與管(guan)理平(ping)(ping)臺的(de)無縫對接,可(ke)以方便地實現訓(xun)練(lian)(lian)基礎設施的(de)管(guan)理,從而減(jian)輕用(yong)戶的(de)管(guan)理維護工作。同時(shi),利用(yong)自(zi)動超參(can)搜(sou)索等技(ji)術,訓(xun)練(lian)(lian)平(ping)(ping)臺可(ke)以自(zi)動搜(sou)索到最佳(jia)性(xing)能的(de)模型。


通過分布式(shi)訓練(lian)與多(duo)框(kuang)架支持,訓練(lian)平臺可以最大(da)化利用計算(suan)資源,加速(su)模(mo)(mo)型(xing)(xing)訓練(lian)。同時,利用自動超參搜索(suo)等技術,訓練(lian)平臺可以自動搜索(suo)到(dao)(dao)最佳(jia)性(xing)能的(de)模(mo)(mo)型(xing)(xing)。最后,對于(yu)訓練(lian)所(suo)得的(de)最優模(mo)(mo)型(xing)(xing),訓練(lian)平臺支持一鍵部署到(dao)(dao)推理平臺,實現模(mo)(mo)型(xing)(xing)的(de)快速(su)應(ying)用。


深(shen)度學習訓練(lian)平臺 CyberLearning工作(zuo)流(liu)程(cheng)



深度學(xue)習推理平(ping)臺(tai) CyberServing


推(tui)理(li)(li)平(ping)臺主要完成(cheng)各種識別功(gong)能的部署。業務系統通過調用推(tui)理(li)(li)平(ping)臺提供的RESTful API提交(jiao)圖像并(bing)獲得識別結果。整體上講,推(tui)理(li)(li)平(ping)臺產品需求可分解為模(mo)型管(guan)理(li)(li)、API過程定義、識別數據查看,接(jie)口統計(ji)和其它非功(gong)能項等部分。其中模(mo)型管(guan)理(li)(li)和API管(guan)理(li)(li)模(mo)塊屬于(yu)基礎核心模(mo)塊。


推(tui)理平臺對同一模(mo)型不同版(ban)(ban)本的(de)(de)管理,并支持在(zai)(zai)模(mo)型服務(wu)(wu)(wu)中同時(shi)加載和運行多個(ge)版(ban)(ban)本的(de)(de)模(mo)型。推(tui)理平臺還支持一個(ge)API綁定(ding)多個(ge)模(mo)型服務(wu)(wu)(wu)。模(mo)型升級時(shi),用戶可以選擇先在(zai)(zai)部分服務(wu)(wu)(wu)中激(ji)活新版(ban)(ban)本的(de)(de)模(mo)型,完成測試(shi)驗證后再升級其他(ta)服務(wu)(wu)(wu)。


深度學習(xi)推理平臺(tai) CyberServing工(gong)作流(liu)程


值得一(yi)提的(de)(de)是,賽博平(ping)臺(tai)(tai)(tai)(tai)打造(zao)了數(shu)據(ju)(ju)(ju)驅動模(mo)型(xing)(xing)應(ying)用的(de)(de)閉(bi)環(huan)。推(tui)理平(ping)臺(tai)(tai)(tai)(tai)支持(chi)對于(yu)自身(shen)所產(chan)(chan)生的(de)(de)生產(chan)(chan)數(shu)據(ju)(ju)(ju)根據(ju)(ju)(ju)不同的(de)(de)條(tiao)件進行自動采(cai)集(ji)的(de)(de)功能,采(cai)集(ji)后(hou)的(de)(de)數(shu)據(ju)(ju)(ju)可以方便(bian)地(di)導入(ru)標注(zhu)平(ping)臺(tai)(tai)(tai)(tai),形成數(shu)據(ju)(ju)(ju)集(ji),并支持(chi)進一(yi)步的(de)(de)數(shu)據(ju)(ju)(ju)處(chu)理與(yu)標注(zhu)。標注(zhu)完(wan)成的(de)(de)數(shu)據(ju)(ju)(ju)集(ji)可以用于(yu)模(mo)型(xing)(xing)的(de)(de)訓練調優,從(cong)而(er)得到性(xing)能更佳(jia)的(de)(de)模(mo)型(xing)(xing),用于(yu)更新(xin)推(tui)理平(ping)臺(tai)(tai)(tai)(tai)生產(chan)(chan)模(mo)型(xing)(xing),從(cong)而(er)形成一(yi)個完(wan)整的(de)(de)數(shu)據(ju)(ju)(ju)閉(bi)環(huan)。


《國民(min)經(jing)濟和社會(hui)發(fa)展第(di)十(shi)四(si)(si)個(ge)五年(nian)(nian)規劃(hua)和2035年(nian)(nian)遠景目(mu)標綱要》提出(chu)(chu)加快數(shu)字(zi)(zi)化發(fa)展,人民(min)銀行《金融科技發(fa)展規劃(hua)(2022-2025)》中明確了“十(shi)四(si)(si)五”期間行業金融科技發(fa)展、數(shu)字(zi)(zi)化轉(zhuan)型目(mu)標,要從治理體系、業務(wu)創新(xin)、技術和數(shu)據能力建設、風險防范等(deng)多維(wei)度(du)提出(chu)(chu)重點任務(wu),推動行業數(shu)字(zi)(zi)化轉(zhuan)型落地實施。


如今,AI產業(ye)正逐(zhu)步(bu)進入低技術(shu)(shu)門檻、低部(bu)署成本、各產業(ye)深度參與(yu)雙向共(gong)建的效率化生產階段。而作為支撐AI模型開發及(ji)落地的資源型平臺,賽(sai)博平臺可(ke)在多方面提升(sheng)AI技術(shu)(shu)價值釋放。從總體(ti)上看,賽博(bo)平臺可提供較為前(qian)沿的(de)技術、符合業務場(chang)景的(de)模(mo)型生(sheng)產(chan)經驗(yan)以及打(da)包的(de)數據與算法資源。


“具(ju)體而言,一(yi)方面(mian),賽博平(ping)(ping)臺一(yi)定程(cheng)(cheng)度上解決(jue)了(le)(le)規模化多(duo)場景(jing)的(de)業務不斷衍生出的(de)長尾需求。另一(yi)方面(mian),平(ping)(ping)臺采用自動機器(qi)(qi)學(xue)習技術,很大程(cheng)(cheng)度上降低了(le)(le)機器(qi)(qi)學(xue)習的(de)編程(cheng)(cheng)工(gong)作量、節約了(le)(le)AI 開發時(shi)間(jian)、減輕了(le)(le)對專業數據科學(xue)家與算法工(gong)程(cheng)(cheng)師的(de)依賴(lai),讓缺(que)乏機器(qi)學習經驗(yan)的開發者(zhe)用(yong)上AI,加快了開發效率


“我們通(tong)過產(chan)品和服(fu)務(wu)來獲得行(xing)業(ye)認可。我們認真服(fu)務(wu)每一個客戶(hu),認真解(jie)決客戶(hu)問題。”康鐵鋼說道:“我們會(hui)專注于人工(gong)智(zhi)能領域(yu),致(zhi)力于人工(gong)智(zhi)能領域(yu)的(de)理論研究與應用開(kai)發,不斷創新(xin),為企業(ye)降(jiang)本增效,通(tong)過人工(gong)智(zhi)能提升(sheng)社(she)會(hui)的(de)運行(xing)效率。”

在線留言