品玩10月12日訊,近日,京東數(shù)字科技集團(簡稱:京東數(shù)科)正式推出自主研發(fā)的聯(lián)邦學習平臺——Fedlearn。融合了密碼學、機器學習、區(qū)塊鏈等聯(lián)邦學習算法的Fedlearn平臺,搭建出一套安全、智能、高效的鏈接平臺,在各機構(gòu)數(shù)據(jù)不用向外傳輸?shù)那疤嵯?,通過聯(lián)合多方機構(gòu)數(shù)據(jù),實現(xiàn)共同構(gòu)建模型等多方數(shù)據(jù)聯(lián)合使用場景,獲得加成效應(yīng)。相較于傳統(tǒng)的數(shù)據(jù)共享交換方法,F(xiàn)edlearn平臺創(chuàng)新性地提出了并行加密算法、異步計算框架、創(chuàng)新聯(lián)邦學習等技術(shù)架構(gòu),在保證數(shù)據(jù)安全的前提下提升學習效率,并逐步達到融合億級規(guī)模數(shù)據(jù)的能力。
該平臺具有三大特點。第一,在數(shù)據(jù)和模型隱私方面,不同參與方之間沒有直接交換本地數(shù)據(jù)和模型參數(shù),而是交換更新參數(shù)所需的中間數(shù)值。同時,為了避免從這些中間數(shù)值中恢復數(shù)據(jù)信息,采用增加擾動對這些數(shù)值進行保護,確保了數(shù)據(jù)和模型的隱私安全。其次,在通訊方面,引入中心化數(shù)據(jù)交換的概念,使得數(shù)據(jù)的交換獨立于參與方。最后,采用異步計算框架,極大地提高了模型訓練的速度。
在京東數(shù)科開發(fā)Fedlearn平臺的過程中,也實現(xiàn)了多項業(yè)界首創(chuàng)技術(shù),譬如近期實現(xiàn)的“基于核的非線性聯(lián)邦學習算法”。在安全性上,這一方法不傳輸原始樣本及梯度信息,充分保護數(shù)據(jù)隱私;在快速性方面,這一方法使用首創(chuàng)的雙隨機梯度下降,大大提高計算速度,充分利用計算資源,通過增加擾動提高數(shù)據(jù)的安全保護。這一技術(shù)創(chuàng)新已經(jīng)形成了論文《解決多方垂直聯(lián)邦學習的安全核學習算法》(Federated Doubly Stochastic Kernel Learning for Vertically Partitioned Data),并被頂級學術(shù)會議KDD 2020接受。