00
引 言
近年來,數字化浪潮蓬勃興起,數據作為基礎戰略資源和關鍵生產要素的地位日益凸顯。根據歐盟估測,2020年歐洲個人數據產生的價值占國內生產總值的8%。此外,根據國際數據公司(International Data Corporation,IDC)的報道我國數據體量已超全球總量的1/5并正處于持續增長階段,數據紅利將持續推動我國數字經濟的向好發展。然而,在人工智能、物聯網、移動互聯網、云計算和5G等新興技術的驅動下,數據的流通與變現使得數據更容易脫離控制,并出現非法濫用的情況。數據安全問題日益凸顯,日益增長的隱私泄露事件更是為我國敲響了警鐘。
為解決數據的隱私安全問題,同時發揮數據流動與數據增值的能力,一系列隱私計算技術被提出。安全多方計算(Secure Multiparty Computation,MPC)無疑是其中的佼佼者。在經歷了40年的理論研究之后,近幾年來MPC被大量應用于金融、政務、醫療和互聯網等行業領域的試點建設中,顯示良好的應用前景,然而從理論到實踐仍有頗多問題亟待解決。本文就MPC的落地應用性進行綜合研究,在梳理MPC技術基礎上,提出MPC技術架構和實現路徑,并對行業應用進行歸分析,最后從應用推廣層面給出建議和下一步規劃,助力MPC的規模化應用與發展。
01
數據安全與隱私計算
1.1 數據安全法律政策背景
大數據時代,互聯網經濟的本質更趨向于圍繞用戶創造價值。而實踐中,濫用數據、損害數據主體權益的現象時有發生。數據安全,法律先行。越來越多的國家以頂層立法的形式規范數據的安全應用,平衡數據保護與數據流通的關系。例如,歐盟出臺的《通用數據保護條例》(General Data Protection Regulation,GDPR)以及美國簽發的《加利福尼亞州消費者隱私保護法案》(California Consumer Privacy Act,CCPA)都是數據安全立法的典范。我國高度重視數據安全,先后頒布了《網絡安全法》《密碼法》頂層律法,并持續推動“等保”“密評”系列保障工作。2021年6月10日,我國頒布《數據安全法》,自2021年9月1日起施行,顯示出了我國數據安全治理的決心。
1.2 隱私計算
隱私計算是解決數據隱私保護與數據價值流通的系列技術的統稱,其目標是“數據可用不可見”。隱私計算主要涵蓋4類技術路線:可信執行環境(Trusted Execution Environment,TEE)、差分隱私(Differential Privacy,DP)、聯邦學習(Federated Learning,FL)以及MPC。
TEE使用硬件隔離技術構建出安全可信區域,加密后的數據在此區域內運算。若無密鑰授權,即使操作系統也無法訪問其中的數據。TEE的安全性主要依賴于硬件實現,比較典型的方案為Intel SGX以及ARM Trust-Zone。
DP技術的基本思想是在數據中增加噪聲以達到數據混淆不可區分的目的,主要應用于數據結果的隱私保護。DP在提供隱私安全的同時,會一定程度影響數據的實用性。
FL是谷歌公司在2014年針對數據孤島提出的分布式機器學習方法。最初的FL主要是基于“數據不出域,模型跑路”的思想實現聯合建模,然而模型參數并未得到充分保護,存在隱私泄露風險。后續研究者提出一系列結合DP、MPC的FL安全增強方案,以實現隱私性和實用性的平衡。
MPC是一種在參與方不共享各自數據且沒有可信第3方的情況下安全地計算約定函數的密碼學技術。該技術具備高安全性、多場景適用性的特點,同時擁有實用性和可擴展性的優勢,具有非常高的研究熱度和應用價值。本文將重點分析MPC的技術特點和架構思想,提出以MPC構建隱私計算體系的實踐之路。
02
MPC技術架構
2.1 MPC密碼技術體系
1982年,MPC由清華大學姚期智院士基于百萬富翁問題提出。MPC使多個參與方能夠以一種安全的方式正確執行分布式計算任務。具體來說,圖片個參與方圖片希望利用各自的秘密輸入共同計算圖片元功能函數,元功能函數通常是一個隨機函數圖片,每個參與方圖片,持有秘密輸入圖片,計算完成得到輸出圖片。且每個參與方除了自己的輸入和輸出以及由其可以推出的信息外得不到任何額外信息。
如圖1所示,MPC涵蓋無中心、隱私安全以及數據價值3方面核心要求。去中心化是MPC區別于傳統集中式計算的核心,數據隱私是MPC的安全目標,數據價值則是MPC能力交付的關鍵。
圖片
圖1 MPC核心要求
如圖2所示,MPC是一系列密碼技術的體系化組合,主要涵蓋密碼資源供給、密碼學基礎、密碼應用3個層面。和傳統的密碼系統類似,MPC的密碼底層資源也包括密碼芯片、板卡、整機、軟件、系統和云服務等多種形態密碼產品。MPC密碼學基礎在傳統的對稱密碼與公鑰基礎設施(Public Key Infrastructure,PKI)等技術基礎上,拓展了基于標識的密碼系統(Identity-Based Cryptograph,IBC)以及無證書公鑰密碼體制(Certificateless Public Key Cryptography,CL-PKC)等技術。MPC作為一門前沿密碼技術,面向不同應用場景主要提供秘密分享、同態加密、混淆電路以及定制技術等4類技術方案或組合。
表1對4種技術方案進行了對比和總結。總的來說,秘密分享技術應用最為廣泛,適用于所有MPC場景,這也可以從絕大多數MPC產品都支持秘密分享這一事實進行佐證。同態加密隨著算法的逐漸成熟,未來將會有更廣闊的應用空間。混淆電路技術多用于布爾運算場景。針對特定場景的定制技術也有較多應用案例。
表1 不同MPC技術比較
圖片
圖片
圖2 MPC密碼技術體系
2.2 MPC平臺體系架構
以MPC技術為核心構建的隱私計算產品,往往稱為MPC平臺,參考框架如圖3所示。MPC平臺是以密碼為核心的隱私安全產品,合規是其最基本的要求,因此它應當遵循相關法律法規,并滿足系列標準要求。MPC技術平臺支持兩種技術架構。其一是MPC直接貫通平臺的方式:首先采用MPC協議、MPC編譯器、MPC應用適配構建MPC運算模塊;其次通過MPC運算模塊支撐上層的通用運算和機器學習運算;最后實現隱私求交、隱私統計和聯合建模等隱私計算功能。其二是以MPC增強FL的方式構建平臺:首先在底層構建FL運算模塊,并使用MPC對其進行安全增強;其次通過FL運算模塊支撐上層的機器學習算法;最后實現機器學習類的隱私計算功能。
圖片
圖3 MPC平臺體系框架
從產品的角度看,MPC平臺是涉及多個節點的分布式計算平臺,至少包含6類角色:任務發起方、調度方、算法提供方、數據提供方、結果使用方以及計算方。角色之間的邏輯視圖關系如圖4所示。可以看出,一個節點可以包括多種角色,如某節點既可能是數據提供方,也可能是計算方;多個節點可以組成同一個角色,如多個節點以集群的方式成為一個計算方。
圖片
圖4 MPC平臺邏輯
2.3 MPC平臺產品化思路
近年來,MPC理論研究不斷推陳出新,取得進步;工業上MPC產業初見規模。如何利用開放的MPC成果,構建MPC平臺是值得思考的問題。
通過研究分析,同時結合產業情況,本文提出如圖5所示的兩種產品化思路。
(1)自底向上。這是密碼工程師的視角。具體的是以底層密碼學原語為基石,一步步自底向上構建密碼協議、密碼應用及平臺產品。此種方式安全強度得到充分控制,可以達到設定的安全目標,但通常情況下產品周期較長,可能存在交付問題。
(2)自頂向下。這是軟件工程師的視角。具體的是先選擇平臺框架,后續工作主要為基于平臺框架的應用開發,同時兼顧其中的MPC技術的應用和優化。此種方式適合快速工程實現,不過隨著產品的應用發展,會以安全補丁的形式持續增強安全性。
兩種方式沒有絕對的優劣,在具體的工業實現中,應當根據實際場景及安全強度要求選擇適用的方法。
03
MPC應用
3.1 政務應用
政務領域是MPC的主戰場。主要包括政務數據公開共享、大數據交易兩類場景。
政務數據屬于公共資源,其基本屬性就決定了數據公開、共享等性質。傳統的數據共享交換方式仍然存在數據出域不受控等風險,實際推廣應用受到了較多阻礙。MPC突破隱私安全限制,是政務數據共享落地的有力抓手,圖6描述了MPC如何助力政務數據惠民服務。
圖片
圖6 政務大數據多方計算
大數據交易是在數據要素賦能產業升級的背景下提出的。近年來,全國多地紛紛成立大數據交易所,提供一系列數據清洗、供需撮合、法律咨詢和價值評估等市場化專業服務,MPC便是其底層核心技術之一。
3.2 金融應用
金融是數據密集型行業,MPC需求最為迫切。事實上,MPC最好的商業機會確實來自于金融領域。MPC等隱私計算技術正在重構金融3大核心業務:營銷、風控、反欺詐。
圖7給出了MPC在金融風控場景中的應用示例。在進行貸款業務時,往往單一金融機構無法形成用戶客群的完整畫像,很難綜合評判用戶信用。此時便需要多家金融機構,如各大商業銀行、保險公司和貸款機構等,共同聯合刻畫用戶行為和決策風險。
3.3 醫療應用
MPC在醫療行業存在巨大潛在價值,但依然面臨著艱巨的挑戰。由于醫療數據天然不可能做成集中式公共數據集且消費邊界清晰,因此MPC機會頗多。但醫療行業面臨數據整合難、政策限制多和法律不明確等系列困難,MPC難落地。
圖8給出了MPC在大數據醫療中的應用示意。結合MPC、醫療大數據、互聯網數據,構建醫療人工智能系統,能夠實現精準流調排查、自主醫療診斷和精準藥物研制等目標。在后疫情時代,基于MPC的醫療大數據應用或將成為快速發展的市場。
3.4 創新應用
信息技術的飛速發展拓展了MPC的應用領域,MPC在和區塊鏈、物聯網、邊緣計算和5G等新興技術的碰撞與融合中,創造了更多的創新應用模式。圖9給出了萬物互聯場景下的MPC示例。安全計算節點不再局限于傳統的機構或單位,而是向邊緣側、終端側下沉,形成了覆蓋端、邊、云的協同計算資源池,實現了更廣義的隱私安全。
04
MPC發展建議
4.1 當前面臨的困難
當前,MPC面臨的困難主要體現在以下3個方面。
(1)上位法律形成,但政策引領不足。我國已頒布網絡安全法、數據安全法、密碼法等系列上位律法,能夠從頂層牽引MPC等隱私計算的落地應用,指導意義巨大。然而,行業規范、應用法規等系列下位政策并未及時跟進,總體上存在責任邊界不清晰、應用要求不明確等現狀,導致用戶不敢用、市場不好推等困難。
(2)技術百花齊放,但標準化程度低。盡管金融等行業開始涉足標準化等工作,但標準化程度仍然非常欠缺。由于MPC技術的多樣性和碎片化,客觀上導致沒有一個技術可以解決所有隱私計算問題,而且相互之間很難互通,數據孤島問題轉為技術孤島問題。
(3)應用前景廣闊,但局面并未打開。目前,MPC項目仍然是研究和試點,處于探索階段,政府、銀行等機構還在論證安全性、可行性及適用性,未來還有一段漫長的推廣之路。
4.2 發展建議
本文對MPC的發展和應用提出以下建議:
(1)健全政策配套,補齊行業規范,明確應用要求;
(2)聚合產業生態,建立標準化聯盟,打破技術孤島;
(3)加大技術突破,構建成熟商用的能力體系,提升應用體驗;
(4)多元行業并舉,在政務、金融、醫療等行業樹立標桿并規模化推廣,同時打通企業數字化、智慧城市等應用場景,全面做大MPC應用規模。
05
結 語
本文對MPC的技術與應用進行梳理,分析數據安全政策背景及隱私計算需求,重點針對MPC研究技術體系、架構體系以及產品設計體系,提出MPC在政務、金融、醫療、創新領域的應用方案,基于當前現狀提出未來發展建議。本文提出的研究成果具備總體性、系統性、實用性,能夠為未來MPC的發展提供支撐。