打造隱私云計算平臺,锘崴科技想讓醫(yī)療、金融數(shù)據(jù)安全分享
在數(shù)據(jù)經(jīng)濟時代,數(shù)據(jù)對企業(yè)的意義愈發(fā)重要。不論是需要進行算法模型訓練的科技公司,還是需要依賴數(shù)據(jù)進行研發(fā)的傳統(tǒng)行業(yè)(如藥企等),都需要以數(shù)據(jù)為支撐進行業(yè)務(wù)拓展。但由于數(shù)據(jù)在使用過程中容易產(chǎn)生C端隱私被侵犯、B端數(shù)據(jù)被泄露等隱患,通過技術(shù)的手段解決數(shù)據(jù)在合法合規(guī)前提下的高效流動與使用的需求愈發(fā)迫切。
36氪最近接觸到的一家公司——锘崴科技,通過打造“锘崴信隱私云計算平臺”來實現(xiàn)讓數(shù)據(jù)在安全環(huán)境下分享、分析的效果。具體而言,這一平臺采用軟硬件加密的計算技術(shù)(如多方安全計算、同態(tài)加密、可信計算環(huán)境)、聯(lián)盟計算技術(shù)、區(qū)塊鏈溯源技術(shù)以及可定制的超融合基礎(chǔ)構(gòu)架技術(shù),在合法合規(guī)框架下保護數(shù)據(jù)所有方、數(shù)據(jù)使用方和數(shù)據(jù)監(jiān)管等方權(quán)益。解決數(shù)據(jù)在存儲、傳輸和計算全流程中的隱私保護問題,并保證計算流程的完整性和真實性。
該公司目前主要在醫(yī)療、金融等領(lǐng)域發(fā)力,其中醫(yī)療領(lǐng)域是現(xiàn)階段的重點方向。锘崴的兩位創(chuàng)始人王爽博士和鄭灝博士此前均在美國隱私計算和生物醫(yī)學信息領(lǐng)域有過豐富科研、工作經(jīng)歷。也正在這些經(jīng)歷中,王爽和鄭灝發(fā)現(xiàn)醫(yī)療領(lǐng)域中數(shù)據(jù)使用的痛點,即數(shù)據(jù)不能通暢流通——分散在各個醫(yī)院中的數(shù)據(jù)由于擔心隱私被泄露和數(shù)據(jù)所有權(quán)的丟失無法進行有效地流轉(zhuǎn)、共享和分析,這在某種程度上阻礙了精準醫(yī)學的發(fā)展。
舉例而言,目前一些醫(yī)院對大數(shù)據(jù)的安全使用訴求在于數(shù)據(jù)合規(guī)和數(shù)據(jù)協(xié)作。醫(yī)生在進行科研工作時,需要足夠的醫(yī)療數(shù)據(jù)(包括病歷樣本等)作為支撐,但由于擔心隱私泄露或不合規(guī)等風險,醫(yī)生也許無法拿到足夠多的數(shù)據(jù)。而锘崴的平臺可以使數(shù)據(jù)“可用不可見”——即對原始數(shù)據(jù)進行加密分享和計算,只反饋客戶報告等相關(guān)結(jié)果,能幫助醫(yī)生在使用數(shù)據(jù)的同時也打消數(shù)據(jù)分享方的安全、隱私顧慮。
具體到落地層面,醫(yī)療大數(shù)據(jù)數(shù)據(jù)種類、數(shù)據(jù)格式各不相同。醫(yī)療數(shù)據(jù)可大致分為三種,分別是基因組學數(shù)據(jù)、圖像數(shù)據(jù)和臨床學數(shù)據(jù)?;蚪M學和圖像學數(shù)據(jù)本身就是比較標準的格式,該公司系統(tǒng)可以支持相關(guān)格式的接入和分析。而臨床學數(shù)據(jù)需要客戶按照國際相關(guān)標準模型做調(diào)整處理,然后再接入系統(tǒng)。在實際情況下一家一家做地推,請客戶進行數(shù)據(jù)的標準化并不現(xiàn)實,所以锘崴選擇和醫(yī)療集團國家隊合作,這些機構(gòu)本身擁有牌照,并且已經(jīng)采用相關(guān)數(shù)據(jù)格式標準,锘崴可以較順利地將數(shù)據(jù)接入系統(tǒng)中。醫(yī)療集團在選擇技術(shù)提供方時,則主要從計算方法和數(shù)據(jù)承載量等維度考量投標企業(yè)的技術(shù)水準。
此外,要真正落地及使用,除了技術(shù)具有可用性、可靠性,產(chǎn)品也需具有易用性。比如在商業(yè)應(yīng)用場景中,客戶不一定都是做過專門訓練的醫(yī)生或科研人才,锘崴的方式是給不同背景的客戶提供一套簡單的操作系統(tǒng),客戶只需要將數(shù)據(jù)接入系統(tǒng)中,通過可視化界面進行操作,選擇自己需要的可視化方案并最終形成一個數(shù)據(jù)報告。在軟件層面之外,锘崴目前還在開發(fā)和測試相關(guān)硬件系統(tǒng),這些硬件會通過協(xié)處理器的形式和現(xiàn)有系統(tǒng)結(jié)合,提供更高效的隱私保護計算效果。在迭代完成后會作為下一代整體解決方案的一部分提供給客戶。
在大數(shù)據(jù)隱私領(lǐng)域,有兩種傳統(tǒng)安全計算方式較為常見,包括提供安全屋沙箱、提供數(shù)據(jù)脫敏手段。由于前者采取的隔離手段仍需管理員或用戶參與其中,后者通過消除敏感字段的方式仍無法完全避免敏感信息泄露,所以目前這兩種方式都無法保證數(shù)據(jù)的絕對安全。
锘巍這套系統(tǒng)在底層技術(shù)不變的情況下也可賦能給其他領(lǐng)域,比如金融行業(yè)的客戶會有數(shù)據(jù)模型協(xié)作需求——一些私募基金可以把交易策略提供給锘崴方加密,加密后的模型可用來賦能第三方(如客戶等),而策略擁有方既不必擔心交易策略的泄露,也可以通過其他合作方式產(chǎn)生利潤。
在商業(yè)模式方面,锘崴目前的規(guī)劃是和數(shù)據(jù)資源型伙伴進行合作,由锘崴提供技術(shù)服務(wù),對方提供相應(yīng)的數(shù)據(jù)、客戶資源,雙方共同挖掘市場,一起進行利潤分配。未來也可能對其他客戶探索抽成、分潤等商業(yè)模式。
要實現(xiàn)“讓數(shù)據(jù)可用不可見”的目的,在技術(shù)上需要算法和工程能力的雙重加持。團隊認為,團隊創(chuàng)始人此前通過在美國創(chuàng)辦的全球性隱私安全計算比賽的工作,充分深入的了解該領(lǐng)域不同算法的優(yōu)勢和劣勢,能將不同種類的算法組合成高性能的混合性安全計算解決方案。并且其方案此前已部署在美國西海岸一些醫(yī)院中經(jīng)受壓力測試,這為之后的商業(yè)落地提供了前提。
锘崴科技認為,公司所在的隱私計算其未來的行業(yè)壁壘在于數(shù)據(jù)網(wǎng)絡(luò)。目前公司先通過算法壁壘和行業(yè)經(jīng)驗?zāi)玫娇蛻艉蛿?shù)據(jù)源,在應(yīng)用中逐步形成自己的數(shù)據(jù)索引平臺,“比如,我們平臺的索引最終會在隱私保護的前提下幫助藥廠精準定位一個省市的某家醫(yī)院是否能提供新藥開發(fā)需要的數(shù)據(jù)或某個大數(shù)據(jù)公司是否可以提供某家銀行需要做征信的需求,并且平臺在提供檢索服務(wù)后可以進一步無縫的支持后續(xù)的隱私計算需求?!蓖跛榻B。并且,由于要提供數(shù)據(jù)索引,锘崴在系統(tǒng)中會根據(jù)數(shù)據(jù)的質(zhì)量、可用性打分、提供數(shù)據(jù)標價。如果數(shù)據(jù)的質(zhì)量越好,那么相應(yīng)地可用性越高,也更有機會參與進更重要的研究中,數(shù)據(jù)方得到數(shù)據(jù)轉(zhuǎn)化價值也會更高。同時,一些數(shù)據(jù)提供方也可以根據(jù)數(shù)據(jù)使用的目的性持續(xù)優(yōu)化數(shù)據(jù),形成良性循環(huán)從而提高整個業(yè)內(nèi)的數(shù)據(jù)質(zhì)量。
目前業(yè)內(nèi)針對隱私計算開展業(yè)務(wù)的還有華控清交、數(shù)牘科技等公司。其中華控清交的團隊來自清華大學,主要研究、開發(fā)和營運基于現(xiàn)代密碼學和博弈論的大數(shù)據(jù)安全融合技術(shù)、標準和平臺。該公司目前的主要產(chǎn)品是PrivPy 標準平臺,能滿足廣泛用戶群體保護多方數(shù)據(jù)隱私且實現(xiàn)協(xié)同計算的需求。數(shù)牘科技通過數(shù)據(jù)科學與工程、密碼學(多方安全計算、差分隱私等)、聯(lián)邦學習等技術(shù),幫助企業(yè)之間進行安全隱私的數(shù)據(jù)協(xié)作,其創(chuàng)始人宋一民曾就職于Facebook Ads。