学习理财博客空间

理财鱼

您现在的位置是:理财鱼 > 理财方法 >

理财方法

36氪专访|港科大教授杨强:数据安全时代,可信联邦学习正在改变人工智能的发展逻辑

发布时间:2022-05-06 14:08理财方法 评论

这是一个隐私和数据安全比以往更受关注的时代。

人工智能技术正在各行业应用落地,随之提高的是人们对用户隐私和数据安全的关注度。用户更加关注隐私信息是否未经许可便被他人出于商业或其他目的而利用,甚至滥用。

同时,随着相关法律法规的进一步实施,已有很多互联网、金融机构等企业由于泄露用户数据而被重罚。

另一方面,国家强调探索建立安全规格的数据要素流通规则。这意味着,监管趋严背景下,机构对数据的采集、流通与应用愈发谨慎;而同时现实又在不断推动数据要素加速走向开放共享。

因此,联邦学习——作为隐私增强计算与人工智能相结合的新型技术范式,成为了解决数据安全与开放共享矛盾的一个重要技术路径。

联邦学习中,客户可以在自己的终端使用本地数据对模型进行训练,并将模型的加密参数进行上传汇总,将不同的模型更新进行融合,优化预测模型。

而2022年将成为一个新的技术分水岭——从联邦学习到可信联邦学习。

针对近两年来隐私计算和联邦学习发展和应用中面临的安全、效率等挑战,“可信联邦学习”被提出,这一范式将隐私保护、模型性能、算法效率作为核心,共同构成了更加安全可信的联邦学习。

举例来说,在一个新能源车厂的营销项目中,营销项目甲乙方两边的数据不能互传,但是又有业务合作,因此一定要在合作高效率的前提下,又保证数据安全。

这时,可信联邦算法的出现就极大地降低了数据被攻击的可能性,又能极大提高效率。同时,算法能高效防止终端有恶意用户“下毒”,使得整个系统都是可信的。

针对可信联邦学习这一新范式,香港科技大学计算机与工程系讲席教授、FATE开源社区技术指导委员会主席,可信联邦学习提出者杨强院士在接受36氪采访时表示:“现在越来越多的公司主动要求引入隐私计算的解决方案,所以可信联邦学习的商业前景的大门是开的,只不过技术的人要更加聪敏地设计平衡的方案。”

杨强表示,任何多方参与进行人工智能建模的过程,都绕不开可信联邦学习这一通用的机器学习范式。

“可信联邦学习的核心命题是结合分布式机器学习和人工智能算法,找到联合建模可信、可行及可控的解决方案,极大降低隐私计算的成本,提升隐私计算应用质量,进而推动隐私计算的加速发展。”杨强介绍。

同时,杨强认为,目前开源已成为大势所趋,成为隐私计算产业生态核心组成部分。以国内首个联邦学习开源社区FATE为例,作为向隐私计算、联邦学习开源生态中的开发者、贡献者、用户及生态伙伴建立的学习与交流平台,帮助开发人员快速实现联邦学习应用开发与部署,可通过可信联邦学习中模型的“版权保护”(FedIPR),实现数据版权的保护和结果可溯源、可审计、可解释;通过开源、开放和共享,实现普惠。

以下是36 氪等媒体与香港科技大学计算机与工程系讲席教授、可信联邦学习提出者杨强的采访实录,经编辑后发布:

媒体:与传统联邦学习相比,可信联邦学习进行了哪些拓展?其优势是如何体现的?

杨强:传统上,隐私计算更多强调“安全”,就是不可见的部分。但是在实践当中,不管是用联邦学习也好、用多方安全计算也好,还是用什么其他的安全计算范式,在利用多方数据的安全前提下建模,都离不开联邦学习的整体框架,并且一定要把“可用”提到和“安全”一样的高度。

所以问题是如何把安全效率和模型效能,就是模型的准确率和算法的效率,时间、复杂度,这三者如何做一个有机平衡。

目前,我们已经有了一些进展:理论上,我们研究了通用的多方合作的联合建模、联合使用模型的方式,发现不管是联邦学习也好、隐私计算也好、安全多方计算也好,都逃不出这样一个均衡问题。我们把这个问题通俗易懂地描述成「没有免费的午餐」,就是不可能有乌托邦式的安全,也不可能有乌托邦式的效率。在实践当中,这三者的有效平衡是对每一个算法设计者和法律设计者的考验。下一阶段,我们在隐私计算和联邦学习技术的发展上,应该对这样的平衡非常重视。

同时我们也认为,后期的管理非常重要。比方我们建立一个模型,这个模型另外一方使用。在使用过程中,万一它把模型进行二次售卖,在我不知情或者没有收益的情况下,就相当于把我的书复印了一份到其他的市场售卖一样的道理,是一个违法行为。

另外就是互通互联,我们希望各家的解决方案能够很容易地互相联通,有共用的基础模块,最后大家可以把这些模块建成我们所要的基础架构,软件架构、硬件架构,这就好像我们盖房子一样,我们有各种材料,最后把这些材料盖成我们想要的房子。因此,开源尤其重要。

开源对于安全机制也非常有效,因为大家都可以监管,在阳光下有漏洞的可能性远远小于在阴暗的角落发展出一个黑箱所可能犯的错误。所以,我们非常鼓励开源和普惠。

媒体:今年应该是深度学习的十周年,在过去十年这一波人工智能是由深度学习驱动的,您认为可信联邦学习对于以深度学习为基础的人工智能发展的逻辑,是否会带来一些改变呢?

杨强:我觉得有几个改变是非常明显的,也可以看作转折点。

第一,现在发现深度学习驱动的人工智能发展确实非常有效,因为它促进了人工智能指数型的发展。但是现在也有很多的迹象表明并没有我们想象的那么理想,其中一个重要的原因是,它在输入端并没有大家想象的那么顺畅。数据都有属主,属主有它的考虑、有它的利益、有它的隐私,因此安全性、对隐私的保护也被提出,这些都是转折点的驱动力。

第二个,在算法上,过去都是基于一个单计算中心设计的。但是当我们有了上千万的手机、有了上百万级的无人车,每一个端点都是一个计算中心。这种状态下,分布式的数据和分布式的计算,如何能够安全高效地进行人工智能的模型训练,这是过去没有考虑过的问题,这又是一个转折点。

现在看到很多大模型都能做非常复杂的工作,但是他们在实用上却少之又少,也就是说它们现在变成一个“奥运会”的比赛,并没有深入到千家万家,为什么这样,原因就在这,数据不是这样分布的,数据真正是分布式的,算法没有跟上,所以在算法层面我们是要研究一种算法。

最后,当我们有了这种分布式数据格局和伦理考虑之下,更多的不是数据在网络当中传输,是模型在传输,所以未来的世界是一个多模型世界,在多模型世界下,模型的治理、审计、合作、安全就被提出来了,在深度学习驱动的AI里面没有解决这样一个模型驱动世界的难题。

媒体:从商业化的角度来看,可信联邦学习未来的商业潜力是怎样的?

共2页: 上一页下一页

>相关《 36氪专访|港科大教授杨强:数据安全时代,可信联邦学习正在改变人工智能的发展逻辑》内容:


1、 专访倪飞:中兴今年将挑战国内手机出货增 200% 目标

理财鱼小提示:专访倪飞:中兴今年将挑战国内手机出货增 200% 目标 中兴通讯高级副总裁、中兴终端事业部总裁倪飞 接触过早期智能手机的用户来说,中兴肯定不是一个陌生的名字,毕竟“中华酷联”曾经是运营商时代的四大霸主,其中第一个“中”正是中兴。 在前不久...【继续阅读】


2、 顾医生,胸外科请多指教——顾勇教授访谈实录

理财鱼小提示:顾医生,胸外科请多指教——顾勇教授访谈实录 攻克肿瘤难题从来没有“一招鲜”。 近年来免疫疗法作为第三代抗肿瘤技术被越来越多的患者和医生所认可,但由于单一免疫治疗手段对肿瘤效果有限,目前临床中更多地被用作辅助治疗手段。而“外科+免疫”...【继续阅读】


3、 专访王石:揭秘“再创业”真相,不是再出发,已坚持近20年

最近一次是在2022年4月27日,由联合国计划开发署(UNDP)与联合国环境规划署(UNEP)联合举办的《“斯德哥尔摩+50”中国利益相关方对话会》上,王石作为中国企业的代表进行发言,“行业之间联合起来、开展合作,有利于企业更好地进行战略布局,有利于激发...【继续阅读】