FATE开源项目首位贡献者团队聊“联邦学习”：高校已加大投入深研

2019/06/14 17:20 互联网

　　作为一门新兴技术，“联邦学习”能在保证数据隐私安全基础上，实现共同建模，提升AI模型的效果。

　　这样的前景，让“联邦学习”自提出以来就受到各方关注，在国内，微众银行首席人工智能官，国际人工智能学会理事长杨强教授与微众银行AI团队为了“联邦学习”的普及与落地，率先发布了商用级开源项目 FATE(Federated AI Technology Enabler)。

　　FATE作为“联邦学习”的第一个开源社区，吸引了大量技术爱好者与高校研究团队的目光，来自香港科技大学的研究生——敬清贺，就是其中一员。作为首位贡献者，他提出了对FATE通信框架的优化建议，显著提升了通信效率。

　　对此我们采访了敬清贺，分享他与团队对FATE的研究，以及更多关于FATE的期望与设想。

　　1.国内第一个对“联邦学习”的良好实现

　　敬清贺所在的港科大研究小组，主要工作中有一大项即为对机器学习框架进行优化，也因此接触到了“联邦学习”这一新兴的概念。

　　“联邦学习”在本质上，是一种基于多方安全计算的分布式机器学习技术，参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型。作为一种共赢的机器学习方式，它能有效连接“数据孤岛”，形成一片共赢的AI大陆。行业应用中能帮助不同机构打破隔阂，联合建立AI模型，同时各方的数据都不出本地，能让用户隐私得到最好保护。

　　而FATE作为“联邦学习”的落地实现项目，受到了研究小组的重点关注。在对FATE进行深入了解并讨论后，这一群年轻的技术爱好者，跃跃欲试地开始尝试用FATE解决研究中遇到的问题，并由此对FATE开源项目提出优化建议。

　　据敬清贺讲：“接触FATE一段时日后，我们感到这是国内第一个对‘联邦学习’的良好实现”。在敬清贺及研究小组看来，FATE对 “联邦学习”概念进行了丰富和拓展，不仅包括了横向联邦学习，还包括纵向联邦学习，更将“联邦学习”和“联邦学习”相结合，从而让不同组织不同模式的数据都能实现合作。他们认为，这样的实现形式，使得FATE能为有特殊需求的机构，比如对用户隐私保护有诉求的两个公司，提供了合作的可能。

　　图：敬清贺接受采访

　　2.基于“联邦迁移学习”的FATE适用场景很广泛

　　据敬清贺设想，FATE的适用场景相当广泛，尤其是在金融、医疗等，对数据更敏感，监管也更强的场景下，FATE能够协助实现在保障数据隐私基础上的协同合作。

　　敬清贺及研究团队明白，真正的使用场景中，不可能要求两个单位训练模型时，具有相同结构的信息，这几乎是无法实现的，即使能限制整个用户都要有相同模型，那应用场景也会相当有限。因而，像FATE这样结合了纵向联邦学习，联邦迁移学习的形式，能进一步拓展适用场景。即使两个机构的模型是不一样的，它还是可以共享数据一起训练。这也是FATE最让这群年轻的研究爱好者所欣赏的点。

　　以微众银行为例，在不共享用户数据的前提下，微众银行联合多家银行建立的反洗钱模型，经过模拟测试，参与银行越多，模型的性能越高。而在医疗场景下，比如多家医院医疗影像、病例分散的情况，也可以通过联邦学习提升疾病预测准确度，提升整体诊疗水平。

　　当然，除了学习和建模能力，面对即将到来的5G时代，网络安全特别是数据安全问题也是一大要点,人人都在提给数据装上“安全阀”,从欧盟的“数据隐私保护法”GDPR(The General Data Protection Regulation),到我国国家互联网信息办公室起草的《数据安全管理办法(征求意见稿)》，数据在安全合规的前提下自由流动，成了大势所趋。

　　而在同样关注数据安全的敬清贺看来，FATE对加密算法的优化，使用同态加密而非DP等形式，也更有力地保障了数据安全，对AI的落地起到了极大的推动作用。

　　3.年轻研究团队与技术爱好者心中的FATE

　　作为FATE开源项目的首位贡献者，也是最早使用和接触FATE的一群年轻技术爱好者，敬清贺和研究团队的伙伴也对FATE具有许多构想，他们相信FATE框架语言还可以实现更多模型，从而应用在不同的场景中。而在性能上，他们也会继续深入研究，探索是否有优化的可能。

　　在采访的最后，敬清贺表示，FATE是一个非常好，非常新的东西，给AI的落地提供了更大的帮助，也让AI能应用到更多的适用场景里，对不同的领域让机器学习学出的模型更可靠，让机器学习更好地进入我们的生活。在以后，他也会持续关注着FATE，期待着自己和更多的技术爱好者，能跟随着整个框架的更新去做一些有意义东西。

　　4. 开源生态离不开有志向的年轻技术爱好者

　　据了解，敬清贺来自于香港科技大学网络系统实验室(HKUST SingLab)，香港科技大学副教授、SINGLAB主任陈凯带领学生们共同研究网络系统的设计、分析和落地。实验室这一研究可以打破人工智能设施Scale Out的通信瓶颈，提升人工智能基础设施的算力，让联邦学习技术更好、更快的落地。

　　像敬清贺这样的贡献者初现峥嵘，可以预见，在以后会有越来越多高校和年轻技术爱好者投入FATE开源项目建设中。杨强教授欣慰地表示：一个有活力的开源生态离不开有志向的青年人的贡献。

　　杨强教授指出，安全和保护隐私的智能计算是软件业当前最重要的发展方向之一。FATE已经成为维系大数据、人工智能和多方计算架构的主力军。我们欢迎更多像清贺这样的技术新秀参与其中，让这个“机器学习大数据的操作系统”生态变得越来越有活力。

　　同时，面对许多技术爱好者及开发者所关心的联邦学习走向，以及这门技术的未来发展等问题，杨强教授讲到，“联邦学习是一种保护用户数据隐私的有效技术，它的研发和工业应用密不可分。所以，在接下来的发展中，也期待越来越多的企业和机构会采用联邦学习技术，发展2C和2B的人工智能垂直应用。”

　　社会对隐私和数据安全愈加严格的要求，将会推动新的加密技术和多方建模的技术更加蓬勃的发展。让我们一起期待。

　　FATE开源社区，汇聚了大量人工智能专业人士，为联邦学习的“帝国”添砖加瓦。

　　来github一起参与项目，贡献者将加入FATE开源项目名单，更可获取300-10000元等同价值激励：https://github.com/webankfintech/fate

　　了解更多，可访问FedAI联邦学习官网：https://www.fedai.org/#/

　　咨询及沟通，可添加【FATE开源社区助手】微信号：FATEZS001。

IT产业网微信二维码logo

　　行业资讯、企业动态、业界观点、峰会活动可发送邮件至news#citmt.cn（把#换成@）。

海报生成中...

分享到微博分享到微信一键复制

标题链接已成功复制

FATE开源项目首位贡献者团队聊“联邦学习”：高校已加大投入深研

最新新闻

热门新闻

新动态

关注度

最话题

FATE开源项目首位贡献者团队聊“联邦学习”：高校已加大投入深研

相关阅读

最新新闻

热门新闻

新动态

关注度

最话题