8月30日,在亦来云中文社区“亦见 Web3 四周年”线上分享会上,矩阵起源创始人王龙受邀与社区小伙伴分享了数据资产化、可信计算及 CreDA 等相关内容。王龙先生表示,数据资产化未来还有很长的路要走,但是可信计算不管是同态加密、联邦学习,还是区块链应该是可以并存的,在不同的场景下都会有比较广泛的应用空间,前途非常光明。

以下是王龙先生分享的详细内容。

大家好,非常高兴在线上和大家做一些分享,感谢亦来云、陈榕老师和韩锋老师的邀请。
今天我分享的内容主要围绕数据资产化展开。最近几年,我和陈榕老师、韩锋老师围绕数据相关的内容展开了一些讨论并产生了共鸣,也在很多方面进行了合作。
我们先说下数据资产化到底是什么?在现实世界里我们从小学到大学习知识、获取信息,并通过这些知识去工作,付出劳动,然后得到相应的回报,这是现实世界里的一个价值评估体系。
数字世界怎么做资产化呢?数据其实是比较接近人的,像最近火的元宇宙,都是把物理世界的人的行为变成二进制数据,然后放到数字世界中去。放到虚拟世界中的数据怎么运行呢,怎么去运用它的价值呢?这件事情其实一直在进行,只是没有一个非常科学的结构化的体系。比如,大家每天在微博上的各种操作数据会被送到数据中心去建模,然后预测我们感兴趣的内容,进行内容或者广告的推送等。
但是,数字世界的资产化和现实的数据还是有不一样的地方。第一,知识很难可靠复制,我们无法将知识、学识、运用知识的能力等这些东西完全复制,但是计算机世界里的数据原理上可以无限复制。第二,在物理世界里,知识的应用对人的依赖性很强,比如,你相信陈榕老师、韩锋老师可以做成一件事情,就算他们告诉你,已经把知识传递给某人了,大家肯定也不会相信这个人能做出和陈老师、韩老师一样的事情,因为我们知道知识是无法可靠无损的复制和传递的。同时,知识在现实世界当中的应用是要受到法律和道德的约束的,哪些数据能用来赚钱,哪些不能,或者应用了哪些数据是要受到惩罚的。但是在虚拟世界中,背后的运算都是计算机完成的,而且次数和规模非常大,道德和法律的约束很难细化到某一个人。
还有物理世界的知识基本上通过工作、使用、回馈等是可以定价的,比如你把身份证信息上传到网上到底值多少钱,这个事情除了在黑市上是很难定价的,也许像世界首富那样的信息会很值钱。
那怎么办呢?就有人提出了可信计算的概念来解决上述问题。如何在保障数据安全和用户隐私的情况下,数据可以按照行为、所有者进行非常精确的管理,然后进行数据的计算和使用,例如做商业模型,做广告,风控等,在个人隐私得到完整保护以及没有无限复制的情况下得到很好的使用。可信计算还有一个作用是能够提供计算的数据进行价值评估,在做建模训练的时候可能会评估到数据在整个模型中的权重,为模型提供的价值,因为能够价值评估,它还可以提供一些交易机制。
当前的可信计算有好几种流派,比如典型的安全多方计算,就是多个数据能够放在一起计算后得出结果,但这些数据还是属于个人,而且得到的结果并不能反推出一些个人信息。安全多方计算现在有同态加密、联邦学习、还有基于区块链的探索。
先说同态加密是一种数学的方式,像比特币的私钥一样,无法通过公钥推导出私钥。同态加密也是基于数学原理的计算方式将多方数据放在一起计算,得到结果的人完全无法推导出用户信息,而且每次运算时可以通过签名确保计算出来的数据只能使用一次。但是同态加密的问题是,因为经过了大量的加密,所以运算成本极高,大概是普通计算的十的七八次方,甚至十几次方。由于这样高昂的成本,可能经过它的计算,我的数据本来只值100块,但我要去保护我的隐私可能需要支付1000块,不是很实用。所以,当前很多人在探索,但是目前还没有一个可以落地的场景。
还有一个是基于联邦学习,它是在分布式系统中做训练,模型优化时将模型在各节点间传输,并不直接传输原始数据。这存在一个问题是,除了网络成本外,还存在安全风险,因为它本身不是数学验证过的完全不可逆的过程,逻辑上可以识别出某一用户,所以它不是完全的可信计算,应用场景也比较受限制。
这些事情已经探索好多年了,像之前我和韩锋老师发起了数据资产化运动,其实都在探讨有什么样更好的方式可以推动落地,当时我们探讨了很多,想到第三种路径即分布式计算和区块链的结合。分布式计算部分减轻了用户隐私和数据安全的问题,并通过共识计算的方式来减轻可信计算中的成本问题。然后区块链的分布式存储和智能合约通过这种共识机制至少理论上在成本和保护力度上有一定的灵活度,做到了一定的平衡。
区块链还有比较大的优势是它的不可篡改性。把很多时间相关性的数据价值放大,比如很多人改出生日期,医疗数据等,这些数据对于保险有很多价值,并且是时间越长,价值越大。这些数据放到链上做计算,区块链的作用会体现的更加明显,还有一种数据是信用数据,篡改信用数据在西方国家是很明显的,因为信用数据对他们很重要。
所以,我们跟亦来云 DID 团队合作做了信用预言机 CreDA 项目,本质就是发掘一个路径,如何让数据在隐私得到保护和数据安全的情况下进行运算,运算结果能够为各种各样的场景提供价值。我们团队做了一些链上数据的分析,并结合可信计算,尽量能够把大家的数据和行为基于信用模型进行信用评估。
信用评估的得分进入区块链世界,当前可能是借贷方面会应用的比较多。未来,和 DID 结合后会有更多的应用场景。当然,未来还有很长的路要走,但是可信计算不管是同态加密、联邦学习,还是区块链应该是可以并存的,在不同的场景下都会有比较广泛的应用空间,前途是非常光明的,期待未来和亦来云有更多深度的合作。