谁是节能又高效的企业——简单介绍一个的联邦分析查询的应用场景
某天,某电视台找到税务局和水电局, 说想做一起节目, 以获知有哪些企业是高质量节能企业,要给他们颁奖。
这就需要交税量和用电量的数据, 如果交税量/用电量的比值很高, 说明这家公司既挣钱,用电量又少,高效又节能
类似于希望这2个局提供2个表, 将电力表和税收表做一个联合查询, 放到一个数据库中,并执行如下sql:
Select
rank.公 司 名 (
Select
t.公 司 名 as 公 司 名,
t.税 收 / p.电 力 as 得 分
from
税 务 局.税 收 表 t
join 电 力 局.电 力 表 p on t.公 司 名 = p.公 司 名
order by
得 分 desc
) rank
limit
100
但是这2局不同意,说最近对隐私要求很高, 放到一个数据库或者数据湖里可能会存在泄漏, 按照规定规定不允许随意泄露人民数据, 而交税量和用电量都是隐私。
这时候就需要去了解下联邦分析查询是什么了。
税务局在本地只需要提供出 公司名和交税量这2列数据, 并进行加密,
同时水电局也 提供出 公司名和用电量这2列数据, 并进行加密,
这个取数据和加密的动作只在你们本地服务器中部署的代理服务完成,安全得很,别人看不到的。
而谁能够对这2份数据做解密呢?
只有联邦分析提供方的安全沙箱或者TEE硬件可信区里才能够解密!(这个安全过程可以下次分享,简单理解就是必须要在沙箱或者可信区内才能进行解密和计算操作)。
数据会发送到我们可信计算平台的 TEE服务器中, 通过安全的TA接口进入TEE服务器,在TEE硬件层面进行解密,因此提供服务方也没办法用后门去查看数据, 所以非常安全。
计算时会对2边提供的数据进行join, 然后再进行计算,获得前100的排名, 最终结果从可信区中出来时,只暴露了公司名.
那有人会问:
怎么信任可信区的代码不开后门?
联邦计算提供方可以对可信区代码进行开源,你们可以审视,只做加密和计算,不做任何涉及数据的输出和保留。
对于华为云而言,类似的服务有TICS。
以下是TICS的介绍:
- 点赞
- 收藏
- 关注作者
评论(0)