西西河

主题:【原创】云里雾里的云计算 [1] -- 邓侃

共:💬620 🌺1262
全看分页树展 · 主题 跟帖
家园 花一个,只是加密与搜索的三个思路都有问题啊

第一个办法是,把加密算法和构建倒排索引的算法通盘考虑,重新设计一套一体化的算法。

如老邓所说目前没有有效的算法,因为加密的本质就是打乱顺序保守秘密的。而构建倒排索引之后,这篇文章里出现过的所有词及出现顺序都被google的索引程序知道了,google如果愿意就很容易还原出来。这还如何保密啊?

第二个办法是,客户自己动手建倒排索引,然后把索引加密,上传到云计算平台。

这个办法似乎有门,特别是对文本数据信息。不过客户建立的索引加密后,google如何在不解密的情况下与google的索引合并呢?不合并就没法检索,而合并两个打乱了语序不可读的“乱码”文件,这个算法难度可不小啊

第三个办法是,在云计算平台中分离出一部份作为密室,供客户远程秘密操作构建倒排索引的工作。

嘻嘻,这个在客户不相信google的情况下,有些掩耳盗铃的意思啦

这样看来,似乎加密与搜索是很矛盾的两件事,想把它们结合在一起不太容易啦。

不过google似乎可以放弃对企业数据需要加密的数据的索引。能够说服用户在他们的存储和运行空间里他们的程序和数据是安全的就OK了。只是困难永远都存在:

数据加密:

加密过的海量企业数据,在运行时如何解密使得用户程序可以读,而其他程序不可读?这对于google的CPU,内存,内存管理算法,以及用户体验都是相当的考验啊

程序加密:

obfuscation后的程序反编译后很难看懂。不过,很多情况下cracker不需要看懂程序,他们只需要根据某个线索找到某个函数(比如根据生成的某个序列号找到序列号生成函数),照抄下来就成了keygen了。毕竟伪机器码还不是01码,在巨大的利益驱使下,估计还是有人愿意干这种枯燥的事情的(比如分析银行数据库解密程序)。

而且无论数据加密/解密还是程序加密/解密,都需要消耗大量的CPU时间和内存。这是google所不愿意看到的。

所以,我在想,既然加密这条路走得很困难,google是不是可以走另一条路,就是:

从头构建一个操作系统!这套OS的源码要公开。如果能够从源码体系证明程序和数据在某个独立的空间存储和运行是安全的,而google又能够证明他们确实是在用这套源码所编译的OS运行云系统,那么我想客户就不会有顾虑了。这类似于证书机制:证书加密机制从算法上被证明是可靠的,那么用证书加密过的数据就是安全的,证书的客户对此不会有任何疑问。

只是,这套OS突破了目前所有OS理论和实践,将是个全新的体系结构。google是否有能力构建出来?

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河