主题:【讨论】对西西河的屏蔽功能的一点想法。 -- 说了就走
共:💬64 🌺7
是你没有实际经验,几万的几万次方,世上没有服务器可以支撑现在还有很多科学上的计算无法实现,即使用最好的电脑,也要几十万年才能算出结果的,太多了。
我想了一下,如果用数字表示我这个查询的复杂度。是否是这样的。假设平均一个主题之下,出现被屏蔽的ID3人。而每一个用户的白名单中的ID达到50人。那么,查找需要的复杂度最大为50*3=150。事实上,如果储存时就对ID进行排序,那么会大大减少查找。因为,黑名单中的前列ID,就从白名单的前列ID查找,当查找到白名单中的ID大于黑名单中的ID时,就说明白名单中没有这个ID了。那么以后的那些ID就无需再找了。——这只是一种简化的方法,事实上,计算机本身对这种查找肯定有其他更好的和更多的优化方法。如果平均一个ID一天点开的主题数有10个。西西河平均每天共有一万个ID在线。怎么这个复杂度是每天1500万。
这个数字虽然也很大,但绝不是什么几万的几万次方这样的概念。
关键词(Tags): #版务,
本帖一共被 1 帖 引用 (帖内工具实现)
- 相关回复 上下关系8
压缩 3 层
🙂你能查得过来几万张名单吗? 瓦斯 字0 2009-03-28 02:24:05
🙂性能上会有影响,但不是技术上办不到的。 说了就走 字100 2009-03-28 02:33:11
🙂是你没有实际经验,几万的几万次方,世上没有服务器可以支撑 瓦斯 字127 2009-03-28 02:39:36
🙂如果用数字表示我这个查询的复杂度,是否是这样的。
🙂假设前提有严重问题,后面都不用往下太多思考了 瓦斯 字482 2009-03-29 23:09:27
🙂这些是正常用户,完全不用管他。 说了就走 字81 2009-03-29 23:54:01
🙂你必须先判断他是正常用户。判断几万名访客的每一个都要时间 瓦斯 字192 2009-03-30 00:13:35
🙂你把上下文好好看看。 说了就走 字442 2009-03-30 00:19:19