西西河

主题:一个好消息: -- 绝对不是白领

共:💬26 🌺74 🌵1 新:
全看分页树展 · 主题 跟帖
家园 这个很难

我浏览器里有一万多网页书签,五成失效,剩下的五成,也不过是可以通过地址或者名字检索出相关信息,原页面消失的也很多。以至于提及以前网上看到的一个说法,比如百度百科或者某个时期的新闻,根本就没有任何证据,人家直接说瞎说。尤其是百度百科,以前删了连个记录都没有。

不过现在有做新闻追踪的,还有大量伪原创可以留下痕迹,要好很多。但源头还是很难,需要极强的判读能力、关联能力。如果这件事情是近几年,相对热门的还好,稍微冷门一点,久远一点就不行了。

有时候甚至只是一张图片,没一年就找不到人何来来源了。

说个比较有趣的,原先有一张猫猫图片,子弹猫,最早可以搜到有脚的,但是网上广泛传播之后,极难搜到。没办法,选择手工画上去,通过相似图片搜索,多个引擎反复搜索,最终找到。这还是能找到的,万一记不清了呢?

新闻就更是如此。前几年,各大站点还保留了08年之前的页面,现在也基本砍掉了。剩下的很少。搜索学术、报纸、图书(百度学术、读秀、报纸数据库等等)都很难找到,而且要精通正则和词语的关联组合。

早些年因为占用太大,放弃了用Wiz这类保存,有些后悔。现在推荐浏览器扩展SingleFile和Save To The Wayback Machine。

顺便一提,这些丢失的,有不少是非常特别的东西。而有些东西,比如明显应该被举报下去的,举报了也没什么用(不是政治那种)。反而一直存在。

互联网没有记忆,除非上了热搜,被做成表情包。

通宝推:朴石,审度,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河