主题:【原创】基于西西河发帖时间戳的河友发帖习惯分析 -- 菜根谭
在此帖显示你果然不具备普通理工科研究生的水平中,对你的职业估计在这个帖子里被完全印证了。虽然你可以请他人帮你分析数据,但是你完全缺乏正确理解这些结果的能力。你的职业习惯让双标已经深深植入你的骨髓,导致你完全不理解科学或者工程中的对照的概念。
作为一个学术老兵,虽然我没有能力掌握爬取数据这些新技术,但起码我有解读数据的能力。我先按你的逻辑走一遍,推断一下荒谬之处,再给其他旁观者讲一下正确的思路。
1. 你现有逻辑的延伸导致的悖论
1.1 你首先是试图采取一个对照,假定你和达雅不是互为马甲,然后以你们相关系数较高来反证你和大胖子也不是互为马甲。但是这个逻辑如果成立,那就证明了这个所谓的时间指纹或者时间戳的方法根本无效,后续所有的分析都失去了基础。你可以删掉从第一个帖开始的所有数据分析了。
1.2 所谓时间偏差的分析。你试图用发帖时间分布的时间差来代表ID所在时区。比如你捡取的国内网友比燕人早若干小时,而你捡取的美洲网友比他晚几个小时。然后在另一个帖子,你指出若干网友比燕人晚若干小时所以是马甲或者有什么特殊关系云云。但是如果延续你的逻辑,这些网友应该存在于美洲和英国之间,即大西洋正中。玩过大航海时代的网友,知道确实大西洋中有某些有人小岛。但是这个有点太匪夷所思了。
我觉得 @假日归客 网友的分析这些共识没有出现在你的主贴里,即这些网友有着非体制内工作的假说更加符合他们发帖时间分布的现实。更广义的说,虽然这个时间差可能由时区差异和生活差异造成,但对这几个网友,用后者解释数据更可信。
1.3 至于对所谓时间差异校正后的相关性,更是离谱。如果把你的两个帖子对着看,发现你怀疑的燕人马甲群,这个数据的分布范围很广。其中有些低于0.7,而你和燕人的这个指标反而高于0.7,也就是说,如果相信这个数字标准,你自己难道是燕人拿来捧哏的吗?而那些网友此数值最高的不过0.9,和假日归客相当。那西西河绝大多数网友都是燕人的马甲或者什么团伙。西西河已经不是铁手的,而是燕人的了。这怎么可能呢?
所以可以看出你的脑子一团浆糊,完全不知道自己在说什么。如果是受过研究生,或好大学的做过本科毕业设计的大学生,都不能犯你这样的错误。
2. 我给大家解释一下可能的背后逻辑。
2.1 这个【讨论】受某网友启发,关于马甲的简单分析和讨论匿名网友的分析会比较依赖时间分辨率。一个极端情况,时间分辨率为24小时,那所有的人互相都是强相关,因为数据都是一个点1。随着分辨率逐渐提高,相关系数整体会下降。真正相关的ID下降较慢,而不真正相关的下降较快。所以存在某两个ID在较低分辨率下相关强,另一个较高分辨率下相关弱的情况。那个文中作者把所有分析放在同一个参数下,并且有公开承认马甲(高)和无关网友(低)的对照,才比较可信。即使在那样条件下,也只能说AB相关性高于CD,所以AB互为马甲概率高于CD,而不是给出绝对的判定。如原文中提及的青春、机会两网友相互或和燕人网友相关低于菜和胖。但菜和胖未必是互为马甲,也可能隔壁工位一起上班打卡的同志。
2.2 和 2.3 可以放到一起说。对于一个分布,我们可以找分布中心,和分布形状来描述。如正态分布的均值和方差。但是对于真实生活数据解读,两者是不能随意分割去解释的。如前所述,分布中心的差别,可能是生活习惯和时差等多个因素造成,而分布形状也依赖于生活习惯,所以把这两个分开讲本身就缺乏客观理性,或者说缺乏物理意义。更何况楼主两个方向的解释都在事实面前遇到难于逾越的困难,却不知悔改,也是奇葩。属于张三锯掉脚,赵二穿上高跟鞋,都能跟李四差不多高,所以他们和李四一定有关系这种完全驴唇不对马嘴的栽赃。
另外,还有一个数据的诚信问题。虽然分布中心和分布形状不能严格倒推原始数据,但看到在你第二个帖中,以燕人为参照,达雅的数据分布中心和分布形状和你数据的差别,都远大于你和大胖子的数据差别,却能在第一个帖中,和你的相关性与你和大胖子相关性非常接近。这是不符合现实数据规律的。这个需要能够读取数据的网友去验证。
你急吼吼列出一些ID,生啦硬凑非要去和燕人网友扯上关系,还不断找 @铁手 告状,在我们旁观的人看来,就是你和同伙多次吵架吵不过人家,被全方位压制,所以才要把一群不同观点的人一起封为燕人马甲或者什么M16团体。准确的说,就是熊孩子心态。打架不过,希望有一个亲爹来帮自己摆平。和普通院系的政工干部去书记那里告状若干任课老师背习主席语录组团打瞌睡有什么区别?但是你这样的一个天天满嘴脏话骂街的ID,不要说 @铁手 ,就是多数网友也要爱惜羽毛和你保持距离。
国内高校教师,若上课要面对聪慧的大学生,若科研要面对挑剔的审稿人,都不会犯你这里犯得这么多低级错误。只有那些团委、学工的人,只要会拍领导马屁,对学生甚至正牌老师都颐气指使惯了,才会为了箭头画靶子,处处双标而不自知。
- 相关回复 上下关系8
🙂单一指标确实没有多大参考意义,辨别需要多个维度一起作用 14 大胖子 字491 2024-04-14 03:33:50
🙂说错了!都是你的马甲!哈哈! 1 凤城 字242 2024-04-15 12:21:18
🙂不必多费心,明辨是非更重要 10 nevermind 字155 2024-04-13 22:47:46
🙂你莫非真的是团委学工干部?完全没有学术训练的痕迹啊
🙂其实,即使楼主找老铁祭起IP大法也证明不了谁谁谁的马甲 1 匿名 字303 2024-04-13 23:52:01
😂我考虑承认是菜根谭的马甲 6 达雅 字57 2024-04-13 23:48:06
🙂学工干部评价太高了,何必匿名,你的数据分析部分实质很有道理 9 菜根谭 字1304 2024-04-13 17:40:33
🙂我的做法就是不理不睬 30 Swell 字2050 2024-04-13 14:59:07