西西河

主题:【原创】哎呀,妈呀,被举报了!(0) -- 奔波儿

共:💬36 🌺338 🌵1
分页树展主题 · 全看首页 上页
/ 3
下页 末页
    • 家园 【原创】(3)铁手在搞什么鬼?

      大家都知道,这个判罚系统是由“一直在改”弄出来的。刚出来的时候,估计用的是简单的线性加权公式,结果问题不少,比如:5个监察的判罚是“不违规”,1个监察则给出了“加重封”,最终结果成了“短封”,这明显是不合理的。记得当时,让大家很是抗议了一番。“一直在改”也虚心接受大家的意见,改动了一通,大家的牢骚渐渐也就少了。背后到底是个什么机制呢?

      换言之,G(X)=Y所暗含的G到底是个啥东东?

      既然已经知道了X,又知道了Y,就不怕这个G不出来。

      先来个最简单的感知器(Perceptron),能出结果,但训练数据和测试数据都有错误,分别为1.25%和9.52%。

      换一个,来个流行款的CNN(卷积神经网络),把“tensorflow”这把大牛刀也加上,效果不错,训练数据和测试数据均为100%的正确率。不过,没必要搞这么复杂,而且不好解释。

      来个简单的,逻辑回归(Logistic Regression)和支持向量机(SVM),训练数据的误差很小,接近0,但测试数据的误差率还是不佳。看来单层分析的效果不怎么样。

      还是用多层分析,比如决策树(Decison Tree),结果不错。无论是训练还是测试数据均达到0误差。上张图。

      点看全图
      外链图片需谨慎,可能会被源头改

      从上面这张图可以看出,在6个监察给出判罚以后,如果“不违规”的次数>=3,则帖子“不违规”。看来这个规矩一直没改。

      反之,如果“不违规“的次数<3,则很有可能被判违规,唯一可以逃出樊笼的机会就是”难以判断“,不过,希望比较渺茫。

      不过,这张图也反映出铁手的这个判罚系统依旧存在不合理的地方,比如,被投诉贴有太多机会,落入”短封“的陷阱,这明显是不合理的。正常的情况下,应该是“违规”>“短封”>“加重封”。我一直怀疑,铁手在其判罚系统中设有一个调解阈值,乱世用重典,太平岁月,则宽大为怀。

      (4)监察业绩之KPI

      通宝推:jellobean,故乡在喀什,万年看客,桥上,mezhan,三笑,胡一刀,
    • 家园 【原创】(2)判罚结果之初步分析

      当监察对帖子进行评判时,有5个选项,分别是'不违规', '难以判断', '违规', '短封', '加重封'。六个监察全部作出判罚以后,系统会生成最后的结果,也是这五种之一。其中,第一项自然是“不违规”,3至5项则属于“违规”,程度由轻到重。第二项呢,适用于难以做出判断的帖子,举报人和被举报对象均无损失,毕竟世上有很多事情,没有绝对的对或者错。俺家邻居的狗剩娃儿一天到晚非黑即白,他肯定没有见过既黑又白的滚滚殿下。

      点看全图
      外链图片需谨慎,可能会被源头改

      先瞅瞅这101个案例的最终判罚结果之统计分布:

      点看全图
      外链图片需谨慎,可能会被源头改

      “不违规”的帖子最多,有45个,占比44.6%;其次,是“短封”,有41个,占比40.6%;“违规”和“加重封”分别为5个和7个,“难以判断”则居于末席,仅有3个。当然,这只是最终的判罚结果而已。感觉上,“短封”的占比过高,在进行深入分析前,有些出乎意料。

      再看看这一个月来,各项判罚的比例变化。

      点看全图
      外链图片需谨慎,可能会被源头改

      可以明显看出,绝大部分时候,特别是中后期,“不违规”的判罚占大多数。前期阶段,被投诉帖子主要是一些不易引起争议的帖子(例如P大师的帖子),而随着时间推移,这类帖子虽然有,但容易引发争议的帖子逐渐成为主流。这说明,在众人特别是监察的努力下,论坛的状态逐渐趋于正常。

      既然要做数据分析,就要先将已有信息数字化。可以将这5类判罚分别编号,即0(不违规), 1(难以判断), 2(违规), 3(短封), 4(加重封)。

      虽然有6个监察,但系统判断最终结果是根据5类判罚的个数分布来作出判断的。

      此处,输入的数据为X_i(i=0,1,2,3,4),每个X_i代表第i类判罚的个数,且sum{X_i}=6。假定系统的判断机制为G,则有G(X)=Y,Y为最终的判罚结果,一共有5种结局(即0~4)。请问,输入数据一共有多少种?

      答案是210。不过,这只是理论答案,在实际操作中,我们只得到了60种输入数据。其中,出现次数最多的分布是40200,即6个监察输入的结果是4个不违规,2个违规;排第二的是30201,即3个不违规,2个违规,1个加重封。不过,这两种输入数据的输出结果均为0。

      有没有6个监察完全一致的判罚?答案是有,虽然理论上应该有5种,但实际只出现了“60000”,“00600”和“00006”,分别各有一个案例。

      “60000”说明众监察一致认为被投诉帖子是无辜的!可没法子,就算是人蓄无害的小白兔一样会被人惦记,这就是当前的环境。

      “00006”则说明诸位监察均下了重手,一看受罚的帖子(点击者扣3铢钱),哦,原来是这位,拉出来,走几步。缺少铢钱的ID,如果大家遇到这类帖子,走过路过,不要错过,强烈建议“也举报”一把,包赚不赔,而且还为净化河道作出您的一份贡献。

      (3)铁手在搞什么鬼?

      通宝推:jellobean,故乡在喀什,万年看客,桥上,mezhan,青颍路,
    • 家园 【原创】(1)致被举报对象

      常言道:“人在江湖飘,早晚要挨刀”。只要你不是榆木嘎达,或者只会哼哈的将军,随便发个言,总会有人不爽,毕竟,林子大了,什么鸟都有。那种“誓死捍卫你说话的权利”的讨论氛围早已黄鹤一去不复返,会有回来的那一天吗?是不会呢,还是不会呢?继续谨慎不乐观。

      当然,如果你是学泼妇骂街、或者一天到晚把生殖器挂在嘴边,被人举报,进入小黑屋,也算是种瓜得瓜,种豆得豆。好汉做事,好汉当嘛。关几天,出来,接着玩嘛。实在玩不起的话,那就“走好,不送!”。

      被举报了,别怕,只要你不属于那些骂街的ID,建议还是相信监察和制度,毕竟,所有监察都是大家一票一票选出来的,这在一定程度上保证了那些立场偏激的ID不容易进入监察队伍;其次,六个监察中,只有一半以上的监察判你违规,才可能受罚。

      “可能”,这个可能性有多高呢?对于受争议的帖子,被判“违规”的概率只有34%。。

      如果,你坚信自己的帖子人蓄无害,和五毛、美分、左呀、右呀啥的都不搭界,那在被举报的时候,不但不应该发慌,反而应该高兴才对。这说明,你被人“恶意举报”了,被判“违规”的概率是很低的,而一旦最后结局是“不违规”,那你不但不会有任何损失,举报你的ID还会受罚,被扣除铢钱48枚。而判罚结果与最终结果不一致的监察,也会受罚,将被扣除铢钱6枚。不过,“一直在改”乱发货币,早就搞得通货膨胀。

      另外,监察不可能同时给出判罚,毕竟人家都是有家小要养活的人,只能在工作生活之余,给大家做贡献。这就给大家一个小空子可以钻。每一个监察给出判罚后,你的信箱就会收到一个短信提示。如果你已经有三个监察判你“违规”,这个时候,你要不想受罚,就必须采取行动——修改一下你的帖子。当然,你会被扣去一点小小的铢钱。那反正也不是比特币,用不着心疼,和气生财嘛。

      点看全图
      外链图片需谨慎,可能会被源头改

      就算最后被受罚,也不必学窦娥姐姐或者孟姜妹妹,搞得动静太大,会吓着花花草草的。所谓“红尘炼心”,蹲小黑屋也是一种修行,多少牛人大拿都是从小黑屋里走出来的。司马老师说过“盖西伯拘而演《周易》;仲尼厄而作《春秋》;屈原放逐,乃赋《离骚》;左丘失明,厥有《国语》;孙子膑脚,《兵法》修列;不韦迁蜀,世传《吕览》;韩非囚秦,《说难》、《孤愤》。《诗》三百篇,大氐贤圣发愤之所为作也。”

      其实,受处罚帖子,绝大多数都没有被真正删除,只是大家想看的话,花上点银子罢了。如果你的宏文真的是惊天地泣鬼神,一定会有无数粉丝迷妹纷至沓来顶礼膜拜的,对你的敬仰之情将如滔滔江水绵绵不绝,又如那黄河泛滥一发而不可收拾的,至于那几铢钱,算个毛!(哇,我没有踏到某派的尾巴上吧?)

      点看全图
      外链图片需谨慎,可能会被源头改

      最后,让俺们再次念诵一下伟大的“Littles三原则”

      1. 西西河是铁手开的。

      2. 违反河规是处分的结果而非原因。

      3. 在河里混,需要正确而有技巧的立场。

      (2)判罚结果之初步分析

      通宝推:江南愿,故乡在喀什,wage,万年看客,桥上,mezhan,迷途笨狼,天河行,三笑,敬畏生命,青颍路,陈王奋起,
分页树展主题 · 全看首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河