西西河

主题:如今胡萝卜都不可靠了,要反复测试 -- 类反词典

共:💬37 🌺10
分页树展主题 · 全看首页 上页
/ 3
下页 末页
  • 家园 如今胡萝卜都不可靠了,要反复测试

    如题,我承认我很无聊,所以要拿胡萝卜反复测试

    测试很简单,过程如下:

    (1)翻墙,google.com.hk搜索胡萝卜

    (2)查看源代码,另存为t.htm,保证文件每个字节都和google给的不差

    (3)切断翻墙软件

    (4)在墙外申请个人主页

    (5)上载t.htm到主页

    (6)访问自己主页上的t.htm

    结果是成功,和翻墙后看到的google的结果没有大区别,只是图都没有了。这个试验所有人都能做,所以就不给出我上载的t.htm的链接了。

    结论嘛,暂时还得不出什么结论。这里面有太多的可能。下面准备试验用西厢翻墙获得的页面来测试,看看是否一致。由于平时用的是windows,这个还是比较麻烦。另外就是测试URL中的内容是否有影响。这个测试相对麻烦一点。

    另外要说明一下,用西厢胡萝卜管用不能说明google是无辜的,因为如果google发出的reset信号和gfw一样,那么就可以被西厢忽略。西厢本身里面是有忽略reset信号的代码,而且是针对服务器发出的reset信号,因为这个reset信号是西厢故意引起的。

    • 家园 啊?修女怀孕了......(6号表情)
    • 家园 除了你想的那种,还有一种可能,就是 GFW

      一般只针对 http 的报头做分析,过滤的也只是 url ;但是,对于重点目标,比如说 wiki , GFW 就不仅仅是过滤报头,同时也过滤报文。

      当然,也有可能是过滤的规则也许就是什么东西只要与 google.com 放在一块就挂掉。你可以试试改一下自己主页的 url 加入 google.com 看看。

      最后,也不应该排除你想的那种可能性,如果只针对你的文字进行分析的话。

      最好的办法是用 wireshark 分析,相信不需要这么麻烦也可以很快得出结论。

    • 家园 我认为你对西厢计划的理解是错误的

      另外要说明一下,用西厢胡萝卜管用不能说明google是无辜的,因为如果google发出的reset信号和gfw一样,那么就可以被西厢忽略。西厢本身里面是有忽略reset信号的代码,而且是针对服务器发出的reset信号,因为这个reset信号是西厢故意引起的。

      =================================================

      东方望天:“胡萝卜”,google的把戏,还是敏感词发威?

      三次握手的时候,在收到 SYN/ACK 后,客户端要给服务器发送一个序列号+1 的ACK,可是,假如我不+1呢,直接发 ACK 包给服务器。 墙已经认为你客户端是死老虎了,不理你了,不知道你搞什么飞机,让这个 ACK 过了。可是服务器一看,不对啊,你给我的不是我期待的那个序列号, RFC 上说了,TCP 包如果序列号错了的话,就回复一个 Reset. 所以,服务器就回复了一个 Reset。这个 Reset 过墙的时候,墙一看乐了,服务器也终止连接了,好吧,两边都是死老虎了,我就不监听这条连接了。而至于客户端,这个服务器过来的 Reset 非常好识别,忽略就是。随后,客户端开始正确的发送 ACK, 至此,三次握手成功[SIZE=3]注意这里,这时候服务器端必须要给你一个正确的回应,而不是又发reset包,这样你是无法建立连接的[/SIZE]

      如果是google有意识的针对大陆ip发送reset包,那么第三次握手是不可能成功的。

      tcp连接能成立,最终是一定要求服务器端能发回一个正确的响应,而不是说你忽略了收到的reset包就能建立连接了,服务器在三次握手的时候必须给你一个正确的响应包。

      • 家园 一个reset和两个reset的区别而已

        西厢用FIN引发google发送一个reset,这个被西厢忽略,然后google再发送一个reset,还是可以被西厢忽略,继续链接过程。一般来说,TCP协议栈是需要忽略重复包的,这么做仍然符合RFC,网络上会有极少情况出现重复包。没有道理说西厢可以忽略前一个reset却不能忽略后一个reset。除非跟踪整个过程。

        而且,google还可能有一个状态,记录是否发送过reset。西厢的FIN引发google发送reset,很可能翻转google的状态。这样,第二个reset就不会发出。

        • 家园 当然不是,没有最后一个握手,你怎么继续链接过程?

          google根本不可能会因为什么前面发过了一个reset了,所以再收到你的包就建立链接。他怎么知道你这是故意发的reset,还是网络故障引起的?

          GFW是因为它是一个入侵检测系统,才会这么做。google如果要堵塞大陆的链接,很明显就是收到大陆的ip过来的胡萝卜请求就做reset。

          而且就是这个,也要求google在物理上在tcp层有一套GFW的类似系统,因为在http层上只能拒绝连接,而不是发reset包。

          • 家园 你还是回去看看TCP协议吧

            你说的和我说的完全不是一回事。可以说根本就没有沾边的。

            • 家园 我觉得很明显了,只要同时匹配到

              http://www.google.com 和 胡萝卜 两个关键词就有可能被重置。

              这个现象与 Google 无关。

              我这里一个任意一个站点加上“http://www.google.com”都会出问题, 新华网 也一样。

              http://www.microsoft.com/http://www.google.com/search?hl=en&newwindow=1&q=%E6%96%B0%E5%8D%8E%E7%BD%91&aq=f&aqi=&aql=&oq=&gs_rfai=

              这个请求甚至会引发 microsoft.com 短暂的无法访问。我觉得现在问题很明显了。


              本帖一共被 1 帖 引用 (帖内工具实现)
              • 家园 墙果然BT

                访问你的链接没问题,不过,刚发现居然又不能搜温度计了,赶紧试了下。

                没有你那里那么惨,但也类似。

                用你的方式,也得到了可以除排google的测试结果。

                感觉墙的规则挺复杂,还可能有动态算法,没耐心仔细测。

                很BT的说。

                • 家园 ……现在墙已经结束抽疯,现在再测已经没有意义。
              • 家园 这是很明显的证据,因为报文根本没有到google那里去

                只能是GFW的作用

                • 家园 我觉得没必要讨论到这么深的地方去,

                  一是,这里没几个看得懂西厢计划的内容(包括我,能用就差不多了); 二是,其实楼主已经做错了,因为楼主根本不了解 GFW 正常情况下(非 Google.com wikipedia.org 这些站点)是只扫描(姑且这么说吧)http 报文的头部的,所以他才会想到做一个 html 文件而不是简单地去构造一个 url 。

                  毕竟跟 GFW 打了这么多年的交道,我还是理解楼主的,有些网络问题确实不是 GFW 引发的,但是却被认为是 GFW 造成的。不过这一次确实应该是 GFW 造成的。

分页树展主题 · 全看首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河