主题:如今胡萝卜都不可靠了,要反复测试 -- 类反词典
如题,我承认我很无聊,所以要拿胡萝卜反复测试
测试很简单,过程如下:
(1)翻墙,google.com.hk搜索胡萝卜
(2)查看源代码,另存为t.htm,保证文件每个字节都和google给的不差
(3)切断翻墙软件
(4)在墙外申请个人主页
(5)上载t.htm到主页
(6)访问自己主页上的t.htm
结果是成功,和翻墙后看到的google的结果没有大区别,只是图都没有了。这个试验所有人都能做,所以就不给出我上载的t.htm的链接了。
结论嘛,暂时还得不出什么结论。这里面有太多的可能。下面准备试验用西厢翻墙获得的页面来测试,看看是否一致。由于平时用的是windows,这个还是比较麻烦。另外就是测试URL中的内容是否有影响。这个测试相对麻烦一点。
另外要说明一下,用西厢胡萝卜管用不能说明google是无辜的,因为如果google发出的reset信号和gfw一样,那么就可以被西厢忽略。西厢本身里面是有忽略reset信号的代码,而且是针对服务器发出的reset信号,因为这个reset信号是西厢故意引起的。
用狗搜BWI,JFK都被墙了,莫名其妙,丢人现眼。
另外要说明一下,用西厢胡萝卜管用不能说明google是无辜的,因为如果google发出的reset信号和gfw一样,那么就可以被西厢忽略。西厢本身里面是有忽略reset信号的代码,而且是针对服务器发出的reset信号,因为这个reset信号是西厢故意引起的。
=================================================
三次握手的时候,在收到 SYN/ACK 后,客户端要给服务器发送一个序列号+1 的ACK,可是,假如我不+1呢,直接发 ACK 包给服务器。 墙已经认为你客户端是死老虎了,不理你了,不知道你搞什么飞机,让这个 ACK 过了。可是服务器一看,不对啊,你给我的不是我期待的那个序列号, RFC 上说了,TCP 包如果序列号错了的话,就回复一个 Reset. 所以,服务器就回复了一个 Reset。这个 Reset 过墙的时候,墙一看乐了,服务器也终止连接了,好吧,两边都是死老虎了,我就不监听这条连接了。而至于客户端,这个服务器过来的 Reset 非常好识别,忽略就是。随后,客户端开始正确的发送 ACK, 至此,三次握手成功[SIZE=3]注意这里,这时候服务器端必须要给你一个正确的回应,而不是又发reset包,这样你是无法建立连接的[/SIZE]
如果是google有意识的针对大陆ip发送reset包,那么第三次握手是不可能成功的。
tcp连接能成立,最终是一定要求服务器端能发回一个正确的响应,而不是说你忽略了收到的reset包就能建立连接了,服务器在三次握手的时候必须给你一个正确的响应包。
一般只针对 http 的报头做分析,过滤的也只是 url ;但是,对于重点目标,比如说 wiki , GFW 就不仅仅是过滤报头,同时也过滤报文。
当然,也有可能是过滤的规则也许就是什么东西只要与 google.com 放在一块就挂掉。你可以试试改一下自己主页的 url 加入 google.com 看看。
最后,也不应该排除你想的那种可能性,如果只针对你的文字进行分析的话。
最好的办法是用 wireshark 分析,相信不需要这么麻烦也可以很快得出结论。
西厢用FIN引发google发送一个reset,这个被西厢忽略,然后google再发送一个reset,还是可以被西厢忽略,继续链接过程。一般来说,TCP协议栈是需要忽略重复包的,这么做仍然符合RFC,网络上会有极少情况出现重复包。没有道理说西厢可以忽略前一个reset却不能忽略后一个reset。除非跟踪整个过程。
而且,google还可能有一个状态,记录是否发送过reset。西厢的FIN引发google发送reset,很可能翻转google的状态。这样,第二个reset就不会发出。
http://www.sun.com/http://www.google.com/search?hl=en&source=hp&q=%E8%83%A1%E8%90%9D%E5%8D%9C
你先试试看吧。
我可以告诉你我被 GFW 了,所以,我不得不认为是 gfw 做的。
google根本不可能会因为什么前面发过了一个reset了,所以再收到你的包就建立链接。他怎么知道你这是故意发的reset,还是网络故障引起的?
GFW是因为它是一个入侵检测系统,才会这么做。google如果要堵塞大陆的链接,很明显就是收到大陆的ip过来的胡萝卜请求就做reset。
而且就是这个,也要求google在物理上在tcp层有一套GFW的类似系统,因为在http层上只能拒绝连接,而不是发reset包。
你说的和我说的完全不是一回事。可以说根本就没有沾边的。
这你总承认吧?光靠忽略reset包是建立不起链接的吧?
最后一个一定是你和google服务器握手成功吧?
http://www.google.com 和 胡萝卜 两个关键词就有可能被重置。
这个现象与 Google 无关。
我这里一个任意一个站点加上“http://www.google.com”都会出问题, 新华网 也一样。
http://www.microsoft.com/http://www.google.com/search?hl=en&newwindow=1&q=%E6%96%B0%E5%8D%8E%E7%BD%91&aq=f&aqi=&aql=&oq=&gs_rfai=
这个请求甚至会引发 microsoft.com 短暂的无法访问。我觉得现在问题很明显了。
本帖一共被 1 帖 引用 (帖内工具实现)
只能是GFW的作用
google完全可以“模拟”gfw的行为,让用西厢的不被墙而不用西厢的被墙。我的观点是“用西厢可以看到不用西厢看不到不能证明这就是gfw干的”。
当然,google要不给你建立链接,那它肯定能做到。这个没有任何疑问。但请你只讨论上面的问题。
你的链接根本就没有发到google去,这总不是google给你重置的吧?
我的观点是“用西厢可以看到不用西厢看不到不能证明这就是gfw干的”,这个我是反对的,因为我专门用西厢计划而不是其他代理软件来证明就是有原因的,不过这个问题不重要了。老虎网友已经证明了那个是GFW干的
一是,这里没几个看得懂西厢计划的内容(包括我,能用就差不多了); 二是,其实楼主已经做错了,因为楼主根本不了解 GFW 正常情况下(非 Google.com wikipedia.org 这些站点)是只扫描(姑且这么说吧)http 报文的头部的,所以他才会想到做一个 html 文件而不是简单地去构造一个 url 。
毕竟跟 GFW 打了这么多年的交道,我还是理解楼主的,有些网络问题确实不是 GFW 引发的,但是却被认为是 GFW 造成的。不过这一次确实应该是 GFW 造成的。