google – 扫地老僧的Blog

Google搜索结果预览

刚才第一次看到Google搜索结果预览，搜索感恩节，结果的前5个都支持预览。下图红框标出来的就是预览图。让我佩服的是，预览图中加上了搜索关键词所在的段落特别强调标出，关键词用红字显示。

通过这项技术的实现我猜google搜索技术已经实现了如下功能：

索引一个关键词时，google能准确知道这个关键词在真实网页中所在的位置，大小
搜索爬虫能够解析javascript。在firefox中用noscript关闭js解析，第一个搜索结果的页面中右侧是显示是完全不同的

本来这就要点发布，突然才又想了想，感觉google很有可能是用webkit之类的浏览器rendering engine渲染出来的，并不能证明google爬虫就有真正完全解析html，css, js的能力。大家认为呢？

buzz应该能淘汰twitter

用了两天buzz，感觉buzz和gmail，google map，google reader，android结合的很好，而且这种结合的潜力还只是开发了一点，将来和google的其他服务，比如 doc，checkout，wave，books之类结合后会变得更强大，相比之下twitter太单薄了。估计两三年内buzz会灭掉twitter。

开心啊

Google说要退出中国了，好开心。

终于有个有分量的企业对局域网大声说“不”了。

国人总是喜欢委曲求全，犹如日本人推崇德川家康的忍。Google刚宣布可能会退出中国，立刻就有所谓的互联网观察家跳出来痛心疾首的说Google太不理性太不明智（这个链接防火墙报有病毒，点击请慎重，后果自负），按他的意思google应该继续忍着。

当年1958年的庐山会议上，彭德怀为民请命递上万言书后，很多人跳出来痛批。很多人劝彭认错，劝彭顾全大局，不要分裂党中央，劝得很动感情，劝得痛哭流涕，最后彭德怀无奈认错，做了违心的检查，很多本来认同彭德怀的人，为了所谓的顾全大局也加入了批彭的大合唱。可当年的顾全大局换来了什么呢？换来的是所谓三年灾害，饿莩遍野，没过几年又是文化大革命，整个国家被折腾的快要散了架。委曲不一定能求全。那些当初批彭劝彭的人，没能因一时站对了队伍而幸免，在以后的运动中也大都遭了殃，通向地狱的路，都是自己铺就的。

丧失求真精神比假更加可怕。

有人说这下百度该高兴了，未必。以前是有谷歌这个高个顶着，百度活得轻松写意。可一旦只剩百度一人撑起搜索引擎的天空，原先谷歌承受的很多压力很可能也会转嫁到百度身上，到时恐怕不是CCAV敲4000万的竹杠那么简单。

未来的中国局域网会怎样？庆父不死，鲁难未已。

老毛说过：一切反动派都是纸老虎。Google第一个站出来向这个纸老虎吹了口气。

国内的网站要挂的牌子真不少

今晨看到euro贴出新浪挂的牌子，好奇去国内几个大网站看了看

新浪 20个，其中国家药监局就占了两个

网易 15个

搜狐 11个

优酷 6个

腾讯 18个

CCTV 3个

Google中国 1个，交的保护费太少，难怪在国内处处被刁难

不是一般的黑啊（转贴）

原文地址 https://docs.google.com/Doc?id=dfqptrrs_0d2f75sf9，因国内很多地方已不能访问google doc, 所以转贴之。原文如下：

前情

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
6月18日央视《焦点访谈》

记者：通过谷歌中国能搜索出来的淫秽色情和低俗信息非常的丰富，不仅有交友、视频、还有文字等等，而且搜索起来非常方便，它还提供了这么一种功能，你只要输入一个词，甚至是一个字它就能给你提供若干种选项，更为夸张的是，即使你输入的这个词并不暧昧，但是它却能给你引导到低俗的内容上，不信我们来看一下：输入一个儿子，它下面缺出现了这样的一些选项“儿子母亲不正当关系”等等十个选项，而且这十个选项可以说都将引导你进入到那些低俗的内容，这样的结果应该说我们谁都没有想到。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

参考用“谷歌搜索低俗引导”

谷歌搜索低俗引导

Google的搜索引导词是根据近期搜索频率来分的，也就是说，引导词里会出现最近一段时间内搜索的次数较多的组合。Google Trends上就能查到流量比较大的情况下的搜索频率走势。

而更为先进的Google Insights for Search（http://www.google.com/insights/search/）里则详细地记录下了2004年至今各搜索组合的次数涨落，并且还可细分网页搜索、图片搜索、新闻搜索，和按不同国家与地域、不同时间段来进行检索。

请看图说话。

解读：
在这几张“30天内统计数量”的表里我们可以看到，从6月10日起，“儿子与情人”和“儿子母亲不正当关系”两种搜索组合的搜索率直线上升，而之前的搜索量则几乎可以忽略不计。并且这些搜索近100%都是由北京的用户完成的。而且这些词条总共也就被搜索了十几二十来次。
同样，在搜索频率上升排行中我们也可以得到印证，这两个条目在过去从来没有这么“火热”过。

巧合？

同样是6月10日，同样是北京用户。同样是20次上下的搜索次数。

巧合？

真的是巧合吗？

_________________________________________________-

答疑：

有人问：数据图怎么都一样的？

仔细看，除了6月10日到6月18日的上升趋势惊人一致外，其他是有区别的。

比如第一图6月1日、第二图5月29日、三四图的上升量、五图的5月29与30日之间等等。

愚蠢的是我还是Google?

最近喜欢上了Google Chrome浏览器，运行Google Document确实比其他浏览器都快，而且感觉比Firefox更稳定。最近用Firefox浏览网页，常常出现网页关闭但内存没有释放的情况，开机久了Firefox占用的内存经常上1G，关闭所有网页也没用， Google Chrome就没遇到这个问题。

不过这两天Google Chrome的一个小问题快把我折磨疯了，就是Chrome窗口最大化以后浏览器窗口并不充满屏幕，而是在窗口右边和下面各留5个像素的空间。

结果有时点击右侧的窗口滚动条时，就会不小心点到后面的窗口，点右上关闭按钮时，不小心点了后面窗口的关闭按钮。找遍了Chrome的设置窗口，居然没找到可以修改此项功能的地方。

是我太笨还是google真的变蠢了？

如何用Google Analytics跟踪出站点击

有时候我们需要知道用户是点击了站点中哪个外部链接离开了你的站点。比如当你的购买链接是指向第三方的收费代理，这时候就很有必要知道有多少用户是点击了购买链接离开了你的站点. 单靠平常的在线统计或日志分析(Log Analysis)是不能跟踪的，因为很多时候外部站点不允许你插入统计代码，更不会给你看日志文件。这时候就需要我们动手加点东西来实现对出站点击的跟踪。

以前追踪出站点击的方法主要就是不直接链接到外部站点，而是链接到一个本地文件上，把用户的出站点击经这个文件中转一下。这样通过日志分析(Log Analysis)统计中转文件的访问，或直接由这个中转文件把统计结果写入数据库，以此来实现对出站点击的跟踪。

那么用Google Analytics如何跟踪出站点击呢？有人要说可以在中转文件中插入Google Analytics的代码，实际上有个更简单的办法。在普通网页统计插入的Google Analytics代码中，最后要调用不带参数的urchinTracker() 函数。其实这个函数是可以带参数的。查看http://www.google-analytics.com/urchin.js这个文件，你会发现这个参数名是page，再向下多看看你就很容易发现，这个page参数就是统计页面的url。利用这个函数就可以实现对出站点击的追踪了，将每个出站链接加入如下代码：

<a href=”http://www.waibu.com” onClick=”javascript:urchinTracker(‘/outgoing/1‘);”>链接</a>

这个链接中给出的参数’/outgoing/1‘ 是可以根据自己需要定制的，并不是站点中必须要有的文件。urchinTracker 这个函数你只要给他什么参数他就统计什么，实际是否存在并不关心。加入这段代码后，一旦用户点击，Google Analytics就会记录为一个对’/outgoing/1‘的访问。这样你只用每天看Top Content（最常见内容）报表中’/outgoing/1‘ 的访问数字就能知道点击这个外部链接的访问有多少了。你还可以把’/outgoing/1‘ 定义为一个目标(Goal)，在Google Analytics对目标的转化率Conversion Rate（转化率），Goal Path（目标访问路径）等进行分析。

注：

1.这种跟踪方法在不支持或禁止javascript的客户端是无效的
2.这种跟踪方法的前提是你必须在网页中安了Google Analytics统计代码

标签： google