我在前两天的帖子里就提到百度快照出现了1970-1-1这个时间的网页快照,不得不令人感到惊讶。1970年百度还没出生,中国互联网还没开始发展呢,这个时间很是诡异,难道清明节来了,百度的快照也要祭拜一下祖先?
下面是我在百度里的截图,截图不止一个,看来百度有1970年的网页快照不是偶然。
这几张图只是我发现的几个,我想没有被我发现的还有更多。打开正在使用的Windows XP系统时间,可以看出XP的系统时间是从1980年开始到2099年这个时间范围里的。很明显,百度的快照服务器不是俺们用的XP系统了,嘿嘿。如果是XP系统,它出错也不至于弄出个1970年而应该是1980年,不过无论是1970年还是1980年,我都没出生呢。
听说,目前流传一个时间病毒很厉害,会自动修改系统的时间到1970年,你手动改好时间,一会这个病毒又自动改成它的初始时间。难道,百度的服务器也中毒了?!百度那么NB的工程师不至于要我来教嘛。
应对措施:采取这个方法来对付这类顽固的病毒――就是取消当前所有时间修改权限,让病毒也没有权限去修改时间。
不过,我想百度肯定没有时间来看我的这篇文章了。暂且一笑而过。
我们再来看linux操作系统,linux的内核时间实际上是记录从1970年1月1日距离现在的秒数,并且以GMT(格林尼治时间)(或者叫UTC- Coordinated Universal Time)为标准,UTC是不随着DST(夏令时)变换,需要有变化的是由应用程序自身来完成时间的转换。
所有32位电脑系统都用带符号32位整型来存储Time_t的值,也就是说Time_t只能用31位二进制数来表示(第一位用来表示正负号),Time_t是C/C++ 等编程语言在内部代表/存储日期和时间的一种数据类型。Time_t实际上是一个代表秒数的整数,当它的值为0时,代表的时间是1970年1月1日12:00:00;当Time_t=60时,则表示1970年1月1日12:01:00,依此类推。
根据百度快照的这个时间的情况,难道百度服务器系统已被破坏?!从而使得抓取这些网页的时候,系统自动调用了初始时间1970年?
从另一个方面来看,这些个1970年的网页在百度里的排名还是不错的,有的甚至排在前三名;那也可以看出,百度快照出现1970年的网页也不是百度要惩罚这些网站的手段了。百度的姨妈又来了。不过这个错误,还不至于对百度的用户搜索体验产生多大的影响,因为百度的搜索体验本就 “Just SO SO” !