欢迎光临 TXT小说天堂 收藏本站(或按Ctrl+D键)
手机看小说:m.xstt5.com
当前位置:首页 > 励志书籍 > 《百度创业内幕》在线阅读 > 正文 第13章 用技术克敌制胜(2)
背景:                     字号: 加大    默认

《百度创业内幕》 作者:周艳国

第13章 用技术克敌制胜(2)

  刘建国在后来曾公开表示:“百度有专门的团队进行中文语料的分析,专门研究中文切词。有经验的技术人员凭经验就能分析出什么样的链接是用户最需要的。”他甚至含沙射影地说:“竞争对手要培养出这样一个团队,至少需要两年时间,因为专注中文搜索引擎的百度为此花费了整整四年的时间。”刘建国的话显然已经涉及到了百度公司的机密,不过他如此“大放厥词”却毫无顾忌,其已经是在告诉百度最大的竞争对手Google一个事实:百度已经在此方面领先了他们四年。

  而李彦宏则更为直接,他说:“(百度)基于用户体验的中文搜索引擎技术是需要经过长年累月的积累(才能)得到的,绝非Google的中文服务一朝一夕能开发出来。”

  由此可见,在中文搜索引擎技术的网页检索方面,百度的技术已经反超Google成为新的引领者。

  对于最后一个方面——搜索服务,这是一个比较复杂甚至是琐碎的一个方面,这也是与客户面对面接触,检验搜索引擎技术优良的最终所在。

  百度为了满足各种用户的不同需求,专门为此设定了一个工作流程,即首先由市场部门提供调查的数据,然后交予产品管理部门,产品管理部门在此基础上提出需求,最后技术研发部门把这种需求形成技术方案、生成技术产品,再进行反复检测,进而达到优化的目的,可以说百度对用户的服务已经到了家。

  不过,虽然百度搜索引擎技术各方面的优秀性已经全面超越Google,并得到了业界人士和用户的认可,但是,外界对百度在搜索服务方面却颇有微词。有人认为百度“模仿”甚至是“抄袭”了Google的技术。

  刘建国对于这样的说法并不反对,他说:“在中文搜索方面,实际上Google后来是学我们的。”言外之意,百度先前确实向Google学习过。

  正如刘建国说的一样,Google后来确实向百度学习了不少。百度在实践中发现有些用户习惯用拼音,而中国文化的原因致使用户有时打出一个拼音后并不能出现对应的汉字,这就为用户带来了一些苦恼和麻烦。百度了解到检索中“同音异字”的问题后,不久便推出了拼音检索,只要用户键入拼音,百度就会出现相应的中文汉字选择。这项搜索服务后来被Google“挪用”了过去。

  同时,百度的中文搜索,即针对用户打错别字的情况,百度可以给出正确汉字的提示,以及百度细化搜索需求的“相关搜索”,即用户搜索资料时与目标资料相关的、详细的资料呈现的同时,百度可以进一步细化搜索需求。当然,这些搜索服务同样在Google的中文搜索引擎上“安家落户”。

  俗话说:“对竞争对手最好的赞美是模仿。”如此看来,百度“模仿”Google也好,Google“复制”百度也罢,双方都是在用实际行动赞美着彼此在搜索引擎领域所取得的成就。

  但是,李彦宏却明显不承认百度“模仿”Google,他在接受国外媒体采访时坚决否定百度“模仿”Google的说法,并称1998年成立的Google,其Pagerank技术是他的技术专利。这不免让人联想起前文中提到的一幕:1998年,李彦宏在澳大利亚自己举办的技术交流会上,让两个来自斯坦福大学的学生毫无保留地“共享”他关于搜索技术的研究成果。

  但无论怎样,百度已经在搜索引擎的四大环节上取得了全面胜利,可是,作为百度掌舵者的李彦宏却认为,在中文搜索引擎技术上战胜世界最大的搜索引擎技术公司Google并非是百度的一己之功,还有很大一方面要归功于中国博大精深的汉字和汉语言文化。

  Google想要把中国的普通话、各个地方的方言融会贯通或者说领会得明白,不在一个长期的语言环境里浸泡是体会不到的。如果它想“一口吃个胖子”,那么即便是鲁迅先生笔下描写的孔乙己也会用四种“回”字的写法把它拒之门外。与其不说一个字有几种写法,单是一个字在字面上和其真实意义之间都有着不小的差别,加之中国的文化背景、历史典故,很多文字都被睿智的中国人隐含了更深层的意思,这也正是有人给学中文的洋人讲中文笑话而冷场的原因。所以,Google想弄懂中文,决非一朝一夕之功。

  其实,Google败给百度,不应该委屈,这从中国屈指可数的居世界领先水平的几大高科技技术产业上就能找到安慰。比如中国的汉字激光照排系统至今领先世界,原因无他,都是依托中国汉字和汉语言文化的雄厚底蕴。

  由此可见,百度是站在中国汉字和汉语言几千年形成的文化巨人的肩膀上,其成立之初已经立于不败之地。或许这才是李彦宏敢以15人挑战800人的最大信心所在。这也折射出了一个道理:只有对文化深度了解,产品才能更贴近用户。

  自“闪电计划”之后,百度就把技术作为一项坚持不懈的重要工作对待,并进一步优化了百度的中文搜索引擎。其不但把本就落后于百度的中国内地搜索引擎3721等远远甩在后面,而且强劲的对手Google也被其逐渐拉开距离。

  从后来百度的发展上看,“闪电计划”不但使百度在技术上达到了预期目标,而且自此之后,百度的中文搜索引擎技术再也没有给对手任何超越的机会,其成为当之无愧的中文搜索引擎技术的“世界之最”。

  3.“黑客攻击事件”

  “闪电计划”历时10个月,于2002年底胜利完成,可以说2002年是百度技术攻坚之年,李彦宏也称2002年为百度的“技术年”。这是一场“战争”,是百度决定自我命运的第一次技术之战,是百度与世界最大搜索引擎Google的“不宣而战”,换言之,这亦是李彦宏在中国本土的复仇之战。

  但是,有人还是怀疑百度的技术力量,并发出了挑衅。就在百度的工程技术人员还没来得及感受丰收的喜悦时,“敌人”来了,这便是所有百度元老们刻骨铭心的“黑客攻击事件”。

  2003年5月15日晚上10点钟,百度晚班的一位工程师正在后台像往常一样工作。“闪电计划”的成果显著,他看着渐渐上涨的百度流量满是欣慰。突然,他的笑容僵住了,他骇然地发现,同一个词短时间内被查询了38863次,而更加可怕的是如此恶意的查询请求成千上万,片刻间百度的带宽消耗比平时暴增25%以上。

  随后,正常用户的查询受到严重影响,甚至无法响应,这让刚刚胜利完成“闪电计划”的百度技术团队既害怕又气愤。于是,他迅速上报,很快百度所有技术工程师无论是下班的、请假的全部连夜赶回公司商议对策。这是百度有史以来遭受的最大的一场技术挑战,作为一家以技术起家、技术底蕴深厚的公司来说,这种尊严是绝对不容挑衅的。

  2003年5月16日,恶意攻击更加猛烈,每秒钟的攻击次数已经超过了1000次。在互联网界,每秒超过百次的恶意攻击已经是十分严重的了,由此可见百度面临的严峻形势。

  如果百度服务器被黑客全线攻破,后果将不堪设想,这会直接导致中国大多数网民无法在雅虎中国、搜狐、新浪、网易等百度提供搜索引擎服务的各大门户网站上查找任何信息,其对百度的声誉和经济所造成的影响和损失无法估量。

  百度技术工程师分析出黑客的攻击方法后更是感到了空前的压力,因为这种攻击就是业界著名的、曾使全球互联网都一度陷入瘫痪的、典型的“分布式拒绝服务攻击”——DDOS攻击。

  1993年7月和8月两个月份,席卷全球的“红色代码”(code red)病毒和其随后升级版“尼姆达”(Nimda)病毒就是以这种DDOS方式肆虐互联网,并导致全球数以百万计的服务器和个人电脑被感染,同时造成大量网站被迫关闭、众多企业网络中断或局域网阻塞、高效电子商务和网络办公系统几乎陷入瘫痪……其强大破坏力对全球网络造成的损失高达上百亿美元,由此可见DDOS的破坏力。

  其实,DDOS攻击起源于DOS攻击。DOS攻击是黑客在网络宽带小、网络速度较慢情况下的一种恶意攻击。但是,由于这种攻击需要足够的带宽要求,而以个人为单位的黑客很难使用到高带宽资源,所以这种程度的攻击一般很难掀起风浪。如此,疯狂的黑客们为了达到他们的不轨目的,在此基础上开发出了一种利用工具结合诸多网络带宽同时对同个目标发动大量攻击请求的攻击手段,即DDOS攻击,通俗地讲,就是同时向服务器发送大量伪造的服务请求,最终让服务器身衰力竭而亡。

  显然,这种性质的恶意攻击,并非一两个黑客就可以操控,这也决非几个黑客力所能及。因为,DDOS攻击需要满足几个必要的条件,首先是多个地点,然后是每个地点都要有大量攻击的黑客,最后所有的攻击都在同一时间段内进行。

  正常情况下,DDOS攻击的作用并不会被马上察觉到。一般情况下,在遭受DDOS攻击后,越大的网站受到的影响越晚,因为大型网站电脑中通常有缓存支持,所以攻击所造成的损害通常会通过一些小网站的不工作显现出来。此次黑客使用DDOS手段攻击的目标并非其他或大或小的网站,而是直指百度。所以百度才第一时间发现了数据异常,并断定遭到了黑客恶意攻击而立即采取防御手段。从黑客这种直接“袭击”的方式上来说,百度是幸运的。

  同时百度工程师发现,黑客的切入口是百度一个合作伙伴的IP地址,百度的每一位合作伙伴都有属于自己的一个标识,即通行证,黑客正是利用此客户的系统漏洞“乔装改扮”进而实施对百度服务器的攻击。从攻击源地址大多来自英国和西班牙上判断,百度断定这场长时间、大规模、多地点同时对百度网站进行的攻击行为一定是蓄谋已久。

  2003年5月17日下午4点,在IP被冒用的合作伙伴的配合下,在全体百度技术工程师的共同努力下,双方的争斗终于进入了白热化阶段。黑客已经揭去面纱,与百度技术工程师展开了“白刃战”。一时间,大量的恶意搜索请求铺天盖地而来,百度数十位技术工程师齐上阵,与对方展开厮杀,任凭黑客使出浑身解数,也无法突破百度后台。

  百度前端的网民和百度的网站客户自百度开始应急措施后,便恢复了正常的网速和良好的服务器运转,这与此时对战的双方在服务器后台的激烈厮杀形成鲜明的对比,真可谓台前波澜不惊,台后激流涌动。

  2003年5月18日下午,黑客再无建树,无奈之下只好无功而返。百度的技术团队历时66小时的连续战斗终于继“闪电计划”胜利完成后,又迎来了一次技术战争的全面胜利,不同的是这次对战惊心动魄。

  其实就互联网企业而言,这种被黑客恶意攻击服务器的情况时有发生,而且越是在企业初创期危险系数越高,所遭受的攻击也越庞大和犀利。坚持不住,很可能从此一蹶不振,能坚持住,这方面的骚扰便会越来越少,甚至到后来可以忽略不计。

  黑客攻击事件后,百度技术副总裁刘建国接受了媒体采访,他当时说:“此次国内外黑客与百度防御技术的大比拼,黑客没有占到丝毫的便宜,攻击对百度的带宽、CPU资源只造成了轻微损坏,很快就会恢复。”但遗憾的是,百度这次遭到大量黑客的恶意攻击,究竟是竞争对手的“借刀杀人”之举,还是国外黑客组织一时技痒的挑衅之为,因为没有确凿证据而成了“无头悬案”。不过,正如百度分析的一样,如此规模的黑客攻击绝非巧合,而百度对此事的不了了之也给予了媒体和IT人士广泛的想象空间。

www.xiaoshuotxt.net[T.xt^小.说.天)堂)
上一章 下一章 (可以用方向键翻页,回车键返回目录) 加入收藏周艳国作品集
百度创业内幕