百度sem推广只专注于做中文搜索

曼朗 | 2016-09-26 11:08:28 | 分享至:

百度技术副总裁刘建国这样分析:“超链分析涉及许多对中文的理解,包括对词汇、语法的理解。如果对中文的理解出现偏差,那么sem推广分析结果就会谬之千里。sem推广搜索结果不准确,就会伤害用户的感情体验,更终导致网民流失。”     

百度总裁李彦宏对此似乎更有发言权,他说:“我们只专注于做中文sem推广搜索,而这正是Google在中国的软肋。从sem推广搜索技术上讲,中文与英文的语言逻辑有许多差异非常大的地方,英文单词之间有空格,而中文是象形单音文字,中文行文在字与字、词与词之间没有空格,需要自己进行分拆,这些都给擅长英文搜索的Google出了难题。”     

百度sem推广只专注于做中文搜索

此时,百度sem推广搜索引擎能链接到的页面量大概超过了1.3亿,并收集了约30万个关键字。如果把这个庞大的关键字数“排列组合”,那么就可以衍生出100万个关键词,这个范围几乎已经包含了所有可以商业化的中文词语,这个数量在当时已经超过Google50%以上。     

实际上,百度早在2000年开始就不断积累自己的语料库,并与中国权威中文机构人民日报合作,共享人民日报的语料库。刘建国甚至毫不避讳地公开表示说:“丰富的语料库来自于百度的积累,百度每天都要处理上千万中文网页,处理中文网页的过程实际上就是中文词汇积累的过程。”     

由此可见,sem推广在超级链接的环节上百度已占有绝对的优势,而Google只能望洋兴叹。在网页抓取方面,技术上基本持平的双方可以说势均力敌,但事实上则不然。     

首先双方有地理位置上的差异。百度占着本土优势,而Google棋差一招。Google的服务器在遥远的太平洋彼岸,搜索的响应速度相较此时技术全面提升的百度而言已经慢了下来,同时,地理位置还导致GoogleIP地址时常因“不合法性”而被封杀,这在用户体验方面大打折扣。由此可见,百度的“地利”优势为百度奠定了胜利的基础,这是一道海外竞争对手无法逾越的鸿沟。     

其次,Google在网页抓取技术上还处于有待提升的劣势。电影《超人》和《蜘蛛侠》都印证着一句话“能量越强责任越大”,所以,虽然Google的技术团队和整体规模都远胜当时的百度,不过Google需要对全球数以亿计的网页进行更新,这无疑对Google的中文搜索产生了一定的束缚,而在这种庞大工作量的基础上,Google想再提升中文网页的数量无异于“心有余而力不足”。反观百度一方,专注中文搜索领域,在现有的基础上提升网页量完全可以调动百度技术人员全力以赴。可以说,百度技术团队完全能够做到李彦宏“指哪”他们便能“打哪”。    

所以,在网页抓取方面,Google看似资源雄厚、团队庞大,却早已经处于劣势。

互联网营销诊断 /根据您市场目标提供相应的营销诊断书

最新资讯The latest information