微点交流论坛
» 游客:  注册 | 登录 | 帮助

 

作者:
标题: 搜索引擎技术成就搜狗输入法
陪我做了
新手上路





积分 5
发帖 5
注册 2008-10-14
#1  搜索引擎技术成就搜狗输入法

长期专注于搜索引擎技术服务的搜狗(Sogou.com)在两年前“出人意料”地开发出了一款拼音输入法,从此威震江湖。中国大多数的网友都对这个搜狗输入法的名字耳熟能详,同时也有数以万计的网友在每天使用它,它的成功举世公认。然而,真正明白这其中成功奥妙的朋友,其实却并不算多。

众所周知,搜狗输入法在词库方面具有鲜明的特色,其词库不仅超大全面,而且词条质量也很高。随着搜狗输入法的不断普及,越来越多的用户体验到了搜狗输入法的超级流畅性,但是这样的流畅性是以一个优秀的词库为基础的。作为一个输入法的核心部分,搜狗的超强词库是怎样来的呢?

拼音输入法的词条源、词频统计、词库过滤系统以及智能整理、人工整理、注音工程、新词发现系统、词库验证体系……等等这一系列知识,似乎都太过专业与生涩。但是,事实上,我们无需去考证太多的技术方法,而只要在这套方法里去比较搜索引擎技术的独特长处,便基本能够窥出搜狗拼音输入法的成功秘诀了。原因在于,搜狗拼音输入法的成功奥妙,恰恰正是因为其是“基于先进的搜索引擎技术而研发的”。

搜狗是一家搜索引擎公司,自然会有一批自己做文本分析的词库,它包含了常用的基本词汇和部分专业词汇,但是在数量上还是远远不能覆盖用户对词汇的需求空间。经过分析可知,这部分缺少的词中有相当一部分是人名、地名、歌曲、小说、财经、旅游、游戏、体育等。幸运的是,搜狐矩阵蕴含着许多搜狗需要的这些资源,比如地名资源可以从go2map拿到,歌曲资源可以从搜狗的音乐搜索拿到,小说资源可以从搜狐网拿到,游戏词汇可以从17173游戏网拿到……这些资源虽然是内部资源,但是当初也是编辑经过长时间大量的整理维护工作的结晶,并且这涉及到大量部门间的合作,每一个流程下来都会花许多精力。

搜狗输入法的成功凝聚了众多开发工程师、测试工程师和网络编辑人员的心血。而在这其中,搜索引擎技术为其研发贡献的突出力量。搜狗搜索以一种人工智能的新算法,分析和理解用户可能的查询意图,对不同的搜索结果进行分类,对相同的搜索结果进行聚类,在用户查询和搜索引擎返回结果的人机交互过程中,引导用户更快速准确定位自己所关注的内容。该技术全面应用到了搜狗网页搜索、音乐搜索、图片搜索、新闻搜索、地图搜索等服务中,帮助用户快速找到所需的搜索结果。这一技术也使得搜狗的问世标志了全球首个第三代互动式中文搜索引擎诞生,是搜索技术发展史上的重要里程碑。

※ ※ ※ 本文纯属【陪我做了】个人意见,与【 微点交流论坛 】立场无关※ ※ ※
2008-10-14 19:23
查看资料  发送邮件  发短消息   编辑帖子



论坛跳转:

可打印版本 | 推荐 | 订阅 | 收藏


[ 联系我们 - 东方微点 ]


北京东方微点信息技术有限责任公司 福建东方微点信息安全有限责任公司

闽ICP备05030815号