美东时间3月8日消息:旧金山CNET报道:Google 搜索引擎将研究更好的分治数据的方法,避免Google超过80亿之巨的网络索引数据库继续扩大。
以上是Google搜索质量主管Peter Norvig周二在语义技术研讨会上所作演讲的部分内容。Norvig是NASA的一位前雇员,曾经出版多部关于人工智能,主要研究项目等的书籍,这些也是公司正在开发的有助于分类数据及改善搜索结果相关性的课题。
以上项目的作用主要是为搜索结果增加新的聚类能力,提供相关搜索建议,促使搜索结果个性化以及针对搜索请求挖掘实际答案等,Norvig解释道。“我们希望利用更宽的带宽实现这种信息通讯,”Norvig说。“问题的关键则是什么才是最适合的语言。”
尽管近年来为了保持最大文档索引库的地位已经面临着严重的竞争压力,但Norbig仍然表示他预计Google数据库不会增加更多的毫无伪造编目或无用网页的网络文档。至今该公司已经通过多种程序姜许多不可获得的数据加入其网络搜索引擎数据库,如图书内容或电视节目等信息。
Norbig强调去年一位Google雇员撰写的一篇关于分类引擎的研究论文正在被公司开发试验。该技术可将准确的名词或复合名词解析为多个种类,从而传输聚类结果。譬如,当以“ATM”作为搜索请求时,该分类引擎可利用“such as”词组与该词同时在被索引网页查找从而发现与“high-speed networks”词组链接的结果。因此,当搜索高速网络时可能就出现ATM聚类搜索结果。
Norvig还表示某些技术可被用于从网络上挖掘到针对搜索请求的实际答案,如“President Lincoln’s birth date”等。该技术可针对微软最近为其数据库加入的百科全书答案搜索形成直接压力,微软的技术应该归功于微软电子百科全书软件,Norvig说。这是因为如果搜索用户的请求不精确,MSN搜索引擎的返回结果可能会遗漏用户实际需要的答案,相对而言,Google则是从网页上汲取语义及各种语言找到匹配答案。
Norbig还就Google的人造卫星地图绘制服务Keyhole做了说明。他说到在未来时间里,公司将把地图及地方信息更好的集成进商业和视觉搜索中。“当人们随时携带这些设备之时,能够返回实际世界的信息显得尤为重要。”(编译Lela)