SEO技术是未来创业者和销售行业从业人员不可缺少的一门技术,seo技术是电子商务的驱动力,西安SEO技术-企尚SEO技术博客将开启你的学习之旅!come on!

搜索引擎面对的挑战

SEO入门 企尚网络 1140℃ 0评论

搜索引擎系统是最复杂的计算系统之一,当今主流搜索引擎服务商都是有财力、人 力的大公司。即使有技术、人力、财力的保证,搜索引擎还是面临很多技术挑战。搜索 引擎诞生后的十多年中,技术己经得到了长足的进步。我们今天看到的搜索结果质量与10年前相比己经好得多了。不过这还只是–个开始,搜索引擎必然还会有更多创新,提 供更多、更准确的内容。10年前相比己经好得多了。不过这还只是–个开始,搜索引擎必然还会有更多创新,提 供更多、更准确的内容。

总体来说,搜索引擎主要会面对以下几方面的挑战。

1.页面抓取需要快而全面

互联网是一个动态的内容网络,每天有无数页面被更新、创建,无数用户在网站上 发布内容、沟通联系。要返回最有用的内容,搜索引笮就要抓取最新的页面。但是由于 页面数量巨大,搜索引擎蜘蛛更新一次数据库中的页面要花很长时间。搜索引擎刚诞生 时,这个抓取周期往往以几个月计算。这也就是Google在2003年以前每个月有一次大 更新的原因所在。现在主流搜索引擎都己经能在几天之内更新東要页面,权重髙的M站上的新文件几 小时甚至几分钟之内就会被收录。不过,这种快速收录和更新也只能局限丁•髙权重网站。 很多页面几个月不被重新抓取和更新,也是常见的。
要返冋最好的结果,搜索引擎也必须抓取尽S全面的页面,这就需要解决很多技术 问题。一些网站并不利于搜索引擎蜘蛛爬行和抓取,诸如网站链接结构的缺陷、大景使 用Flash、JavaScript脚本,或者把内容放在用户必须登录以后才能访问的部分,都增大 了搜索引擎抓取内容的难度。

2. 海量数据存储

一些大型网站单是一个网站就有百万千万个页面,可以想象网上所有网站的贞面加 起来是一个什么数据S。搜索引擎蜘蛛抓取页面后,还必须有效存储这些数据,数据结 构必须合理,具备极高的扩展性,写入及访问速度要求也很高。
除了页面数据,搜索引擎还需要存储页面之间的链接关系及大量历史数据,这样的 数据量是用户无法想象的。据说Google有几十个数据中心,上百万台服务器。这样大规 模的数据存储和访问必然存在很多技术挑战。
我们经常在搜索结果中看到,排名会没有明显原因地上下波动,甚至可能刷新-下 页面,就看到不同的排名,有的时候网站数据也可能丢失。这些都可能与大规模数据存 储的技术难题有关。

3. 索引处理快速有效,具可扩展性

搜索引擎将页面数据抓取和存储后,还要进行索引处理,包括链接关系的计算、正 向索引、倒排索引等。由丁•数据库中页面数量大,进行PR之类的迭代计算也是耗时费 力的。要想及时提供相关又及时的搜索结果,仅仅抓取没有用,还必须进行大量索引计 算。由于随时都有新数据、新页面加入,因此索引处理也要具备很好的扩展性。

4. 查询处理快速准确

查询是普通用户唯一能看到的搜索引擎工作步骤。用户在搜索框输入关键词,单击 “搜索”按钮后,通常不到一秒就会看到搜索结果。表面最简单的过程,实际上涉及非常 复杂的后台处理。在最后的查询阶段,最重要的难题是怎样在不到一秒的时间内,快速 从几十万、几百万,甚至几千万包含搜索词的页面中,找到最合理、最相关的1000个页 面,并且按照相关性、权威性排列。

5. 判断用户意图及人工智能

应该说前4个挑战现在的搜索引擎都d经能够比较好地解决,{H_判断用户意图还处 在初级阶段。不同用户搜索相同的关键词,很可能是在寻找不同的东西。比如搜索“苹 果”,用户到底是想了解苹果这个水采,还是苹果电脑?还是电影《苹果》的信息?没有 上下文,没有对用户个人搜索习惯的了解,就完全无从判断。搜索引擎目前正在致力于基于用户搜索习惯及历史数据的了解上,判断搜索意图, 返回更相关的结果。今后搜索引擎是否能达到人工智能水平,真正了解用户搜索词的意 义和目的,让我们拭目以待。

原创文章,转载请注明: 转载自西安SEO

本文链接地址: 搜索引擎面对的挑战



转载请注明:西安SEO » 搜索引擎面对的挑战

喜欢 (0)or分享 (0)

您必须 登录 才能发表评论!