搜索引擎的分类有哪些「附:搜索引擎基础架构概述」

小伙伴们哈喽,这次其他的杨焱淼就不说了,主要就是来讲讲搜索引擎的分类有哪些,搜索引擎基础架构概述,还有关于搜索引擎,网页,用户等等各种相关干货,希望你们能通过这篇文章很好的掌握其中的技巧,下面我就来为大家全部一一解析!

大家一定不会多搜索引擎感到陌生,搜索引擎是互联网发展的最直接的产物,它可以帮助我们从海量的互联网资料中找到我们查询的内容,也是我们日常学习、工作和娱乐不可或缺的查询工具。
之前本人也是经常使用Google和Baidu搜索,而对搜索引擎的知识架构没有一个整体的概念。前一阵子的实习,使我有机会全面的了解了搜索引擎,感觉还是蛮有意思。所以,即使在面临找工作的高压下,也一定要抽时间来总结和回顾一下学到的知识,以便以后查阅,如果能给其他人带来帮助,那最好不过了。
搜索引擎的标准定义:搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。从上述定义中我们可以获得几个有关搜索引擎的关键步骤,分别为:搜集信息;组织和处理信息;展示信息。其实,真正的搜索引擎架构也正是根据这三大块进行构建的。
1. 搜索引擎分类
搜索引擎多种多样,类别繁多,其中根据工作方式可以分为如下几类:
1)全文搜索引擎
全文搜索引擎可以说是真正的搜索引擎,包括我们身边的Goggle、Baidu等耳熟能详的大搜索引擎,其都属于是全文搜索引擎。全文搜索引擎是从网站提取信息从而构建网页数据库的。
全文搜索引擎的是如何搜集网站的呢?其实这里一般有两种方法:
1> 搜索引擎定期派出网络爬虫(也成为是蜘蛛或者机器人),对互联网中的网站进行检索,一旦发现有新的网站就会自动抽取其信息,然后加入到自己的数据库中;
2> 网站拥有者主动向搜索引擎提交自己的网站信息,但是主动提交网站并不能一定确保自己的网站会被搜索引擎收录,网站拥有者可以通过外链来提升自己网站的受关注度(这属于SEO的知识了)。
全文搜索引擎如何展示查询结果?
当用户输入查询词(query)查询时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
我们可以看到,全文搜索引擎的特点就是搜全率比较高。
2)目录搜索引擎
目录搜索引擎主要是按类目对网站进行收录,而且在查询时也不需要输入关键词,最为典型的目录搜索引擎就是Sina、Yahoo等。
目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。如果把书比作是网站,它就像是我们去图书馆一级一级地按区域寻找我们需要的书一样,所以很形象地被称为是目录搜索引擎。
3)元搜索引擎
元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
4)垂直搜索引擎
在介绍垂直搜索引擎之前,我们先解释一下横向行业和垂直行业的含义。
横向行业一般指跨行业,包含有多个领域或行业;而垂直行业特指某个行业或者某个领域。
理解了垂直行业,我们就不难理解垂直搜索引擎了。垂直搜索引擎是近年来新兴起的一种搜索引擎,不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索、购物搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。比较典型的垂直搜索引擎代表有,去哪儿网、携程等。
5)其他类目的搜索引擎
除了上述四类搜索引擎以外,还有集合式搜索引擎、门户搜索引擎以及免费链接式搜索引擎,这里就不一一详细介绍了。
2. 搜索引擎的基础架构
一个优秀的搜索引擎需要复杂的架构和算法,以此来支撑对海量数据的获取、存储,以及对用户查询的快速而准确地响应。从架构层面,搜索引擎需要能够对以百亿计的海量网页进行获取、存储、处理的能力,同时要保证搜索结果的质量。
构建一个搜索引擎的基础架构,要考虑如下三个问题:
如何获取、存储并计算如此海量的数据?
如何快速响应用户的査询?
如何使得搜索结果能够满足用户的信息需求?
下图是一个通用的搜索引笨架构示意图:
搜索引擎的分类有哪些,搜索引擎基础架构概述,搜索引擎,网页,用户

好了,这篇文章就到这里吧,如果能帮到你我就很开心了,搜索引擎的分类有哪些「附:搜索引擎基础架构概述」这篇文章让你学习到一些知识的话,那就帮忙分享给你朋友吧!

本文发布者:万事通,不代表寂寞网立场,转载请注明出处:https://www.jimowang.com/p/6221.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jimowangmail@126.com 举报,一经查实,本站将立刻删除。

(0)
上一篇 2022年9月17日 16:19
下一篇 2022年9月17日 16:23

相关推荐

  • 今日谷雨,下一个节气就是立夏了

    大家好,我是本站的新闻评论员褚逸飞,为您解读最新的资讯事件,近来,有关今日谷雨,下一个节气就是立夏了的报道频频见诸新闻,引起了网友们的极大兴趣,现在,就请跟我一同探索这个事件的背后故事吧! 谷雨是春季的最后一个节气,此时节,降雨量增多,万物生长。柳絮飞落,过敏体质者外出要做好防护。下一个节气就是立夏了。抓住春天的尾巴,继续努力! 谷雨,是二十四节气之第6个节…

    2023年4月20日
  • 无钢圈文胸哪个品牌好「秒懂:无钢圈文胸和有钢圈文胸哪个好」

    小伙伴们大家好,这次周芷歆早带大家来分析下关于无钢圈文胸哪个品牌好,无钢圈文胸和有钢圈文胸哪个好,还有关于文胸,内衣,品牌,知名品牌,集团这些的内容,其实这篇文章主要还是为新手朋友整理的,总的来说思路还是很重要! 爱慕/AIMER 北京爱慕内衣有限公司,专注于高端品牌内衣及服饰,并涉足文化产业投资设立了丝绸文化品牌皇锦、游园惊梦昆曲会馆、爱慕美术馆等。总部位…

    2023年2月4日
  • 无刷电机的发明者李洪涛现怎么样了?

    哈喽,小伙伴们大家好,今天王嘉通废话就不多说了,直接上干货,标题:无刷电机的发明者李洪涛现怎么样了?,还有干货发明者,警察,拘留所等等各种精品,希望各位能认真阅读。因为,只有这样才能真正理解和掌握! 1992年,位于昆明收容拘留所内,李红涛不耐烦地瞧着桌面,对警察说道:“我该说的都说了,赶紧宣判吧!三个月内不宣判,我就再逃一次了!” 显然,对面坐着的办案人员…

    2022年12月14日 自媒体
  • 都说鱼和熊掌不可兼得,可我偏要勉强「详细讲解:鱼和熊掌终究不可兼得什么意思」

    大家好,很高兴又和你见面了,感谢你能经常过来支持尤泽莹,这次我们就来聊聊都说鱼和熊掌不可兼得,可我偏要勉强,鱼和熊掌终究不可兼得什么意思,还有干货熊掌,东宫,美颜,这个世界,有点儿等等各种精品,这篇文章对新手朋友来说是比较重要的,因为涉及到各个方面,阅读完你一定能有所收获! 最近尤泽莹终于开始看起了大家早已刷过的《东宫》这部剧,之前之所以不看,一是因为没有时…

    2023年2月20日 自媒体
  • 手机广告太多怎么关闭广告(去除手机烦人广告推送的操作方法)

    大家好,我是本站的消息搜集者朱玉,今天有什么话题想跟大家分享呢?近来,有关手机广告太多怎么关闭广告(去除手机烦人广告推送的操作方法)的报道频频见诸新闻,引起了网友们的极大兴趣,下面,就让我为大家讲解一下这个事件的详细经过吧! 如今使用华为手机的用户越来越多,那我们在使用华为手机的时候,最烦心的就是手机不停的像我们推送一些广告或者消息通知,而这些广告消息多数都…

    2023年4月1日
  • 2023年淘宝38节活动便宜还是315 推荐淘宝315和38哪个活动力度大

    各位小伙伴们,大家好啊,今天冯乔盛想和你们聊聊2023年淘宝38节活动便宜还是315,淘宝315和38哪个活动力度大这个话题,还有关于力度,玩法,商品,都会,红包这些的最新实用干货和分享内容,认真思考总结之后,我决定写下这篇文章,希望能够为大家提供一些有用的建议和指导。 2023年淘宝38节活动便宜还是315是很多友友在问的,毕竟淘宝作为排名前几的网购平台,…

    2023年5月11日