教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 文库大全 > 求职职场 >

互联网搜索引擎的发展_应用和特点_王庆民

来源:网络收集 时间:2026-04-12
导读: 互联网搜索引擎的发展、应用和特点 王庆民 (西北政法大学南校区图书馆,陕西西安710122) 摘 要:搜索已经成为网络生活的一部分,工作需要搜索技术文档、客户信息;购物需要搜索商品信息和指南;娱乐需要搜 索相关背景资料和图片。网上的信息搜索技术越来越多

互联网搜索引擎的发展、应用和特点

王庆民

(西北政法大学南校区图书馆,陕西西安710122)

要:搜索已经成为网络生活的一部分,工作需要搜索技术文档、客户信息;购物需要搜索商品信息和指南;娱乐需要搜

索相关背景资料和图片。网上的信息搜索技术越来越多,了解和使用搜索引擎就显得日益重要。关键词:因特网;搜索;搜索引擎;发展;应用中图分类号:TP399

文献标识码:B

文章编码:1672-6251(2009)05-0098-04

Internetsearchengine'sdevelopment,applicationandcharacteristics

WANGQing-min

(SouthCampusLibrary,NorthwestUniversityofPoliticsandLaw,Xian710122,China)

Abstract:Searchhasbecomeapartofnetworklife.Workrequirestechnicaldocumentation,customerinformation;Shoppingrequirescommodityinformationandguidance;entertainmentneedsbackgroundinformationandpictures.Therearemoreandmoreonlineinformationsearchtechnologies,useofwhichhasbecomeincreasinglyimportant.Keywords:Internet;Search;Searchengine;Development;Application

因特网是一个无边无际的信息海洋,每天都有新的网站出现。大量网页每时每刻都在更新,内容包罗万象。想要找到所需的资料,简直如同大海捞针。从浩如烟海的信息中迅速准确地获取自己需要的信息,就需要借助于网页搜索工具。网页搜索工具即搜索引擎,按其工作方式主要分为全文搜索引擎、目录索引类搜索引擎和元搜索引擎。

断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider程序[4]。

1993年,MatthewGray开发了WorldWideWebWanderer,这是第一个利用HTML网页之间的链接关系来检测万维网规模的机器人程序。开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址。

1搜索引擎的发展史和应用

1990年以前,没有任何人能搜索互联网。1990

1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和DavidFilo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo的数据是手工输入的,所以不能真正被归为搜索引擎。事实上只是一个可搜索的目录。雅虎于2002年12月23日收购Inktomi,2003年7月14日收购包括Fast和AltaVista在内的Over-

年,加拿大麦吉尔大学计算机学院的师生开发出

Archie。当时,万维网还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分布在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索。Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的,自动搜集信息资源,建立索引,提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。

ture,2003年11月,Yahoo全资收购3721公司。

1994年7月,卡内基.梅隆大学的MichaelMauldin将JohnLeavitt的spider程序接入到其索引程序中,创建了Lycos。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远

Robot(机器人)一词对编程者有特殊的意义。ComputerRobot是指某个能以人类无法达到的速度不

收稿日期:2009-03-13

作者简介:王庆民(1959-),男,专科,副研究馆员,研究方向:互联网搜索引擎。

作自己的生日。Google以网页级别为基础,判断网页的重要性,使得搜索结果的相关性大大增强。Google公司的奇客(Geek)文化氛围,不作恶(Don’tbe

胜过其他搜索引擎的数据量。

1995年,一种新的搜索引擎形式出现了—元搜索引擎(AMetaSearchEngineRoundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎是Washington大学硕士生

evil)的理念,为Google赢得了极高的口碑和品牌美誉。2006年4月,Google宣布其中文名称”谷歌”。这是Google第一个在非英语国家起的名字。

Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月发布了自己的搜索引擎AllTheWeb.Fast,创立的目标是做世界上最大和最快的搜索引擎,Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索。还提供新闻搜索、图像搜索、视频、MP3和FTP搜索,拥有极其强大的高级搜索功能(2003年2月25日,Fast的互联网搜索部门被Overture收购)。

EricSelberg和OrenEtzioni的Metacrawler。

1995年12月,DEC正式发布AltaVista。Al-taVista是第一个支持自然语言搜索的搜索引擎,也是第一个实现高级搜索语法的搜索引擎(如AND,

OR,NOT等)。用户可以用AltaVista搜索新闻组的内容并从互联网上获得文章,还可以搜索图片名称中的文字,搜索Titles,搜索Javaapplets,搜索ActiveX

objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一是搜索链接指向某个URL的所有网站,在面向用户的界面上,

1996年8月,Sohu公司成立,制作中文网站分类目录,曾有“出门找地图,上网找搜狐”的美誉,随着互联网网站的急剧增加,这种人工编辑的分类目录已经不适应。Sohu于2004年8月注册独立域名的搜索网站“搜狗”,自称第三代搜索引擎。

AltaVista也作了大量革新,它在搜索区域放了“tips”以帮助用户更好的表达搜索模式。这些小tip经常更新。这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的有趣功能。这些系列功能,逐渐被其他搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的[1]。

Openfind创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,

1995年9月26日,加州伯克利分校助教EricBrewer,博士生PaulGauthier创立了Inktomi。1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前,声称每天能抓取索引1000万页以上,所以有远超过其他搜索引擎的新内容,HotBot也大量运用cookie储存用户的个人搜索喜好设置。

Openfind重新发布基于GAIS30Project的Openfind搜索引擎Beta版,推出多元排序,宣布累计抓取网页

35亿,开始进入英文搜索领域。2000年1月,两位北大校友,超链分析专利发明人,前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度

(Baidu)公司,2001年8月

发布搜索引擎Beta版(此前Baidu只为其他门户网站如搜狐、新浪、Tom等提供搜索引擎),

1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一。它没有Stop

Words。它有出色的CurrentNews,7100多种出版物组成的SpecialCollection,良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类[1]。

…… 此处隐藏:3623字,全部文档内容请下载后查看。喜欢就下载吧 ……

互联网搜索引擎的发展_应用和特点_王庆民.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wenku/119584.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)