互联网搜索引擎的发展_应用和特点_王庆民
互联网搜索引擎的发展、应用和特点
王庆民
(西北政法大学南校区图书馆,陕西西安710122)
摘
要:搜索已经成为网络生活的一部分,工作需要搜索技术文档、客户信息;购物需要搜索商品信息和指南;娱乐需要搜
索相关背景资料和图片。网上的信息搜索技术越来越多,了解和使用搜索引擎就显得日益重要。关键词:因特网;搜索;搜索引擎;发展;应用中图分类号:TP399
文献标识码:B
文章编码:1672-6251(2009)05-0098-04
Internetsearchengine'sdevelopment,applicationandcharacteristics
WANGQing-min
(SouthCampusLibrary,NorthwestUniversityofPoliticsandLaw,Xian710122,China)
Abstract:Searchhasbecomeapartofnetworklife.Workrequirestechnicaldocumentation,customerinformation;Shoppingrequirescommodityinformationandguidance;entertainmentneedsbackgroundinformationandpictures.Therearemoreandmoreonlineinformationsearchtechnologies,useofwhichhasbecomeincreasinglyimportant.Keywords:Internet;Search;Searchengine;Development;Application
因特网是一个无边无际的信息海洋,每天都有新的网站出现。大量网页每时每刻都在更新,内容包罗万象。想要找到所需的资料,简直如同大海捞针。从浩如烟海的信息中迅速准确地获取自己需要的信息,就需要借助于网页搜索工具。网页搜索工具即搜索引擎,按其工作方式主要分为全文搜索引擎、目录索引类搜索引擎和元搜索引擎。
断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider程序[4]。
1993年,MatthewGray开发了WorldWideWebWanderer,这是第一个利用HTML网页之间的链接关系来检测万维网规模的机器人程序。开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址。
1搜索引擎的发展史和应用
1990年以前,没有任何人能搜索互联网。1990
1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和DavidFilo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo的数据是手工输入的,所以不能真正被归为搜索引擎。事实上只是一个可搜索的目录。雅虎于2002年12月23日收购Inktomi,2003年7月14日收购包括Fast和AltaVista在内的Over-
年,加拿大麦吉尔大学计算机学院的师生开发出
Archie。当时,万维网还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分布在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索。Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的,自动搜集信息资源,建立索引,提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。
ture,2003年11月,Yahoo全资收购3721公司。
1994年7月,卡内基.梅隆大学的MichaelMauldin将JohnLeavitt的spider程序接入到其索引程序中,创建了Lycos。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远
Robot(机器人)一词对编程者有特殊的意义。ComputerRobot是指某个能以人类无法达到的速度不
收稿日期:2009-03-13
作者简介:王庆民(1959-),男,专科,副研究馆员,研究方向:互联网搜索引擎。
作自己的生日。Google以网页级别为基础,判断网页的重要性,使得搜索结果的相关性大大增强。Google公司的奇客(Geek)文化氛围,不作恶(Don’tbe
胜过其他搜索引擎的数据量。
1995年,一种新的搜索引擎形式出现了—元搜索引擎(AMetaSearchEngineRoundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎是Washington大学硕士生
evil)的理念,为Google赢得了极高的口碑和品牌美誉。2006年4月,Google宣布其中文名称”谷歌”。这是Google第一个在非英语国家起的名字。
Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月发布了自己的搜索引擎AllTheWeb.Fast,创立的目标是做世界上最大和最快的搜索引擎,Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索。还提供新闻搜索、图像搜索、视频、MP3和FTP搜索,拥有极其强大的高级搜索功能(2003年2月25日,Fast的互联网搜索部门被Overture收购)。
EricSelberg和OrenEtzioni的Metacrawler。
1995年12月,DEC正式发布AltaVista。Al-taVista是第一个支持自然语言搜索的搜索引擎,也是第一个实现高级搜索语法的搜索引擎(如AND,
OR,NOT等)。用户可以用AltaVista搜索新闻组的内容并从互联网上获得文章,还可以搜索图片名称中的文字,搜索Titles,搜索Javaapplets,搜索ActiveX
objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一是搜索链接指向某个URL的所有网站,在面向用户的界面上,
1996年8月,Sohu公司成立,制作中文网站分类目录,曾有“出门找地图,上网找搜狐”的美誉,随着互联网网站的急剧增加,这种人工编辑的分类目录已经不适应。Sohu于2004年8月注册独立域名的搜索网站“搜狗”,自称第三代搜索引擎。
AltaVista也作了大量革新,它在搜索区域放了“tips”以帮助用户更好的表达搜索模式。这些小tip经常更新。这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的有趣功能。这些系列功能,逐渐被其他搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的[1]。
Openfind创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,
1995年9月26日,加州伯克利分校助教EricBrewer,博士生PaulGauthier创立了Inktomi。1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前,声称每天能抓取索引1000万页以上,所以有远超过其他搜索引擎的新内容,HotBot也大量运用cookie储存用户的个人搜索喜好设置。
Openfind重新发布基于GAIS30Project的Openfind搜索引擎Beta版,推出多元排序,宣布累计抓取网页
35亿,开始进入英文搜索领域。2000年1月,两位北大校友,超链分析专利发明人,前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度
(Baidu)公司,2001年8月
发布搜索引擎Beta版(此前Baidu只为其他门户网站如搜狐、新浪、Tom等提供搜索引擎),
1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一。它没有Stop
Words。它有出色的CurrentNews,7100多种出版物组成的SpecialCollection,良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类[1]。
…… 此处隐藏:3623字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [求职职场]加法运算定律的运用练习题
- [求职职场]大型石油化工工业过程节能新技术
- [求职职场]2015-2020年中国箱纸板行业分析与投资
- [求职职场]NADEX-IWC5A点焊机故障代码
- [求职职场]英语阅读 非常有用
- [求职职场]鲁卫疾控发〔2012〕2号(联合,印发山东
- [求职职场]2014年莆田公务员行测技巧:数字推理的
- [求职职场]基于最近发展区理论的高中数学课堂有效
- [求职职场]与贸易有关的知识产权协议
- [求职职场]【王风范】微演说·职场演说三
- [求职职场]新时代国珍健康大课堂
- [求职职场]群论期末考试复习题
- [求职职场]施工现场消防安全专项施工方案(范本)-
- [求职职场]初中物理光学知识点归纳完美版
- [求职职场]毕业设计总结与体会范文
- [求职职场]江南大学2018年上半年展示设计第1阶段
- [求职职场]景尚乡民兵参战支前保障方案
- [求职职场]【优质】2019年工会职工之家建设工作总
- [求职职场]数据库技术与应用—SQL Server 2008(第
- [求职职场]汽车变速箱构造与工作原理
- 首钢工业区工业遗产资源保护与再利用研
- 第4课 《大学》节选
- 2016程序文件——检验检测结果发布程序
- 2011年高考试题文言文阅读全解释__2011
- 化学是一门基础的自然科学
- 海外做市商制度的借鉴意义
- 外国建筑史复习资料(
- 七年级下思想品德期末综合测试(二)
- 思政课部2013年上学期教学工作总结
- 电大国际公法任务3 0004
- 《圆的认识》教学设计
- 中国轨道交通牵引变流器行业市场发展调
- 中泰证券#定期报告:坚守时代硬科技和
- 浅论企业财务管理与企业经营投资风险的
- 大功率半导体激光器光纤耦合技术调研报
- 中国传统家具的现状与发展探讨
- Broadcom数字电视芯片助海尔扩展高清电
- 新HSK4词汇练习 超全(五)
- 2013届高考数学单元考点复习12
- 雨霖铃精品课件




