互联网搜索引擎的发展_应用和特点_王庆民(2)
2.2目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的雅虎(Yahoo),其他著名的还有OpenDirectoryProject,LookSmart,About等。国内的搜狐、新浪、网易搜索也都属于这一类。
UNIX平台和本地化的服务器,保证了最快的响应速度;
(8)可以提供1周,2周,4周等多种服务方式,可以在7天之内完成网页的更新,是目前更新时间最快,数据量最大的中文搜索引擎;
(9)检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式;
(10)智能性,可扩展的搜索技术保证最快最多的收集互联网信息;
(11)分布式结构,精心设计的优化算法,容错设计保证系统在大访问量下的高可用性、高扩展性,高性能和高稳定性;
(12)高可配置性使得搜索服务能够满足不同用户的需求;
(13)先进的网页动态摘要显示技术;(14)独有百度快照;
(15)支持多种高级检索语法,使用户查询效率更高,结果更准。
2.3元搜索引擎
元搜索引擎在接受用户查询请求时,同时在其他
多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等。中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如
Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
除上述三大类引擎外,还有集合式搜索引擎、门户搜索引擎、免费链接列表等几种非主流形式。
3
3.1
几种主要搜索引擎的特点
百度搜索引擎的特点
百度搜索引擎使用了高性能的”网络蜘蛛”程序
3.2Google搜索引擎特点
Google搜索引擎是一个利用蜘蛛程序自动地在互联网中搜集和发现信息,并由索引器为搜集到的信息建立索引,从而为用户提供面向网页的全文检索服务的互联网信息查询系统[3]。
它主要具有以下的特点和功能:
(1)采用了先进的网页级别(PageRankTM)技术;
自动地在互联网中搜索信息,可定制,高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息,百度在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆、香港、台湾、澳门及
容。
(2)在同一个界面下,用户可以定制语言和到何种网站中进行搜索;
(3)具有超链分析的功能;(4)遵从关键字的相对位置;
(5)提升了中文搜索引擎的相关性,而且更好地实现了检索字串与网页中文字的语义上的匹配。
4结束语
科技的发展是无止境的。相信搜索引擎的发展也
是无止境的。2006年4月以来,各大搜索引擎相继推出了人肉搜索引擎,人肉搜索就是利用现代信息科技,变传统的网络信息搜索为人找人、人问人、人碰人,人挤人、人挨人的关系型网络社区活动,变枯燥乏味的查询过程为一人提问八方回应、一石激起千层浪、一声呼唤惊醒万颗真心的人性化搜索体验。
尽管有关人肉搜索的争议只是它产生庞大社会效应的冰山一角,但是网络的开放性和缺乏约束使得对一些行为的定性变得更加复杂。我国《计算机信息网络国际互联网安全保护管理办法》第7条规定“用户的通信自由和通信秘密受法律保护。任何单位和个人不得违反法律规定,利用国际互联网侵犯用户的通信自由和通信秘密。”第18条规定“不得擅自篡改他人信息,冒用他人名义发出信息,侵犯他人隐私”。现在可行的约束办法就是加强内容的管理和正面的引导,让人肉搜索这种特殊的互联网互助行为为更多的网友提供有效的帮助。
参考文献
[1]http://www.loc.gov/index.html.[2]./.[3]http:∥.
[4]叶鹰.Web信息查询技术[M].杭州:浙江科学技术出版社,1999,9.
3.3搜狐搜索引擎的特点
搜狐网站的内容丰富多彩,与我们的生活联系十
分紧密。搜狐分层目录是专为中国用户设计的高质量的分类目录系统,把超过15万个精选的中文站点链接归为18个大类,如:娱乐、计算机与互联网、工商经济、科学、艺术、文学、生活服务、科学技术、政治法律等等。而有价值的用户往往只关心自己需要的专门信息,所以我们在每个最初目录下,都建立全面丰富的目录树系统,构成了四通八达的信息高速公路,方便迅速地把您带到目的地。分层目录系统不仅使用户找到最需要的专门信息,也使广告客户更便捷地找到特定的用户群,达到最佳的宣传效果。在搜狐分层目录之外,还同时设立了七项搜狐频道:搜狐新闻、财经报道、搜狐体育、网猴、多媒体、外国资源、搜狐社区。它主要具有以下的特点和功能:
(1)最先进的人工分类技术;(2)友好的全中文界面;(3)符合中文语言文化习惯;
(4)18个部类,近15万条链接构成的树杈型网页结构;
(5)最直观、最轻松为网上用户提供所需要的内
(上接第97页)
经网络也与这些优化算法有很多相似的地方。虽然每个优化算法都不同,比如蚁群算法(AntColonyAlgo-于PSO算法在数据挖掘分析中的应用。
应用PSO算法进行数据挖掘分析的主要思想如下:随机初始化一微粒群,每个微粒具有n维,初始化基于规则、类和属性的位置与速度。根据适合度,搜索局部最佳和全局最佳。每经过一次迭代,更新位置与速度,重复此过程知道满足预先规定的最佳适合度阈值。
参考文献(略)
rithms)、模拟退火算法(SimulationAnnealingAlgo-
rithms)、微粒群优化算法(ParticleSwarmOptimizationAlgorithm),但它们都基于同样的原理,同时也具有很多相似之处。PSO算法现在非常流行,并且非常有用。虽然它没有被列入这些经典算法、基本算法或方法的行列中,但它还是可以应用在数据挖掘中的。事实上,虽然应用得还不多,但现在已经有些研究是关
…… 此处隐藏:895字,全部文档内容请下载后查看。喜欢就下载吧 ……相关推荐:
- [求职职场]加法运算定律的运用练习题
- [求职职场]大型石油化工工业过程节能新技术
- [求职职场]2015-2020年中国箱纸板行业分析与投资
- [求职职场]NADEX-IWC5A点焊机故障代码
- [求职职场]英语阅读 非常有用
- [求职职场]鲁卫疾控发〔2012〕2号(联合,印发山东
- [求职职场]2014年莆田公务员行测技巧:数字推理的
- [求职职场]基于最近发展区理论的高中数学课堂有效
- [求职职场]与贸易有关的知识产权协议
- [求职职场]【王风范】微演说·职场演说三
- [求职职场]新时代国珍健康大课堂
- [求职职场]群论期末考试复习题
- [求职职场]施工现场消防安全专项施工方案(范本)-
- [求职职场]初中物理光学知识点归纳完美版
- [求职职场]毕业设计总结与体会范文
- [求职职场]江南大学2018年上半年展示设计第1阶段
- [求职职场]景尚乡民兵参战支前保障方案
- [求职职场]【优质】2019年工会职工之家建设工作总
- [求职职场]数据库技术与应用—SQL Server 2008(第
- [求职职场]汽车变速箱构造与工作原理
- 首钢工业区工业遗产资源保护与再利用研
- 第4课 《大学》节选
- 2016程序文件——检验检测结果发布程序
- 2011年高考试题文言文阅读全解释__2011
- 化学是一门基础的自然科学
- 海外做市商制度的借鉴意义
- 外国建筑史复习资料(
- 七年级下思想品德期末综合测试(二)
- 思政课部2013年上学期教学工作总结
- 电大国际公法任务3 0004
- 《圆的认识》教学设计
- 中国轨道交通牵引变流器行业市场发展调
- 中泰证券#定期报告:坚守时代硬科技和
- 浅论企业财务管理与企业经营投资风险的
- 大功率半导体激光器光纤耦合技术调研报
- 中国传统家具的现状与发展探讨
- Broadcom数字电视芯片助海尔扩展高清电
- 新HSK4词汇练习 超全(五)
- 2013届高考数学单元考点复习12
- 雨霖铃精品课件




