教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 文库大全 > 资格考试 >

校园网Web日志挖掘研究与实现

来源:网络收集 时间:2025-10-03
导读: 2 0 1 3年 8月第1 9卷第 3期 安庆师范学院学报 (自然科学版 )J o u r n a l o f A n q i n g T e a c h e ̄C o l l e g e ( N a t u r a l S c i e n c e E d i t i o n ) Au g. 2 0 1 3VO I . 1 9 NO. 3 网络出版时间: 2 0 1 3— 9— 2 5 1 3: 5 5网络出版

2 0 1 3年 8月第1 9卷第 3期

安庆师范学院学报 (自然科学版 )J o u r n a l o f A n q i n g T e a c h e ̄C o l l e g e ( N a t u r a l S c i e n c e E d i t i o n )

Au g. 2 0 1 3VO I . 1 9 NO. 3

网络出版时间: 2 0 1 3— 9— 2 5 1 3: 5 5网络出版地址: h t t p:// w w w . c n k i . n e t/ k c ms/ d e t a i l/ 3 4 . 1 1 5 0 . N. 2 0 1 3 0 9 2 5 . 1 3 5 5 . 0 2 0 . h t m l

校园网 We b日志挖掘研究与实现张小林(安庆师范学院现代教育技术中心,安徽安庆 2 4 6 1 3 3 )

要:w e b日志挖掘是 w e b挖掘中的一个重要的分支,通过 w e b日志挖掘可以获得用户的访问模式和用户感兴趣

的信息及关注的内容,从而为用户提供个性化的服务。另外通过对大量的 w e b日志文件进行分析,可以获取大部分用户同时感兴趣的信息和内容,从而获得关联度高的网页,以便更好地优化和改善网站的布局。关键词:数据挖掘; w e b日志挖掘;日志分析中图分类号:T P 3 9 3 . 1 8 文献标识码:A 文章编号:1 0 0 7- 4 2 6 0 ( 2 0 1 3 ) 0 3- 0 0 6 9— 0 4

在万维网上的每台 w e b服务器都可以记录用户的访问记录,也就是 w e b访问日志,它所记录的数据是根据设定的日志文件格式来记录的,因此

问网站的速度、网站的页面设计及颜色搭配等。 我们通过分析 w e b日志文件来获取 w e b服务器的访问量,从而分析 w e b服务器的运行效率,尽量减少w e b服务器的拥塞、优化传输、减少用户访问的等待时间。

它是一个结构化的记录集。当有用户浏览或请求获取资源时, w e b服务器都将毫无遗漏地记录和保留这些关于用户交互的数据。因此, w e b使用挖掘的主要目标是从 w e b的访问记录中获取人们感兴趣的用户访问模式。利用 w e b日志挖掘方法分析不同的 w e b站点和 w e b访问日志,可以帮助网站维护人员根据用户的访问模式和兴趣来提供更好的网络服务。

( 3 )改善网站的结构

布局。一个大型的网站,其结构是比较复杂的。网页的链接布局是否

方便,版块的划分是否合理等,通过 w e b日志挖掘,可以发现其中的一些问题,找出哪些版块是大部分用户比较关注的,哪些版块之间关联度高,这样有利于帮助网站设计者更好地调整网站的布局,使用户访问比较便捷,提高访问效率。( 4 ) w e b服务器的安全。目前,网络上的黑客

1 w e b日志挖掘的应用We b日志挖掘是以应用为目的,目前 w e b日志挖掘主要应用有:

相当多,网上流行的木马、病毒也相当泛滥。对于一

个开放性的 w e b站点,每天都要面对许多用户

( 1 )提供个性化的服务。这主要应用在一些电子商务网站,或需要注册访问的一些资源性网站。通过分析用户的访问记录,得到用户的访问模式和用户的兴趣爱好,然后当用户下次登录

有意或无意的攻击。不能仅仅依靠防病毒软件,还要时刻关注 w e b日志文件。可以通过 w e b日志

挖掘中的离群点技术来检测。

w e b站点时,系统直接将该用户感兴趣的信息或商品显示在用户方便操作的位置,过滤一些不必要的信息,提高用户访问的效率。

2 w e b日志挖掘的过程We b日志挖掘的过程一般分为四个步骤, 即数据预处理、事务识别、选择挖掘技术和算法及模式分析。

( 2 )提高 w e b服务器的性能。评价一个网站的满意度,主要有几个方面:网站自身的内容、访

( 1 )数据预处理。We b日志挖掘的数据源主

收稿日期:2 0 1 3—0 2—2 1 基金项目:安庆师范学院青年科研基金 ( N O .1 2 0 0 0 1 0 0 0 0 1 9 )和安庆师范学院教研项目资助。

作者简介:张小林,男,安徽安庆人,硕士,安庆师范学院讲师,研究方向为数据挖掘、计算机网络。

校园网Web日志挖掘研究与实现.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wenku/107440.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)