基于Apriori算法的网络社区知识形成影响因素分析
龙源期刊网 http://www.qikan.com.cn
基于Apriori算法的网络社区知识形成影响因素分析
作者:徐凡
来源:《科技视界》2015年第18期
【摘 要】研究了网络社区中影响知识形成的因素,通过运用Appriori算法对数据进行分析研究,发现,在社区成员吸收网络社区知识时回帖量与知识表达方式对网络社区知识形成产生非常重要的影响,同时知识分享者的专业对社区成员知识形成具有很大的影响作用。 【关键词】网络社区;知识形成;影响因素;Apriori算法
关联规则是数据挖掘中最常用的方法,关联规则挖掘的主要目的是从大量的数据中寻找关联性,为决策分析提供理论支持[1]。关联规则运用最经典的运用是购物篮分析“啤酒与尿布”的例子。而关联规则中最常运用到的是Apriori 算法,它能够根据用户提供的条件有效的进行数据挖掘。
1 Apriori 算法及其特点
Agrawal等人在1993年首次提出关联规则,该规则主要用于挖掘数据之间的关联性,对事物之间的亲密度进行描述。关联规则可描述为:设I={i1,i2,…,in}是项目集,D是全体事务的集合,集合T∈I,即T为I的子集,每个事务有唯一的TID标识。关联规则就是形如X=>Y的蕴含式,其中X∈I,Y∈I且X∩Y=?准,X称为规则的条件,Y称为规则的结果[1]。运算结果通过支持度和可信度进行约束。
关联规则中的支持度(Support)S表示D中有S%的事务同时包含X和Y,即事务集中同时包含X和Y的事务数与所有事务数之比,记作Support(X,Y)=P(X∪Y)。置信度(Confidence)C表示D中有C%的事务同时也包含Y,即包含X和Y的事务数与包含X的事务数之比,记作Confidence(X,Y)=P(Y/X)=P(X∩Y)/P(X)[2]。运用关联规则进行数据挖掘就是要挖掘出满足用户设定的最小支持度和置信度的规则。我们把同时满足用户设定的最小支持度和最小置信度的规则称为强规则。关联规则的数据挖掘,一般分为两步:首先找出所有满足用户设置的最小支持度的项目集,其次利用最大数据项集所生成的关联规则,根据用户指定的最小置信度确定规则的取舍,最后得到强关联规则[1]。
Apriori 算法作为经典的关联规则算法,其算法的实现是通过对数据库进行扫描从候选项集中找出频繁项,不断对候选项计数来完成的。它使用的是逐层搜索的迭代方法,通过对前一项集的探索来发现符合该次条件的项集。也就是说,Apriori 算法的基本思想是通过对数据库的多次扫描以发现所有符合条件的频繁项。在第k次扫描中只考虑具有同一长度k的所有项集。在后续的扫描中,首先以前一次所发现的所有频繁项集为基础,生成所有新的候选项集。
相关推荐:
- [法律文档]苏教版七年级语文下册第五单元教学设计
- [法律文档]向市委巡视组进点汇报材料
- [法律文档]绵阳市2018年高三物理上学期第二次月考
- [法律文档]浅析如何解决当代中国“新三座大山”的
- [法律文档]延安北过境线大桥工程防洪评价报告 -
- [法律文档]激活生成元素让数学课堂充满生机
- [法律文档]2014年春学期九年级5月教学质量检测语
- [法律文档]放射科标准及各项计1
- [法律文档]2012年广州化学中考试题和答案(原版)
- [法律文档]地球物理勘查规范
- [法律文档]《12系列建筑标准设计图集》目录
- [法律文档]2018年宁波市专技人员继续教育公需课-
- [法律文档]工会委员会工作职责
- [法律文档]2014新版外研社九年级英语上册课文(完
- [法律文档]《阅微草堂笔记》部分篇目赏析
- [法律文档]尔雅军事理论2018课后答案(南开版)
- [法律文档]储竣-13827 黑娃山沟大开挖穿越说明书
- [法律文档]《产品设计》教学大纲及课程简介
- [法律文档]电动吊篮专项施工方案 - 图文
- [法律文档]实木地板和复合地板的比较
- 探析如何提高电力系统中PLC的可靠性
- 用Excel函数快速实现体能测试成绩统计
- 教师招聘考试重点分析:班主任工作常识
- 高三历史选修一《历史上重大改革回眸》
- 2013年中山市部分职位(工种)人力资源视
- 2015年中国水溶性蛋白市场年度调研报告
- 原地踏步走与立定教学设计
- 何家弘法律英语课件_第十二课
- 海信冰箱经销商大会——齐俊强副总经理
- 犯罪心理学讲座
- 初中英语作文病句和错句修改范例
- 虚拟化群集部署计划及操作流程
- 焊接板式塔顶冷凝器设计
- 浅析语文教学中
- 结构力学——6位移法
- 天正建筑CAD制图技巧
- 中华人民共和国财政部令第57号——注册
- 赢在企业文化展厅设计的起跑线上
- 2013版物理一轮精品复习学案:实验6
- 直隶总督署简介




