DBLP – 站长网

挖掘DBLP作者合作关系，FP-Growth算法实践（6）：简单的总结报告

大数据 • 2021年5月26日

基于FP-Growth的频繁项集挖掘与基于社交图的关联规则挖掘一、任务简介 1 二、数据集 1 三、基本思路 2 3.1、发掘各个会议的“核心”研究者 2 3.2、挖掘作者之间的合作关系 3 3.3、挖掘导师-学生关系 5 四、正确性验证 5 五、总结 5 ? ? 一、任务简介本次

挖掘DBLP作者合作关系，FP-Growth算法实践（3）：挖掘任务简介、

大数据 • 2021年5月25日

首先是挖掘任务：思路明天写。。。。。

挖掘DBLP作者合作关系，FP-Growth算法实践（5）：挖掘研究者合作

大数据 • 2021年5月25日

副标题#e# 就是频繁项集挖掘，FP-Growth算法。先产生headerTable：数据结构（其实也是调了好几次代码才确定的，因为一开始总有想不到的东西）：entry: entry: {authorName: frequence,firstChildPointer,startYear,endYear} def CreateHeaderTable(tranDB

挖掘DBLP作者合作关系，FP-Growth算法实践（4）：挖掘每个会议的

大数据 • 2021年5月25日

在只有【论文标题、发布时间、作者、会议名称】这四种信息的情况下，首先提取出所有这四种信息：代码产生的结果如下，数据结构类似于headerTable，看结果就知道了，不再介绍： authorDict={} #{authorName: total(frequence,startYear,endYear),{eachConf

挖掘DBLP作者合作关系，FP-Growth算法实践（2）：从DBLP数据集中

大数据 • 2021年5月25日

副标题#e# 上篇文章：http://www.voidcn.com/article/p-nsbrwwsu-zv.html?（挖掘DBLP作者合作关系，FP-Growth算法实践（1）：从DBLP数据集中提取目标信息（会议、作者等））大家反映代码不能用，主要是太慢了，好吧，我也承认慢，在内存构造树，肯定的！

标签： DBLP

挖掘DBLP作者合作关系，FP-Growth算法实践（6）：简单的总结报告

挖掘DBLP作者合作关系，FP-Growth算法实践（3）：挖掘任务简介、

挖掘DBLP作者合作关系，FP-Growth算法实践（5）：挖掘研究者合作

挖掘DBLP作者合作关系，FP-Growth算法实践（4）：挖掘每个会议的

挖掘DBLP作者合作关系，FP-Growth算法实践（2）：从DBLP数据集中

联系我们