大数据 – 第 337 页

漫谈：机器学习中距离和相似性度量方法

2021年5月25日

在机器学习和数据挖掘中，我们经常需要知道个体间差异的大小，进而评价个体的相似性和类别。最常见的是数据分析中的相关分析，数据挖掘中的分类和聚类算法，如 K 最近邻（KNN）和 K 均值（K-Means）等等。根据数据特性的不同，可以采用不同的度量方法。一

poj 1001 Exponentiation 模拟大数（hdu 1063）

2021年5月25日

poj 1001 Exponentiation ?模拟大数链接： http://poj.org/problem?id=1001 题意：题意很简单，给你2个数（前面的是小数，后面是不超过25的整数），求得前一个数的幂（后一个数作指数部分）。思路：要求小数的幂，用一般的double，float完全满足不了解

[cpp]? view plain ?copy ? typedef?struct?AVFormatContext?{?? ????struct?AVInputFormat?*iformat;?? ????void?*priv_data;?? ?????? ????ByteIOContext?*pb;?? ????unsigned?int?nb_streams;?? ????AVStream?*streams[MAX_STREAMS];?? }?AVFormatConte

空间统计说历史：罗马七丘的空间分析（一）

2021年5月25日

话说，公元前N年，一个妹纸引发了一场号称“西方封神榜”的战役……强大的希腊联军在史上最强半神阿喀琉斯以及灰机+木马病毒的帮助下，一举攻陷了号称“永不陷落”的特洛伊城：灰机：木马：（题外话：Half a god 半神这个词，用武汉大学赵林教授的话来

几个个用于大数据分析的最好工具

2021年5月25日

大数据是一个含义广泛的术语，是指数据集，如此庞大而复杂的，他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大

挖掘DBLP作者合作关系，FP-Growth算法实践（2）：从DBLP数据集中

2021年5月25日

副标题#e# 上篇文章：http://www.voidcn.com/article/p-nsbrwwsu-zv.html?（挖掘DBLP作者合作关系，FP-Growth算法实践（1）：从DBLP数据集中提取目标信息（会议、作者等））大家反映代码不能用，主要是太慢了，好吧，我也承认慢，在内存构造树，肯定的！

[BZOJ2456]mode（数据处理+卡内存）

2021年5月25日

题目描述传送门题解卡内存，谁知道连iostream和ctring都不能开= =，涨姿势= = 注意这里众数的概念：大于 n div 2 那么每次把不同的两个数相抵消，最后剩下的那个一定是“众数”。代码 #includecstdiousing namespace std;int n,num,ans,x;int main(){

HDU 1002 A + B Problem II(大数加法,C,Java两个版本)

2021年5月25日

?? A + B Problem II Time Limit: 2000/1000 MS (Java/Others)????Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 300365????Accepted Submission(s): 57917 Problem Description I have a very simple problem for you. Given two inte

数据分析中缺失值的处理方法

2021年5月25日

1、缺失值的分类按照数据缺失机制可分为： (1)???完全随机缺失(missing completely at random,MCAR) 所缺失的数据发生的概率既与已观察到的数据无关,也与未观察到的数据无关. (2)???随机缺失(missing at random,MAR) ? ? ??假设缺失数据发生的概率与所观

站长网

漫谈：机器学习中距离和相似性度量方法

数据处理中的“基”情

poj 1001 Exponentiation 模拟大数（hdu 1063）

FFMPEG中重要的数据结构的挖掘

空间统计说历史：罗马七丘的空间分析（一）

几个个用于大数据分析的最好工具

挖掘DBLP作者合作关系，FP-Growth算法实践（2）：从DBLP数据集中

[BZOJ2456]mode（数据处理+卡内存）

HDU 1002 A + B Problem II(大数加法,C,Java两个版本)

数据分析中缺失值的处理方法

联系我们