Facebook 开源数据集,旨在消除 AI 有色眼镜
Casual Conversations 中包含了 3011 名参与者的 45000 多个视频,均匀分布了不同的性别、年龄段和肤色。Facebook 要求其中的付费参与者提交视频并自己提供了年龄和性别标签,以尽可能地消除误差。 此外,Facebook 还为 Casual Conversations 招募了一些训
讲师大课堂-Vertica大数据实时分析平台
副标题#e# ?点击上方“ HPE大数据”关注我们! 讲师介绍 刘定强 Hewlett Packard Enterprise资深大数据架构师 课程下载 想要下载完整课件PPT和讲解录音,请点击文章最后“ 阅读原文”或直接浏览器访问 http://pan.baidu.com/s/1skCwXpr 课堂录音支持在线收
BI 商业智能/数据仓库实施杂谈
副标题#e# 从最初接触BI商业智能到现在已经十多年的时间,一直以乙方角色工作。今天忽然想就BI在甲方公司的应用情况做些总结,以及提一些设想,也希望有兴趣的朋友一起交流。与具体工具无关,偏重于方法论的讨论。 早期的BI实施情形大概类似于这样,大家都
【983】大数据实操:社交数据在征信领域的分析应用
副标题#e# 本文主要内容由社交征信背景、社交网络数据分析、个体用户画像研究、社交圈子研究、模型建设及应用这五部分构成,下面文章将逐一介绍。 一、社交征信背景 征信不是一个简单的由征信进行评分的模型,而是由数据公司、征信公司、征信使用方三部分组
沈艳:关注大数据分析门槛 警惕大数据神话
副标题#e# 大数据是近几年最热门的IT概念之一,并已在许多领域实现落地。从淘宝利用平台数据解读中国消费趋势和地区差异到出行类APP在拥塞的城市中为用户提供快速的车辆调度,从数据分析团队在奥巴马连任竞选中发挥巨大作用到谷歌智能系统AlphaGo在人机围棋
数据集成–Informatica PowerCenter
概要 随着数据呈现单位级别的递增,从海量的数据中分析出有价值的数据,对未来的事情进行一些预测,显得更能体现出BI的优越性了,但这也同时考验着数据处理ETL的性能和安全。这几天大体调查了一下informatica公司的PowerCenter,在国内市场上使用的挺早的
美团机器学习中的数据清洗与特征挖掘实践
综述 如上图所示是一个经典的机器学习问题框架图。数据清洗和特征挖掘的工作是在灰色框中框出的部分,即“数据清洗=特征,标注数据生成=模型学习=模型应用”中的前两个步骤 灰色框中蓝色箭头对应的是离线处理部分。主要工作是: 从原始数据,如文本、图像
数据安全事件频发,数据脱敏技术发展走向如何?
副标题#e# 在当前的大数据时代,各类数据分析应用技术已经广泛应用在国家治理、企业运行、个人日常生活等各个方面,数据成为时下最热门的基础资源,因此数据安全的受关注程度也在不断攀升,成为颇受重视的话题。 近年来,在国际上数据安全事件频发,尤其是
让你在10分钟内掌握如何用Python将数据批量的插入到数据库
副标题#e# 本文基于python, 使用pandas, pymysql等三方库实现了向数据库中高效批量插入数据,一方面提供被网上很多瞎转载的答案给坑蒙了的人(因为我也是),一方面自己也做个笔记,以后方便查阅 需求原因 最近在处理一个需求,有关批量往数据库插入数据的,
社交大数据如何助力社会风险问题?
副标题#e# 在网络空间治理中运用社交大数据 当今社会,社交媒体已经成为用户内容获取与危机风险传播的主要渠道。根据艾瑞咨询发布的《2019年中国移动社交行业研究报告》,我国移动社交媒体用户规模预计2020年将达到8.2亿。社交媒体的传播生态越来越呈现出全