×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 数据挖掘 共 648 个结果.
利用RapidMiner简化数据准备和机器学习任务
众所周知,我们在数据准备上花费的时间太多,而在构建完美的机器学习模型上花费的时间不多。事实上,《哈佛商业评论》的出版物证实了这一点:分析团队花费80%的时间准备数据。它们通常被笨拙的数据准备工具拖慢,...
star2017
1年前
10338
0
一文读懂自然语言分析(NLA)
自然语言分析NLA到底是什么呢?
star2017
1年前
4271
0
大嘴巴漫谈数据挖掘:需求概念生产品,定性研究定类型
第二时期产品概念评估基于第一时期目标用户细分的基础上,通过挖掘具体的业务需求,从而进一步生成产品概念,即满足用户需求最初的产品设想。当然,也不是所有的产品概念都是有价值的,只有依托大量产品设想,针对已生成的产品概念,通过有效评估,选出其中最可能为用户所接受的。此处主要涉及需求程度和概念得分两个关键指标。 在整个概念评估时期,研究重点主要是挖掘用户需求,评估产…
star2017
1年前
5732
0
大嘴巴漫谈数据挖掘:产品研发生原型,参与设计供方案
第三时期产品研发将针对第二时期筛选出的产品概念,按照以用户为中心的理念开始设计产品。首先根据目标用户的使用习惯并结合用户对产品的期望要求,设计出产品原型。然后基于用户对原型产品可用性的反馈评估,不断优化改进产品,以确保研发出的最终产品符合用户需要。 产品原型可以看做与用户沟通时使用的一种表现形式,诸如纸笔原型、线框图、产品测试版等,主要用来展现产品与用户之间…
star2017
1年前
5362
0
数据挖掘系列篇:今日头条的个性化推荐
摘要:今日头条作为一种新型的新闻阅读方式,已经将传统的新浪、腾讯、网易、搜狐这些新闻媒体以一种大数据+新闻内容的方式呈现给用户。上线没几年,用户量已经发展到3亿累计用户,日活奔着3000万去。看到这样的数据,小编还是比较震撼。这几乎是目前APP Top10的水平。所以有必要对今日头条好好研究下。 简单来看下今日头条这类的个性化推荐要实现大概是什么样的流程: …
star2017
1年前
6655
0
数据挖掘系列篇:网易云音乐的个性化推荐漫谈
用过虾米、酷狗、QQ音乐、网易云音乐,个人感受网易云音乐在音乐推荐这块做的真心不错,特别是以“人”为角度的推荐,没有像虾米、酷狗推的那么乱。虾米还可以,但更多的是以歌搜歌的形式。刚注册了一个新的账号,避免有历史数据的干扰,听了一首周杰伦的《一路向北》和陈奕迅的《淘汰》,然后去个性化推荐里看到了蔡健雅的《红色高跟鞋》和曲婉婷的《承认》,给我的感觉还是比较惊喜,…
star2017
1年前
6098
0
大数据实现“0”到“1”要分几步走?
大数据有多火?这样的答案可能有千百种,也从反向证明了大数据真的太火,因为所有人都知道。
star2017
1年前
9426
0
LinkedIn文本分析平台:主题挖掘的四大技术步骤
LinkedIn前不久发布两篇文章分享了自主研发的文本分析平台Voices的概览和技术细节。LinkedIn认为倾听用户意见回馈很重要,发现反馈的主要话题、用户的热点话题和痛点,能够做出改善产品、提高用户体验等重要的商业决定。下面是整理后的技术要点。
star2017
1年前
6342
0
腾讯基于兴趣点图谱的内容理解
分享嘉宾:洪婉玲 腾讯 高级研究员编辑整理:周江兵 360出品平台:DataFunTalk导读: 本文将介绍我们如何使用大规模的 UGC 数据挖掘用户真实的阅读意图,构建兴趣点图谱,并将图谱用于内容理
star2017
1年前
6733
0
滴滴数据挖掘工程师招聘
本文地址:https://www.6aiq.com/article/1628453090198本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出
star2017
1年前
6073
0
数据科学与机器学习的数据集
现在,我们面临着5-10年前的相反问题。那时,实际上很难找到数据科学和机器学习项目的数据集。从那时起,我们就被大量的数据集和列表淹没了。今天,问题不是寻找数据集,而是筛选数据集来保存相关数据集。好吧,...
star2017
1年前
10082
0
揭秘微信「看一看」如何精准挖掘你感兴趣的内容
作者:maricoliao,腾讯 WXG 应用研究员 一、背景 随着自媒体时代的蓬勃发展,各类自媒体平台每天涌现出海量信息。微信作为最优质的自媒体平台,每天新发表文章数百万篇。汹涌而来的信息,极大地丰富了人们的精神和娱乐生活,但同时也存在着信息繁杂无序、内容同质化、质量参差不齐等问题,而用户最关心的 ....
star2017
1年前
9676
0
零基础入门数据挖掘——数据分析实战
作者:王瑞楠,Datawhale 优秀学习者 转载地址 摘要:对于数据挖掘项目,本文将学习应该从哪些角度分析数据?如何对数据进行整体把握,如何处理异常值与缺失值,从哪些维度进行特征及预测值分析? 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验 ....
star2017
1年前
9748
0
零基础入门数据挖掘——特征工程实战
作者:吴忠强,Datawhale 优秀学习者 转载地址 系列文章: https://www.6aiq.com/article/1586105589491 摘要:对于数据挖掘项目,本文将学习应该从哪些角度做特征工程?从哪些角度做数据清洗,如何对特征进行增删,如何使用 PCA 降维技术等。 特征工程(F ....
star2017
1年前
6001
0
零基础入门数据挖掘——建模调参
作者:徐韬 ,Datawhale 优秀学习者 系列文章: https://www.6aiq.com/article/1586106887770 https://www.6aiq.com/article/1586105589491 摘要:对于数据挖掘项目,本文将学习如何建模调参?从简单的模型开始,如何 ....
star2017
1年前
5830
0
零基础入门数据挖掘——一文学习模型融合!从加权融合到 stacking, boosting
[图片] 作者:田杨军 ,Datawhale 优秀学习者 系列文章: 零基础入门数据挖掘——数据分析实战 零基础入门数据挖掘——特征工程实战 https://www.6aiq.com/article/1586199906459 摘要:对于数据挖掘项目,本文将学习如何进行模型融合?常见的模型融合的方法 ....
star2017
1年前
6012
0
携程 | “深耕内容”背景下,携程如何做景酒优质内容的挖掘
作者简介:莱灵图髯客,携程高级算法工程师,主要负责自然语言处理领域相关工作,对半监督学习、自然语言生成、实体识别、文本分类及检索等领域有浓厚兴趣。 一、背景介绍 伴随信息时代的快速发展,消费者的消费观念趋于理性、客观,对产品本身的质量要求也越来越高。在用户难以直接接触到产品的情况下,能否第一时间让用 ....
star2017
1年前
8557
0
【十大经典数据挖掘算法】PageRank
引言 PageRank 是 Sergey Brin 与 Larry Page 于 1998 年在 WWW7 会议上提出来的,用来解决链接分析中网页排名的问题。在衡量一个网页的排名,直觉告诉我们: 当一个网页被更多网页所链接时,其排名会越靠前; 排名高的网页应具有更大的表决权,即当一个网页被排名高的网 ....
star2017
1年前
9079
0
搜索引擎中的 Web 数据挖掘
[图片] 分享嘉宾:沐沐老师 前百度资深研发 编辑整理:赵丽 内容来源:2019 DataFun Live 11 出品社区:DataFun 导读: 今天为大家分享的是搜索引擎中的 Web 数据挖掘。首先介绍下搜索引擎。实际上,我们每天都会使用的搜索引擎,我们会输入关键词 query 和需求,搜索引擎 ....
star2017
1年前
9187
0
简单阐述下决策树、回归、SVM、神经网络等算法各自的优缺点?
正则化算法(Regularization Algorithms) 集成算法(Ensemble Algorithms) 决策树算法(Decision Tree Algorithm) 回归(Regression) 人工神经网络(Artificial Neural Network) 深度学习(Deep L ....
star2017
1年前
10914
0
1
2
3
4
...
33
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
祝福不只嘴上说!爆款CQ9《寿星大发》用奖金说话
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到