栏目导航

热点推荐

斗鱼大数据的玩法

本文来源于斗鱼数据平台部吴瑞诚先生在光谷猫友会的分享。 我是吴瑞诚,现在负责斗鱼数据平台部,今天给大家分享一下斗鱼大数据这块的玩法。我先做个自我介绍,我是11年初华科通信硕士毕业就进入淘宝,主要做HBase相关开发,后来回武汉后在1号店转向应用架构...
推荐于:05-18
浏览:62 / 喜欢:62

Spark技术在京东智能供应链预测的应用

作者|杨冬越 郭景瞻 1 背景 前段时间京东公开了面向第二个十二年的战略规划,表示京东将全面走向技术化,大力发展人工智能和机器人自动化技术,将过去传统方式构筑的优势全面升级。京东Y事业部顺势成立,该事业部将以服务泛零售为核心,着重智能供应能力的打...
推荐于:05-18
浏览:62 / 喜欢:62

如何解决机器学习中数据不平衡问题

这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的,但绝对是最重要的问题之一。 一、数据不平衡 在学术研究与教学中,...
推荐于:05-18
浏览:61 / 喜欢:61

知乎技术日志:基于 AC 自动机和贝叶斯方法的垃圾内容识别

背景 作为一个开放领域的知识社交平台,知乎为大家提供了「友善」、「理性」、「专业」的讨论氛围,吸引了大量用户参与,产生了很多优质内容。但同时也吸引了一些垃圾制造者,在知乎上生产了不少的垃圾内容,如「违法」、「广告」、「淫秽色情」、「人身攻击...
推荐于:05-18
浏览:63 / 喜欢:63

广告和推荐系统部署机器学习模型的两种架构

广告和推荐系统是机器学习是最成熟的应用领域。那么广告和推荐系统是怎么在线上部署机器学习模型的呢? 1.预测函数上线 刚刚学习机器学习时候,我认为广告和推荐系统过程如下图所示: 1)线下部分,从用户和广告(物品)属性抽取用户和物品特征,将抽取的特...
推荐于:05-18
浏览:61 / 喜欢:61

微博商业数据挖掘方法

本文主要介绍微博商业数据挖掘的体系及方法,但并不注重模型和算法这些细节,而是阐述数据如何贴近、支持和引导业务,如何建立合理的评价体系,以及如何围绕这两点建设数据挖掘架构。 业务及产品 微博广告生态的复杂程度在业界数一数二。由于微博本身的开放...
推荐于:05-18
浏览:61 / 喜欢:61

大数据舆情情感分析,如何提取情感并使用什么样的工具?(贴情感

by 崔维福 情感分析是学术领域研究多年的课题,用google学术搜索可以找到很多paper,基本的方法上有基于词典规则的方法、语言文法的方法,此外还有分类器以及近几年比较火的深度学习的方法(稍后有详细介绍)。 各类paper是有一定的借鉴意义的,不过这主要是学...
推荐于:05-18
浏览:61 / 喜欢:61

Quora:有哪些数据科学新人不知道老手才知道的?(独译)

Q:有哪些数据是初学者不知道而只有数据专家知道的? What do experienced data scientists know that beginner data scientists dont know? 36大数据专稿,?本文由36大数据翻译,不授权任何网站使用,除了36大数据网站和微信公众号,所有其他的转载均为侵权...
推荐于:05-18
浏览:63 / 喜欢:63

Kafka设计原理以及在达观产品中的应用

作者:蹇智华 达观数据 前言 达观数据作为一家提供大数据服务的公司,经常会遇到客户上报数据的需求。这样的请求不需要马上返回处理结果, 而是需要后台将一系列的上报数据进行统一归档整理挖掘, 然后将结果数据呈现给客户。这样的业务需求需要达观提供数据...
推荐于:05-18
浏览:61 / 喜欢:61

微服务架构下的分布式数据管理

作者|李晓春 中兴开发者社区 1.1?分布式数据管理之痛点 为了确保微服务之间松耦合,每个服务都有自己的数据库,?有的是关系型数据库(SQL),有的是非关系型数据库(NoSQL)。 开发企业事务往往牵涉到多个服务,要想做到多个服务数据的一致性并非易事,同样,...
推荐于:05-18
浏览:61 / 喜欢:61
微信
公众号

微信扫码,即可关注

反馈
意见
回到
顶部