Resyschina - resyschina.com
General Information:
Latest News:
数据挖掘技术的有趣应用:Kaggle的实践 21 May 2013 | 08:11 am
作者:陈运文 博士 引言 Kaggle是创办于美国硅谷的一个近年来风头正劲的数据挖掘竞赛平台,汇集了全球83000多名数据科学家,致力于通过数据挖掘技术解决各种各样现实的问题。文本挑选了Kaggle上若干个有趣实例,让大家了解如何从海量的、看似模糊而随机的实际应用数据中,挖掘出隐含其中的有巨大价值的信息和知识,并指导我们的认知和决策的。 你的职位该给多少薪酬? 薪水的高低恐怕是职场人士们最...
智能推荐系统开发中的十个关键注意点 25 Mar 2013 | 02:34 pm
作者:陈运文 博士,盛大智能推荐团队负责人 亚马逊的CEO Jeff Bezos曾经说过,他的梦想是“如果我有100万个用户,我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想,即通过数据挖掘技术,为每一个用户实现个性化的推荐结果,让每个用户更便捷的获取信息。为了实现这个梦想,过去十余年间,无数顶尖技术专家和工程师投身于推荐算法和技术的研究与应用中,很多优秀的方法被提出,很多技...
Early Amazon: Splitting the website 10 Sep 2012 | 06:10 am
原文链接:http://glinden.blogspot.com/2006/02/early-amazon-splitting-website.html 原文作者 Greg Linden 毕业于华盛顿大学计算机学院,1997 年加入 Amazon,开发了享誉业界的 Amazon 推荐引擎。 著名的 Item-based 推荐算法的提出者之一;Findory.com 创始人。 其 Blog –...
Early Amazon: Xmas at the warehouse 4 Sep 2012 | 05:04 am
原文链接:http://glinden.blogspot.com/2006/01/early-amazon-xmas-at-warehouse.html 原文作者 Greg Linden 毕业于华盛顿大学计算机学院,1997 年加入 Amazon,开发了享誉业界的 Amazon 推荐引擎。 著名的 Item-based 推荐算法的提出者之一;Findory.com 创始人。 其 Blog –...
Early Amazon: Dogs 3 Sep 2012 | 05:38 am
原文链接:http://glinden.blogspot.com/2006/01/early-amazon-dogs.html 原文作者 Greg Linden 毕业于华盛顿大学计算机学院,1997 年加入 Amazon,开发了享誉业界的 Amazon 推荐引擎。 著名的 Item-based 推荐算法的提出者之一;Findory.com 创始人。 其 Blog – Geeking with...
pagerank做围脖局部影响力计算example 3 Jun 2012 | 06:26 pm
接着上一篇的文章继续写。看了大家在resys china 和 新浪围脖上的评论,启发蛮多的。首先谢谢大家。 这次的example中,只用了转发这一种信息作为权重的衡量标准。一共采集不到1w的用户量,平均每个用户1k的围脖信息。 类似于google 的pagerank一样,用户A转发用户B的一条围脖,则相当于给用户B投了一票,但每个用户所投票的重要性不同,排名高的用户用户投票更有说服力。 通过...
尝试pagerank做围脖局部影响力计算 20 May 2012 | 01:04 am
最近用pagerank的思路对围脖局部影响力做了个简单的计算,最后的效果一般。 思路如下: (1)以若干数量的优质用户为种子用户开始算法。 (2)获取种子用户的关注列表和转发的围脖内容。 (3)利用得到的data构建图,如果用户A关注B,则添加一条边A->B; 如果用户A转发B的围脖,同样添加一条边A->B; 如果用户A既关注B,也转发了B的围脖,权重会变化; 因为一个用户很有可能转...
机器学习在互联网应用面临的 10 大挑战 16 May 2012 | 04:58 am
原内容出自:@张栋_机器学习 http://weibo.com/1686830902/xAkL3EV4p 1: “数据稀释性”:训练一个模型,需要大量(标注)数据,但是数据往往比较稀疏。比如,我们想训练一个模型表征某人 “购物兴趣”,但是这个人在网站上浏览行为很少,购物历史很少,很难训练出一个 “meaningful model” 来预测应该给这个人推荐什么商品等 … 2:“不平稳随机过程产生...
围脖局部影响力计算example 4 May 2012 | 08:43 pm
最近看了一篇SIGIR 09年的paper,介绍的是如何区分一个用户是expert还是spammer,其实也就是对用户的expertise进行排名。 文中讲到的算法spear,是基于HITS(Hypertext Induced Topic Search)算法改进的,是SPamming-resistant Expertise Analysis and Ranking的缩写。文中的实验数据是用del...
Early Amazon: Inventory Cache 29 Mar 2012 | 02:49 pm
原文链接:http://glinden.blogspot.com/2006/01/early-amazon-inventory-cache.html 原文作者 Greg Linden 毕业于华盛顿大学计算机学院,1997 年加入 Amazon,开发了享誉业界的 Amazon 推荐引擎。 著名的 Item-based 推荐算法的提出者之一;Findory.com 创始人。 其 Blog – G...