Codinglabs - codinglabs.org
General Information:
Latest News:
解读Cardinality Estimation算法(第四部分:HyperLogLog Counting及Adaptive Counting) 9 Jan 2013 | 02:35 pm
在前一篇文章中,我们了解了LogLog Counting。LLC算法的空间复杂度为,并且具有较高的精度,因此非 [...]
解读Cardinality Estimation算法(第三部分:LogLog Counting) 3 Jan 2013 | 06:17 pm
上一篇文章介绍的Linear Counting算法相较于直接映射bitmap的方法能大大节省内存(大约只需后者 [...]
解读Cardinality Estimation算法(第二部分:Linear Counting) 31 Dec 2012 | 02:35 pm
在上一篇文章中,我们知道传统的精确基数计数算法在数据量大时会存在一定瓶颈,瓶颈主要来自于数据结构合并和内存使用 [...]
解读Cardinality Estimation算法(第一部分:基本概念) 30 Dec 2012 | 07:11 pm
基数计数(cardinality counting)是实际应用中一种常见的计算场景,在数据分析、网络监控及数据 [...]
基数估计算法概览 23 Nov 2012 | 10:08 am
翻译自《Damn Cool Algorithms: Cardinality Estimation》,原文链接: [...]
从抛硬币试验看概率论的基本内容及统计方法 20 Nov 2012 | 06:40 pm
一般说到概率,就喜欢拿抛硬币做例子。大多数时候,会简单认为硬币正背面的概率各为二分之一,其实事情远没有这么简单 [...]
x86-64体系下一个奇怪问题的定位 13 Nov 2012 | 03:45 pm
问题来源于一个朋友在百度的笔试题。上周六我一个朋友参加了百度举行的专场招聘会,其中第一道笔试题是这样的: 给出 [...]
网站统计中的数据收集原理及实现 24 Oct 2012 | 12:12 pm
网站数据统计分析工具是网站站长和运营人员经常使用的一种工具,比较常用的有谷歌分析、百度统计和腾讯分析等等。所有 [...]
聊聊如何检测素数 28 Aug 2012 | 12:49 pm
最近看到一则颇为有趣的新闻,说北大一名大一新生,以素数为标准选手机号,受到广大网友膜拜。其实素数的检测算法是很 [...]
浅析PageRank算法 2 Jul 2012 | 05:00 pm
很早就对Google的PageRank算法很感兴趣,但一直没有深究,只有个轮廓性的概念。前几天趁团队outing的机会,在动车上看了一些相关的资料(PS:在动车上看看书真是一种享受),趁热打铁,将所看的东西整理成此文。 本文首先会讨论搜索引擎的核心难题,同时讨论早期搜索引擎关于结果页面重要性评价算法的困境,借此引出PageRank产生的背景。第二部分会详细讨论PageRank的思想来源、基础框架...