Jame’s Reading 07-25 25 Jul 2013 | 12:30 pm
论文类的阅读与分析 云存储环境下的低成本虚拟机数据去重,Hong Tang与其在Ask.tom的前同事现伯克利圣芭芭拉分校的Tao Yang合作撰写的论文,对于在云环境下的备份方式(Sharding Meta 信息),先计算指纹再去重,虽然整体算法上的改进不大,不过由于拆分+并行处理,总体的效率与开销还不错。 Fa...
Lessons From Building and Scaling LinkedIn 15 Jul 2013 | 12:49 pm
Jay Kreps 1. scalability is about managing state, 管理状态(可变化的值)是Scalability的大头 2. make simple cheap scalable primitives, 3. ops first, 运维功能/特性优先 4. do hard things later, 先解决容易做的事情. 5. services (may...
An Example of Hadoop MapReduce Counter 15 Mar 2011 | 02:56 am
MapReduce Counter Hadoop MapReduce Counter provides a way to measure the progress or the number of operations that occur within MapReduce programs. Basically, MapReduce framework provides a number of...
Hadoop RPC를 이용한 서버/클라이언트 구현 21 Apr 2010 | 12:04 am
Hadoop은 이미 알려질대로 잘 알려진 분산 컴퓨팅 프레임워크입니다. 많은 사람들이 Hadoop 하면 MapReduce 프로그래밍을 주로 떠올리지만 자체적으로 제공하는 Hadoop RPC와 분산 파일 시스템인 HDFS를 가지고도 재미있는 것을 시도해 볼 수 있을 것 같습니다. 본 포스팅에서는 그 중에서 Hadoop RPC를 이용한 간단한 서버 클라이언트 ...
Data-Intensive Text Processing with MapReduce Draft Available in Online 11 Mar 2010 | 02:46 pm
Data-Intensive Text Processing with MapReduce, Jimmy Lin and Chris Dyer Actually, there have never been books that directly deal with MapReduce programming and algorithms. This book addresses from Ma...
Hadoop & MapReduce 27 Apr 2011 | 11:27 am
Hadoop framework provides mechanism for applications to process large amount of data in parallel on a large cluster. This tutorial covers the Hadoop common, Hadoop distributed file system and the MapR...
