Using Avro in MapReduce jobs with Hadoop, Pig, Hive 4 Jul 2013 | 11:29 am
Apache Avro is a very popular data serialization format in the Hadoop technology stack. In this article I show code examples of MapReduce jobs in Java, Hadoop Streaming, Pig and Hive that read and/or ...
Understanding the Internal Message Buffers of Storm 22 Jun 2013 | 01:35 am
When you are optimizing the performance of your Storm topologies it helps to understand how Storm’s internal message queues are configured and put to use. In this short article I will explain and illu...
Mongo-Hadoop Streaming – Bukan Tutorial 30 Apr 2012 | 07:09 pm
Beberapa hari ini ngutak-atik mongo-hadoop, lebih tepatnya mongodb dengan hadoop streaming. Versi hadoop yang support untuk mongo-hadoop dengan hadoop streaming adalah hadoop dengan base version 0.21....
UFO Over Illinois 2000 6 Jul 2011 | 12:22 pm
The Sighting On January 5, 2000 at 4:00am, a large UFO was sighted by a southern Illinois resident as well as four Metro East-area police officers. Melvern Noll, a resident of Highland in southern Il...
Amazon EC2에서 whirr을 이용한 Hadoop 클러스터 구동 방법 19 Mar 2011 | 02:06 pm
최근 연구내용 검증을 위해 Amazon EC2에서 Hadoop 클러스터를 구축하여 실험을 수행 하는 중입니다. 그런데 Hadoop 클러스터를 EC2에 구축하는데 있어 Amazon EC2 환경에 대한 이해 부족과 자료의 부족으로 직접 부딪혀서 해결해야 하는 부분들이 꽤 있었습니다. 저는 이 포스팅을 통해 제가 시도했던 방법을 소개하고 제 경험을 공유하고자 합...
An Example of Hadoop MapReduce Counter 15 Mar 2011 | 02:56 am
MapReduce Counter Hadoop MapReduce Counter provides a way to measure the progress or the number of operations that occur within MapReduce programs. Basically, MapReduce framework provides a number of...
HDFS Scalability 향상을 위한 시도들 (1) 24 May 2010 | 05:21 pm
얼마전 Yahoo!의 HDFS 팀에서 Multiple nodes를 사용하여 HDFS namenode의 Horizontal Scalability를 향상 시키는 방법을 제안 했었습니다 (HDFS-1052). 그런데 그 뒤로는 Dhruba Borthakur라는 Hadoop 커미터가 Vertical Scalability 개선 방법을 제안했습니다(The Curse ...
Hadoop RPC를 이용한 서버/클라이언트 구현 21 Apr 2010 | 12:04 am
Hadoop은 이미 알려질대로 잘 알려진 분산 컴퓨팅 프레임워크입니다. 많은 사람들이 Hadoop 하면 MapReduce 프로그래밍을 주로 떠올리지만 자체적으로 제공하는 Hadoop RPC와 분산 파일 시스템인 HDFS를 가지고도 재미있는 것을 시도해 볼 수 있을 것 같습니다. 본 포스팅에서는 그 중에서 Hadoop RPC를 이용한 간단한 서버 클라이언트 ...
Hadoop & MapReduce 27 Apr 2011 | 11:27 am
Hadoop framework provides mechanism for applications to process large amount of data in parallel on a large cluster. This tutorial covers the Hadoop common, Hadoop distributed file system and the MapR...
Hadoopのインストール 7 Oct 2010 | 02:50 pm
インストール Hadoopのサイト Hadoop Commonのプロジェクトページからダウンロードのページへ行き、Download a release nowのリンクをクリック。 Apache Download Mirr [...]
Fraud Solutions With Innovations Like Google BigTable 2 Nov 2011 | 09:19 pm
© manfrysThere's a swarm of activity around a new crop of "big data" tools like Goolge BigTable, MacReduce and Hadoop that can deal with huge amounts of , and fraud is a large driver of all this a...
