wiki:WikiStart

Version 25 (modified by liaojiaohe, 14 years ago) (diff)

--

PCGROUP 分布式计数框架

背景:分布式计算或者并行计算由来已久,以往需要比较高端的硬件设备和专用软件。随着互联网的高速发展,基于数据密集型应用的计算框架不断出现,如Google使用相对低廉的硬件和MAPREDUCE算法的构筑起分布式计算的平台,国内一些技术实力较强的公司如百度,淘宝,腾讯也纷纷建立起各自的分布式计算平台。PCGROUP为提升后台系统的计算能力,充分利用机器的计算能力,也建立起自身的分布式计算平台。平台主要建立在HADOOP和HBASE的基础上,初期主要项目:定向广告、广告报表系统、广告数据分析、魔方数据分析。

想更多了解分布式计算,点击

项目成员

负责:廖教和,欧彬

资源支持:董用彬,陈小虎,张泽云

开发支持:易杰行,莫应超,李达荣

项目计划

里程碑

任务报表

项目文档

Hadoop+HBase系统升级(20120910)

HADOOP 配置说明(未完成)

HBASE 配置说明(未完成)

HADOOP 常用命令(未完成)

HBASE 常用命令(20120919)

大批量数据录入HBASE(20120820)

压缩方式的选择(20120910)

HBASE表设计(20120918)

HADOOP快速开发(20120919)

通过一个工具项目说明HADOOP程序开发过程(20120924)

参考资料

HBASE参考资料

HADOOP参考资料

ganglia

 dremel