| Version 29 (modified by liaojiaohe, 14 years ago) (diff) |
|---|
PCGROUP 分布式计数框架
背景:分布式计算或者并行计算由来已久,以往需要比较高端的硬件设备和专用软件。随着互联网的高速发展,基于数据密集型应用的计算框架不断出现,如Google使用相对低廉的硬件和MAPREDUCE算法的构筑起分布式计算的平台,国内一些技术实力较强的公司如百度,淘宝,腾讯也纷纷建立起各自的分布式计算平台。PCGROUP为提升后台系统的计算能力,充分利用机器的计算能力,也建立起自身的分布式计算平台。平台主要建立在HADOOP和HBASE的基础上,初期主要项目:定向广告、广告报表系统、广告数据分析、魔方数据分析。
想更多了解分布式计算,点击
项目成员
负责:廖教和,欧彬
资源支持:董用彬,陈小虎,张泽云
开发支持:易杰行,莫应超,李达荣
项目计划
最新进度:第一阶段升级已经完成,也搞清楚了Hadoop和HBASE内部的很多配置和问题
线上任务执行情况比较好,对应开发规范,小型的开发可以参考hadoop_tools
鉴于现在没有大项目要开发或者改版,先研究一下Hadoop相关两个开源工具
项目文档
Hadoop+HBase系统升级(20120910)
HADOOP 配置说明(未完成)
HBASE 配置说明(未完成)
HADOOP 常用命令(未完成)
HBASE 常用命令(20120919)
大批量数据录入HBASE(20120820)
压缩方式的选择(20120910)
HBASE表设计(20120918)
HADOOP快速开发(20120919)
通过一个工具项目说明HADOOP程序开发过程(20120924)
![(please configure the [header_logo] section in trac.ini)](http://www1.pconline.com.cn/hr/2009/global/images/logo.gif)