| Version 1 (modified by liaojiaohe, 13 years ago) (diff) |
|---|
20130304 号 我们的hadoop发生了一次灾难性的故障,
起因是一次网络简单的机器重启任务(对一年没有重启过的机器要进行重启)
机器重启后namenode不能启动
从事后看是hbase log文件在添加到文件目录树的时候出空指针,我怀疑hbase关闭不正常,被杀进程,但网络说hbase正常关闭,而hadoop不能正常关闭
hbase 后来也试过不能正常关闭,怀疑是有web应用正在调用,这个还要对不能正常关闭的问题进行研究
Namenode不能启动后,发现secondnamenode上面的editor log备份原来一直不成功,namenode上的集群
网络比较急于恢复集群,开发也没有碰到过这种情况,只能上网找方案
![(please configure the [header_logo] section in trac.ini)](http://www1.pconline.com.cn/hr/2009/global/images/logo.gif)