| 6 | | 时间触发任务[[BR]] |
| 7 | | |
| 8 | | WEB界面上实现取消任务功能[[BR]] |
| 9 | | |
| 10 | | |
| 11 | | |
| 12 | | 一些可能用到的参数 |
| 13 | | |
| 14 | | mapreduce.job.complete.cancel.delegation.tokens[[BR]] |
| 15 | | job.end.notification.url[[BR]] |
| 16 | | |
| 17 | | *做法一,通过jobClient读取hadoop的集群信息,看代码后发现这种信息只能读取小部分的信息 |
| 18 | | |
| 19 | | {{{ |
| 20 | | Configuration conf = new Configuration(); |
| 21 | | String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs(); |
| 22 | | JobClient jobClient = new JobClient(new JobConf(conf)); |
| 23 | | JobQueueInfo[] queues = jobClient.getQueues(); |
| 24 | | |
| 25 | | |
| 26 | | }}} |
| 27 | | |
| 28 | | *做法二 往hadoop 的http server中增加一些jsp,输出任务和集群的信息,增加的jsp见附件[[BR]] |
| 29 | | |
| 30 | | 输出格式为[http://192.168.238.63:50030/jobtracker_json.jsp][[BR]] |
| 31 | | 通过spring的定时任务,定时保存任务的信息,保存在数据库中,每个小时进行分析,找出又问题的任务[[BR]] |
| 32 | | 第一版上线的地址: [http://192.168.238.63:8080] |
| 33 | | |
| 34 | | |
| 35 | | 下面的版本会对正在执行的任务进行监控和调度 |
| 36 | | |
| 37 | | 有几个东西有待确认: |
| 38 | | * 提交后的任务(pending状态)参数是否还可以修改,比如优先级,reduce的数量 |
| 39 | | |
| 40 | | 是否可以通过API拿Hadoop的信息,可以通过下面的代码 |
| | 5 | 设想方案 |
| | 6 | *研究Capacity Scheduler 参数 |
| | 7 | *如果Capacity Scheduler 不能慢速,修改代码让系统把job分配到不同的queue |