| | 1 | 功能目标: |
| | 2 | 读取任务运行时间等信息,为任务调配作数据基础[[BR]] |
| | 3 | |
| | 4 | 任务设置优先级,根据优先级调配任务[[BR]] |
| | 5 | |
| | 6 | 时间触发任务[[BR]] |
| | 7 | |
| | 8 | WEB界面上实现取消任务功能[[BR]] |
| | 9 | |
| | 10 | |
| | 11 | |
| | 12 | 一些可能用到的参数 |
| | 13 | |
| | 14 | mapreduce.job.complete.cancel.delegation.tokens[[BR]] |
| | 15 | job.end.notification.url[[BR]] |
| | 16 | |
| | 17 | *做法一,通过jobClient读取hadoop的集群信息,看代码后发现这种信息只能读取小部分的信息 |
| | 18 | |
| | 19 | {{{ |
| | 20 | Configuration conf = new Configuration(); |
| | 21 | String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs(); |
| | 22 | JobClient jobClient = new JobClient(new JobConf(conf)); |
| | 23 | JobQueueInfo[] queues = jobClient.getQueues(); |
| | 24 | |
| | 25 | |
| | 26 | }}} |
| | 27 | |
| | 28 | *做法二 往hadoop 的http server中增加一些jsp,输出任务和集群的信息,增加的jsp见附件[[BR]] |
| | 29 | |
| | 30 | 输出格式为[http://192.168.238.63:50030/jobtracker_json.jsp][[BR]] |
| | 31 | 通过spring的定时任务,定时保存任务的信息,保存在数据库中,每个小时进行分析,找出又问题的任务[[BR]] |
| | 32 | 第一版上线的地址: [http://192.168.238.63:8080] |
| | 33 | |
| | 34 | |
| | 35 | 下面的版本会对正在执行的任务进行监控和调度 |
| | 36 | |
| | 37 | 有几个东西有待确认: |
| | 38 | * 提交后的任务(pending状态)参数是否还可以修改,比如优先级,reduce的数量 |
| | 39 | |
| | 40 | 是否可以通过API拿Hadoop的信息,可以通过下面的代码 |