1.6 KiB
1.6 KiB
【E21-OLAP】 E现场 Druid 任务状态异常,导致tsg系统首页统计数据展示异常
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-346 | 2022-02-08T03:10:01.000+0800 | 窦凤虎 | 已关闭 |
经过和今天olap研发同事们的一起努力,目前通过关闭所有任务,重启所有数据节点,调整任务启动顺序,启动所有任务后故障解决,系统首页统计数据恢复。
故障状态及程序运行日志等已提供给研发人员。(戚岱杰等olap同事)
针对此次设备关机重启后,Druid 开机自启运行异常,Druid 任务状态异常的问题,希望洋姐
后续多关注一下这个BUG解决进展。liuyang commented on 2022-02-08T09:46:18.223+0800:
麻烦[~doufenghu] 跟进,确认:
- 本次故障原因和解决方案
- 后续设备断电重启后程序检查项
doufenghu commented on 2022-03-08T10:12:49.965+0800:
- 已为Druid任务增加告警规则,解决Druid进程正常,但统计任务异常未及时发现问题。
- 断电后任务未恢复问题,当前未成功复现,后续将利用仿真环境做进一步的断电复现。https://jira.geedge.net/browse/GAL-140
doufenghu commented on 2022-09-15T15:52:25.130+0800:
相关Druid task任务实时运行状态,已加入监控并增加告警规则。断电任务无法恢复问题,在信息港万兆仿真环境,断电(直接拔电源)三次未复现,后续持续跟踪。
liuju commented on 2023-02-02T15:10:15.526+0800:
截止到目前现在未再复现该问题。