55 lines
1.6 KiB
Markdown
55 lines
1.6 KiB
Markdown
# 【E21-OLAP】 E现场 Druid 任务状态异常,导致tsg系统首页统计数据展示异常
|
||
|
||
| ID | Creation Date | Assignee | Status |
|
||
|----|----------------|----------|--------|
|
||
| OMPUB-346 | 2022-02-08T03:10:01.000+0800 | 窦凤虎 | 已关闭 |
|
||
|
||
|
||
---
|
||
|
||
经过和今天olap研发同事们的一起努力,目前通过关闭所有任务,重启所有数据节点,调整任务启动顺序,启动所有任务后故障解决,系统首页统计数据恢复。
|
||
|
||
故障状态及程序运行日志等已提供给研发人员。(戚岱杰等olap同事)
|
||
|
||
针对此次设备关机重启后,Druid 开机自启运行异常,Druid 任务状态异常的问题,希望洋姐
|
||
|
||
后续多关注一下这个BUG解决进展。**liuyang** commented on *2022-02-08T09:46:18.223+0800*:
|
||
|
||
麻烦[~doufenghu] 跟进,确认:
|
||
* 本次故障原因和解决方案
|
||
* 后续设备断电重启后程序检查项
|
||
|
||
|
||
|
||
---
|
||
|
||
**doufenghu** commented on *2022-03-08T10:12:49.965+0800*:
|
||
|
||
* 已为Druid任务增加告警规则,解决Druid进程正常,但统计任务异常未及时发现问题。
|
||
* 断电后任务未恢复问题,当前未成功复现,后续将利用仿真环境做进一步的断电复现。https://jira.geedge.net/browse/GAL-140
|
||
|
||
|
||
|
||
---
|
||
|
||
**doufenghu** commented on *2022-09-15T15:52:25.130+0800*:
|
||
|
||
相关Druid task任务实时运行状态,已加入监控并增加告警规则。断电任务无法恢复问题,在信息港万兆仿真环境,断电(直接拔电源)三次未复现,后续持续跟踪。
|
||
|
||
|
||
|
||
---
|
||
|
||
**liuju** commented on *2023-02-02T15:10:15.526+0800*:
|
||
|
||
截止到目前现在未再复现该问题。
|
||
|
||
|
||
|
||
---
|
||
|
||
|
||
|
||
## Attachments
|
||
|