1.9 KiB
福建项目故障排查:OLAP性能问题
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-357 | 2022-02-11T09:41:22.000+0800 | 张智涵 | 已关闭 |
福建用户反馈问题:
1、用户目前在clickhouse库里查日志出现查询慢的现象,查半个月的日志需要1小时
2、用户目前发现界面每分钟300w日志为上限,再发更多日志就会出现丢日志的现象
目前福建维护人员未就位,待下周维护人员就位后请研发协助进行排查doufenghu commented on 2022-02-11T09:57:19.565+0800:
直接查询数据库,查的更快些? {quote}1、用户目前在clickhouse库里查日志出现查询慢的现象,查半个月的日志需要1小时 {quote} 更多日志是多少? 建议给一个预估值或流量,在基于现有硬件资源进行调整吧。 {quote}2、用户目前发现界面每分钟300w日志为上限,再发更多日志就会出现丢日志的现象 {quote}
zhangzhihan commented on 2022-02-11T16:34:09.827+0800:
1、目前用户就是直接进CK库查的日志,据说是查半个月日志需要1小时
2、量目前无法估计,据用户描述是开启更多策略后,进行测试,发现有效果命中了但是库里查不到日志
zhangzhihan commented on 2022-02-14T17:38:53.624+0800:
问题:用户目前在clickhouse库里查日志出现查询慢的现象,查半个月的日志需要1小时
结论:clickhouse库中日志量太大,半个月大概500e安全日志,查询1天的日志已经占满磁盘IO,后续考虑扩容ck节点解决
zhangzhihan commented on 2022-02-25T09:35:25.783+0800:
问题2:
福建OLAP集群有3台kafka节点,但是目前发现其中一台IO异常,日志量少无压力情况下IO都比另外2台高
目前计划待福建OLAP迁移至第二套集群后,对第一套集群的IO性能进行一次检查