Files
geedge-jira/md/OMPUB-357.md
2025-09-14 22:26:17 +00:00

1.9 KiB
Raw Blame History

福建项目故障排查OLAP性能问题

ID Creation Date Assignee Status
OMPUB-357 2022-02-11T09:41:22.000+0800 张智涵 已关闭

福建用户反馈问题:

1、用户目前在clickhouse库里查日志出现查询慢的现象查半个月的日志需要1小时

2、用户目前发现界面每分钟300w日志为上限再发更多日志就会出现丢日志的现象

 

目前福建维护人员未就位,待下周维护人员就位后请研发协助进行排查doufenghu commented on 2022-02-11T09:57:19.565+0800:

直接查询数据库,查的更快些? {quote}1、用户目前在clickhouse库里查日志出现查询慢的现象查半个月的日志需要1小时 {quote} 更多日志是多少? 建议给一个预估值或流量,在基于现有硬件资源进行调整吧。 {quote}2、用户目前发现界面每分钟300w日志为上限再发更多日志就会出现丢日志的现象 {quote}


zhangzhihan commented on 2022-02-11T16:34:09.827+0800:

1、目前用户就是直接进CK库查的日志据说是查半个月日志需要1小时

2、量目前无法估计据用户描述是开启更多策略后进行测试发现有效果命中了但是库里查不到日志


zhangzhihan commented on 2022-02-14T17:38:53.624+0800:

问题用户目前在clickhouse库里查日志出现查询慢的现象查半个月的日志需要1小时

结论clickhouse库中日志量太大半个月大概500e安全日志查询1天的日志已经占满磁盘IO后续考虑扩容ck节点解决


zhangzhihan commented on 2022-02-25T09:35:25.783+0800:

问题2

福建OLAP集群有3台kafka节点但是目前发现其中一台IO异常日志量少无压力情况下IO都比另外2台高

目前计划待福建OLAP迁移至第二套集群后对第一套集群的IO性能进行一次检查


Attachments