No description
This repository has been archived on 2026-06-16. You can view files and clone it, but you cannot make any changes to its state, such as pushing and creating new issues, pull requests or comments.
Find a file
2023-06-07 15:54:17 +08:00
code 23-06-07 2023-06-07 15:38:29 +08:00
kjw-dnslog-history.tar.gz 23-06-07 2023-06-07 15:38:29 +08:00
README.md 23-06-07-v3 2023-06-07 15:54:17 +08:00
~$1-项目数据格式与交互接口定义-V3.2-20220719.docx 23-06-07 2023-06-07 15:38:29 +08:00
~$2-DNS日志转化代码说明.docx 23-06-07 2023-06-07 15:38:29 +08:00
发送数据量统计.xlsx 23-0529 2023-05-29 17:09:14 +08:00
附件1-项目数据格式与交互接口定义-V3.2-20220719.docx 23-0529 2023-05-29 17:09:14 +08:00
附件2-DNS日志转化代码说明.docx 23-0529 2023-05-29 17:09:14 +08:00

项目介绍

目标将科技网TSG格式的DNS日志转成软件所定义的DNS日志格式

  • 输入科技网DNS日志

  • 日志来源科技网159.226.16.97服务器(kafka-topic:TRANSACTION-RECORD)

  • 访问方式:(若访问方式更新,请询问王道宽)

    • 通过easyconnect连接科技网VPN连接方式见https://docs.mesalab.cn/pages/viewpage.action?pageId=24216380
    • 远程登录159.226.16.98服务器(账户及密码需要通过钉钉审批-科技网服务器使用权限申请登录端口为10022
    • 在159.226.16.98服务器ssh登录159.226.16.97服务器端口为10022 账户及密码同上
    • 通过./kafka-console-consumer.sh --bootstrap-server 159.226.16.97:9092 --topic TRANSACTION-RECORD访问科技网DNS日志kafka目录在/usr/local/kafka中
  • 输出软件所kafka集群'159.226.16.115:29097,159.226.16.116:29097,159.226.16.116:29090,159.226.16.116:29091,159.226.16.116:29092'

    • topic:
      • "DNS-NEW-RR-LOG"对应附件1-2.1. 域名资源记录数据格式定义
      • "DNS_BEHAVIOR_2022"对应附件1-2.2. 域名访问行为记录数据格式定义-新域名解析行为数据格式
  • 代码

    • "DNS-NEW-RR-LOG"对应代码159.226.16.97/home/zhijinghua/dnslog_handling/code/dnslog_resource_hr_v4.py

    • "DNS_BEHAVIOR_2022"对应代码159.226.16.97/home/zhijinghua/dnslog_handling/code/dnslog_behavior_hr_v4.py

代码说明:

  • 完成日志格式转换

  • 过滤了部分流量过滤内容见“DNS日志转化代码说明.docx”

  • 日志统计在发送日志到软件所的kafka时记录的

    • 地址159.226.16.97/home/zhijinghua/dnslog_handling/behavior_out_test

    • 说明:每天结束记录一次日志量;每三个小时记录一次日志量 以2022-08-18输出的是2022.08.17整天的日志量)为例 recv_num is: 66843578从TRANSACTION-RECORD读取的日志量 send_num is: 64855245格式转换和过滤后发送到DNS_BEHAVIOR_2022的日志量

相关材料

运行环境

Python-3.8.0.tgz

chardet-4.0.0.tar.gz

kafka-python-2.0.2.tar.gz

confluent_kafka-1.8.2-cp38-cp38-manylinux2010_x86_64.whl

iperf-2.0.8-source.tar.gz

代码运行方式:

nohup python3 -u dnslog_behavior_hr_v4.py >> behavior_out&

nohup python3 -u dnslog_resource_hr_v4.py >> resource_out&