This repository has been archived on 2025-09-14. You can view files and clone it, but cannot push or open issues or pull requests.
Files
galaxy-tsg-olap-log-complet…/README.md
qidaijie c0707a79c3 1:增加GTPC补全功能。
2:修改HBase连接参数,增加Radius和GTPC获取数据大小限制。
3:删除废弃函数代码。
4:优化部分函数代码。
2022-08-04 10:16:08 +08:00

38 lines
1.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# log-stream-completion-schema
基于Nacos的动态日志预处理程序接收原始日志根据对应Schema定义进行数据清洗并将结果回写Kafka。
当Nacos上Schame变更后可动态获取到最新版本的信息无需重启任务。
## 函数功能列表
* current_timestamp
> 获取当前时间戳,若追加字段已有时间戳,不予以覆盖。
* snowflake_id
> 雪花ID函数返回一个一定条件内不重复的 long 类型数值。
> https://git.mesalab.cn/bigdata/algorithm/snowflake
* geo_ip_detail
> IP定位库获取对应IP的详细地理位置信息城市,州/省,国家
* geo_asn
> ASN定位库获取对应IP的ASN信息
* geo_ip_country
> IP定位库获取对应IP的地理位置信息仅包含 国家
* set_value
> 给予字段固定值。
* get_value
> 获取字段值并追加到新的字段。
* if
> IF函数实现解析日志构建三目运算;包含判断是否为数字若为数字则转换为long类型返回结果。
* sub_domain
> 获取顶级域名
* radius_match
> 根据IP获取对应的Raidus用户信息。
> 实际数据存储在HBase中依赖RADIUS-RELATIONSHIP-HBASE-V2程序使用时加载到内存中加速查询。
* app_match
> 根据APP_ID获取对应的APP名称
* decode_of_base64
> 根据编码解码base64若编码字段为空则根据默认编码解析(UTF-8)
* flattenSpec
> 根据表达式解析json,使用jsonPath工具类
> https://github.com/json-path/JsonPath