采集nginx产生的日志,日志的格式为user ip time url htmlId 每天产生的文件的数据量上亿条,请设计方案把数据保存到HDFS上,并提供一下实时查询的功能(响应时间小于3s)
A、某个用户某天访问某个URL的次数
B、某个URL某天被访问的总次数
采集nginx产生的日志,日志的格式为user ip time url htmlId 每天产生的文件的数据量上亿条,请设计方案把数据保存到HDFS上,并提供一下实时查询的功能(响应时间小于3s)
A、某个用户某天访问某个URL的次数
B、某个URL某天被访问的总次数
暂无回答
我要回答