项目作者: liyifan687

项目描述 :
基于hadoop,hive,hbase的日志分析系统
高级语言:
项目地址: git://github.com/liyifan687/log-analysis.git
创建时间: 2018-04-09T08:54:59Z
项目社区:https://github.com/liyifan687/log-analysis

开源协议:Apache License 2.0

下载


log-analysis

基于hadoop,hbase,java的日志分析系统

网上一些类似的,数据来源百度一下很多大同小异,编写时也借鉴了许多。

目的:结合HDFS、MapReduce、HBase、Hive、Sqoop框架等技术,实现对论坛的日志的分析。
计算该论坛的一些关键指标:浏览量PV,注册用户数,IP数,跳出率。同时将分析结果存入mysql以便查看。

我首先将数据上传到了hdfs中,在编写java程序通过mapreduce将数据清洗后导入hbase中。
再将数据通过hive分析时,我是选择的映射hdfs中清洗过的文件,也可以通过修改配置,hbase和hive集成,使hive映射hbase。
最后将分析结果建立汇总表,使用sqoop导入mysql方便查看,具体请查看文档与详细代码。
(上传内容包括源码和说明文档)


更新:写了个简单的web端展示,使用jsp+servlet,借助echart展示,从mysql中读取数据。