"海量日志分析系统实践"分享总结

小网客

浏览: 1216933 次
性别:
来自: 北京

最近访客更多访客>>

aoyouzi

jis117

emaiqi

duguyixiaono1

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

分享汇总

概述：

此分享是关于海量日志分析系统实践的汇总

汇总点：

基于MySql;
分析指标有，Hits、带宽、UIP（独立用户IP）、下载速度、下载时长、响应时间、受访URL、受访域名、来路URL、来路域名、全国用户分布统计、运营商分布统计、受访文件大小、文件类型、Squid命中率、请求响应类型、异常用户统计;
海量数据,写多读少;
节点包括：A(Agent) 、B(Bee)  、D(Data) 、M(Manger) 、R(Relay) ；
采集节点利用Rsync实现推送日志到B点；
运算节点根据需求分析日志并推送到D点；
R节点保障数据传输的速度及效率，减少网络问题导致的数据阻塞及不完整性；
D节点负责将接收到的sql文本入库；
表细分汇总包括m_表、h_表、d_表等；
展示节点基于web数据库访问层基于Amoeba；
管理节点掌握各大节点的系统运行状况，资源使用情况；
D节点中采用热数据来缓解DB的压力；
在MyISAM表中尽量使用定长类型；
将IP字段存储为整形；
使用merge表，对于过期的只读表进行myisampack，使用enum 使PROCEDURE ANALYSE() ，根据业务需求将产品线及时间建立联合索引；
Mysql架构优化包括增加节点、分库分表、将m,h,d表的索引文件及数据文件分布到不同磁盘、将数据库指向不同的磁盘、禁止系统更新文件的atime属性；
使用tmpfs作cache磁盘(ramdisk）；
采用infobright版；
基于mysqlnd做性能测试；
基于Memcache多级缓存；

技术：

Gearman 用于分布式节点的管理；
Memcached 缓存数据；
Amoeba 展示层数据库代理；
INFOBRIGHT的ICE版；

更多详情参见附件

海量日志分析系统实践.rar (746.7 KB)
下载次数: 65

0
顶

6
踩

分享到：

"支持高性能模糊检索的内存数据库EMS"分享 ... | "Hadoop在网盘和在线备份的应用与挑战"分 ...

2013-07-24 22:23
浏览 1955
评论(0)
分类:行业应用
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

"海量日志分析系统实践"分享总结

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

"海量日志分析系统实践"分享总结

评论

发表评论

相关推荐

"宜信大数据金融实践分享"汇总

"一种新的基于相似度计算的本体映射算法"分享

"基于本体实现网页规则分类的方法"分享

"推荐系统的工程挑战"分享

“基于用户兴趣分析的网页生命周期建模”分享

“基于大规模日志分析的网络搜索引擎用户行为研究”分享

“基于验证码破解的 HTTP 攻击原理与防范”分享

Node.js社区：一个人称代词引发的论战(转)

coder我想对你说

4399曹政：中国互联网

基于goagent 上网步骤

"Hadoop集群监控与Hive高可用"分享总结

"Hadoop在ebay中的使用历程"分享总结

"Twitter突发新闻事件监测跟踪"分享总结

"鹰眼下的淘宝-分布式调用跟踪系统介绍"分享总结

"实时流计算应用开发框架-天罡"分享总结

"大数据产品中的异构数据源整合"分享总结

"高性能Web服务器Nginx及相关新技术的应用实践"分享总结

"证券交易的低延迟挑战"分享总结

"打造支持上千万http长连接的应用"分享总结

最近访客更多访客>>