Splunk虽无Hadoop撑腰但却分析和运维兼备

2024-03-01 15:32

本文主要是介绍Splunk虽无Hadoop撑腰但却分析和运维兼备,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!




说起大数据分析平台,我们每个人基本上都会想起Hadoop,因为Hadoop在结构和非结构大数据分析领域确实无可替代。它提供了HDFSMapReduce两个基本功能实现分布式存储和大数据索引和分析,最关键的是Hadoop建立起了自己的完整生态环境,包括数据仓库HivePig、数据库HBaseDynamoDBMongoDBCouchDB NoSQL等等,以及ClouderaHortonworksMapRHadoop解决方案提供商。

Hadoop从目前来看是最知名的软件架构平台,但它决不是唯一的大数据架构平台,Hadoop主要应用在消费、互联网和运营数据的分析领域。那我们今天花点时间来聊一下,专门基于IT机器设备大数据VolumeVelocityVarietyVariability特性而设计的IT Search Engine,它叫Splunk机器数据的引擎。由于在项目中遇到,故而花了点时间进行了简单分析。

Splunk是专门设计给组织和机构使用的IT搜索引擎(SearchEngine),它将雅虎、Google的搜寻技术与概念发扬光大,如今组织和机构可以用Splunk来管理任何复杂的 IT 系统,使用Splunk可收集、索引和利用所有应用程序、服务器和设备(物理、虚拟和云中)生成的快速移动型计算机数据。

由于Splunk这个产品专门分析IT机器设备产生的大数据,所以在大数据世界里面显得比较低调。Splunk除了具备大数据分析能力外,还突破过去各种IT管理工具(IBM Tivoli, HP OpenView, CA UniCenter)的使用方式,Splunk采用简单易懂的关键词搜寻方式,来协助IT人员找寻与解决IT问题。从复杂的机器数据中提取有用的信息。

 

Splunk本身还是一个可用来开发处理大数据分析应用的一个平台,具备完整强大的API集,可以嵌入PythonJavaRubyPHPC#等一起使用。并提供了基于浏览器界面的SplunkWeb和命令行交互接口。

IT人员就可以透过Browser使用Splunk并对组织和机构的各种ITData进行关键词搜寻,快速地得到所需要的数据,除此之外Splunk本身还具有计算能力,管理者可以透过Splunk将搜寻所得的结果立即做运算处理,产生各种报告、图表与警示,而且还可以设定Splunk进行排程定时搜寻,并将结果以Email Alert方式通知相关人员。

 

Splunk的主要功能决定了它既具备大数据分析能力,也拥有IT设备管理能力,下面我们重点看看Splunk的重要特性。

Splunk 具备多样且弹性的数据搜集方法,可以检索各种型态的IT data,不限定 IT Data format,并收集来自各种不同的应用系统和网络设备,同时可搜寻 资安日志、系统日志、应用程序日志Splunk能够进一步监控文件系统中设定配置的变更,做变更管理,更可链接各种网络通讯端口(Ports)去接收SyslogSNMP和来自其他各式各样网络装置的数据。

 

Splunk能够定期排程执行,并依据搜寻结果发出各项警示通知,可以透过emailRSSSNMP等方式链接其他管理接口,可触发执行自行定义的因应方式,例如重新启动应用程序、系统或网络设备。

Splunk提供强大的报表能力,能够将搜寻结果以各项清晰的图表呈现,更可弹性化地产制出组织和机构管理阶层所想要的报告内容。

 

由各种设备所产生的ITdata是相当枯燥乏味的,透过Splunk可将它转化为切实可用的重要IT信息,并且能为任何人所用,不需要太多艰深的知识即可找出想要的信息。

IT信息其重要性不言可喻,Splunk可整合组织和机构既有的认证系统进行安全管控,确保数据在存取、分析和稽核时不会破坏数据的完整性。认证与用户许可证管理可与 AD, eDirectory LDAP 整合;可使用 SSL/TCP 接收发送日志与 HTTPS 加密管理。

 

 

 

Splunk具备良好的扩展能力,支持分布式部署和HA架构部署提供可靠性,并且在分布式部署时可以提供多站点数据和分析的统一视图。

至此,我们应该对Splunk的功能有了比较全面的了解,那在日常运维和数据管理过程中系统/数据中心管理员是怎么使用Splunk呢,以及Splunk最适合的场景是什么呢,接下来我们一起聊一下这个话题。

第一个场景就是日常运维排错,Splunk根据不同主机来源的日志来分析交易耗时情况、交易量、响应码成功比率等。业务维护人员也可以通过简单的交易流水号、卡号、账号等简单条件快速定位匹配的事件进行关联分析,输出实时报表或定位到问题的根源。

第二个场景是安全合规和日志审计,通常日志分散不便管理,环境复杂、设备品牌繁多日志格式很难统一。但是日志合规性要求重要日志文件保存时间比较长,需要根据审计记录进行分析、并生成统计报表,还要保证数据安全,避免非预期的删除和修改,另外还要遵循统一的安全策略进行审计。

为了解决这些问题,Splunk支持日志格式定义、支持多样日志格式、具备查询快、易分析,通过审计记录保护,灵活定制展现层的能力来实现安全合规和日志审计。

 

还有一个重要的场景是应用数据分析和监控,例如大型银行拥有大量的应用系统,如交易系统、网上银行等,通过Splunk可以对交易时延进行监控、以便针对用户的体验做出调整。


温馨提示:

请搜索“ICT_Architect”“扫一扫”下面二维码关注公众号,获取更多精彩内容。



这篇关于Splunk虽无Hadoop撑腰但却分析和运维兼备的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/762938

相关文章

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

hadoop开启回收站配置

开启回收站功能,可以将删除的文件在不超时的情况下,恢复原数据,起到防止误删除、备份等作用。 开启回收站功能参数说明 (1)默认值fs.trash.interval = 0,0表示禁用回收站;其他值表示设置文件的存活时间。 (2)默认值fs.trash.checkpoint.interval = 0,检查回收站的间隔时间。如果该值为0,则该值设置和fs.trash.interval的参数值相等。

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号