解决 AIOps、DevOps 和 ITSM 的难题

快速转向远程工作促使企业寻求满足突然分散的团队的运维需求,并且有开源选项可以帮助他们实现目标。
117 位读者喜欢这篇文章。
two women kanban brainstorming and brainmapping with post-it notes on a whiteboard

CC BY 3.0 US Mapbox Uncharted ERG

最近大规模转向远程工作的浪潮可能被证明是 DevOps 和 AIOps 演进的关键篇章。这种对快速、大规模变革的需求正在对 AIOps、DevOps 和 ITSM 造成真正的难题,因为组织正在为其现在分散的企业寻求最佳的监控和事件响应解决方案。

DevOps 和 IT 服务管理 (ITSM) 社区都需要回答的关键问题是,他们能够多快地转向和适应不断增长的运营情报需求。

什么是 AIOps?

IT 运维人工智能 (AIOps) 汇集了人工智能 (AI)、分析和机器学习 (ML),以自动化 IT 运维问题的识别和补救。

AIOps 系统从您的数据中学习并调整您的应用程序的工作方式。这些系统每次都不会做同样的事情。AIOps 系统还可以遍历问题的所有可行解决方案,包括一些开发人员在对基础设施问题进行人工分析时可能会遗漏的解决方案。然而,我们还没有达到 AIOps 系统——无论是开源还是专有——可以取代经验丰富的系统管理员和其他运维团队成员的程度。

一些更知名的开源 AIOps 贡献包括

  • Prometheus 是在讨论开源监控解决方案时首先想到的工具。它是云原生计算基金会 (CNCF) 项目的毕业生,该项目专注于站点可靠性工程 (SRE) 的监控。它简化了从指标端点拉取数值指标的过程。
  • Grafana 是一款开源指标分析和可视化套件。作为数据可视化工具,Grafana 在 Prometheus 用户中很受欢迎,用于可视化指标。
  • Elastic Stack 是 Elastic 公司的一套开源产品,旨在帮助用户实时搜索、分析和可视化来自任何类型来源、任何格式的数据。当您运行带有 Elastic Search 的 Elastic Stack 时,它会提供监控和日志记录解决方案。

所有这三种技术都不使用 AI 来解决问题,但仍然是 AIOps 实践的基础,因为需要一致的结构化数据来为决策提供信息。一个技术精湛的工程团队,无论是 SRE 还是其他团队,都可以添加像 TensorFlowSciPy 工具包 中的工具等开源技术,以获得关于基础设施的自动化和统计学相关的结论。

AIOps 和 DevOps

AIOps 补充但不会取代 DevOps。您可能会在一些营销信息中发现这种扭曲。AIOps 实际上所做的是将 AI 注入到 DevOps 监控中,为 DevOps 团队提供更强大的工具和对其工具链和系统的视图。AIOps 仍然像 DevOps 一样推动文化变革的需求,因为组织正在将他们的基础设施视为一个整体,而不是其技术堆栈的各个层。AIOps 通过数据的激增来增强传统的 DevOps 文化转型。文化需要创建流程和框架,以有效地将数据注入到整个 DevOps 工具链中。

AIOps 系统持续运行。您可以将 AIOps 系统作为 CI/CD 工具链的一部分运行,并跨混合开发、测试和生产系统运行。

使用 AIOps 增强您的 DevOps 工具链为您提供了一个新工具来支持不间断的产品可用性,从而带来卓越的最终用户体验。例如,当 COVID-19 爆发时,快速转向远程工作让一些主要的网站和 CSP 了解到互联网流量模式可能会在一夜之间发生变化。如果类似的危机再次发生,这种情况可能会重演。使用 AIOps 来增强 DevOps 为您提供了一个强大的工具,可以消除数据孤岛并分析您的 IT 基础设施生成的数据。

AIOps + DevOps 超过 ITSM

AIOps 和 DevOps 共同为混合环境提供速度、敏捷性和改进的监控,从而支持企业现在需要的运营连续性。

现代规模响应的远程工作要求 [含义不清,请重新措辞] 从未成为 ITSM 概念的一部分。AIOps 和 DevOps 是云优先且对混合环境友好的,这使得它们非常适应业务和技术变革。运营组织可以使用 DevOps 和 AIOps 原则和技术来适应基础设施和工作环境的快速变化。此外,他们拥有工具、框架和可操作的数据来迭代和快速地进行更改。AIOps 提供的分析和监控工具支持云成本控制和对您的公有云利用率的动态检查。

从积极的方面来看,一些专有的 AIOps 工具正在进入 ITSM 工具链,例如新的监控工具和基于云的服务台。我们需要看看管理 ITSM 的机构如何利用 AIOps 即将带来的下一代问题解决能力。像对待云一样,等待八年才对 AIOps 做出响应,对于一个可操作数据是前线 DevOps 团队及其利益相关者的必备品的世界来说,可能会对他们造成不利影响。

DevOps 社区在处理突如其来的运营情报涌入时也面临着类似的挑战。然而,DevOps 从业者以敏捷地响应快速变化而自豪。

寻找解决方案

在 COVID-19 带来的基础设施、端点安全和工作流程的快速变化之后,企业面临着一个难题——即确定管理 AIOps 可以交付的大量可操作数据的流程、框架和最佳实践。DevOps 在设计上是为了应对极端变化而构建的。ITSM 正在经历一些 AIOps 的渗透,但缺乏对重大技术市场变化做出有意义响应的历史。

AIOps 的前景是否正在改变您的 DevOps 或 ITSM 策略?在评论中分享您的想法。

接下来阅读
标签
User profile image.
Will Kelly 是一位产品营销人员和作家。他的职业生涯一直致力于撰写署名文章、白皮书、营销材料以及关于云和 DevOps 的技术内容。Opensource.com、TechTarget、InfoQ 和其他媒体发表过他关于 DevOps 和云的文章。他居住并在弗吉尼亚州北部地区工作。在 Twitter 上关注他:@willkelly。

评论已关闭。

Creative Commons License本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可。
© . All rights reserved.