问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

云原生时代的 APM

发布网友 发布时间:2022-08-19 16:47

我来回答

1个回答

热心网友 时间:2023-10-25 17:02

作者 刘浩杨

来源 尔达 Erda 公众号

APM 的全称是 Application Performance Management(应用性能管理),早在 90 年代中期就有厂商提出性能管理的概念,到现在 APM 领域已经发展了近 25 年。

通常而言,APM 的技术已经发展了 3 个阶段,在这里我们可以通过前蓝海讯通(OneAPM)创始人何晓阳在 2014 年分享的《APM 应用性能管理的过去二十年》来回顾一下 APM 的发展 历史 。


1995 年到 2000 年,正是第一代互联网浪潮兴起的年代。当时,雅虎作为互联网公司的代表,引领一代潮流,美国人忙着铺光纤架网线,一个一个的站点被建立了起来。如果说网站的响应速度决定了用户体验的话,那么当时的网速就决定了网站的响应速度,因此,APM 1.0 时代的软件功能就是这么简单:管理网络系统的性能。


时间发展到 2000 年,看过《浪潮之巅》这本书的读者应该会对那个时代有一些印象,当时的 SUN 正处于巅峰时期,市值接近 2000 亿美元,这些公司当时正在疯狂的建设数据中心,购买各种各样的硬件和软件。在这里,我们用一个专业名词来称呼他们,叫做基础组件(Infrastructure)。那么,当时的 APM 系统已经到了第二代,作用是监控和管理各种基础组件的性能。


2005 年以后,随着 *,Twitter 这些应用提供商的兴起,越来越多的 APP 被用来服务全球客户;对于用户来说,他们访问的应用服务可能分布式 的部署在全球的多个数据中心上,尤其是 2010 年以后,新的移动访问方式的兴起,让每一个人的生活方式更加紧密的依赖于各种 Application。在这个时候,应用本身的性能越来越成为制约用户体验提升的瓶颈。这就是第三代 APM 软件的用武之地:第一是管理真实用户的体验,第二是进行端到端的业务交易性能分析。


可以看到,在过去很长一段时间,APM 的重心一直在关注用户体验性能和应用程序性能,随着近年来云计算的兴起,和云原生所倡导的新范式,给传统的研发和运维模式带来了新的挑战:微服务、DevOps 等理念让研发变得更高效,但带来的却是海量微服务的问题排查、故障定位的难度变得更大;容器化、Kubernetes 等容器编排技术的逐渐成熟让规模化软件交付变得容易,但带来的挑战是如何更精准地评估容量、调度资源,确保成本与稳定性的最好平衡。



Apple 的工程师 Cindy Sridharan 的博文“监控与观察”(Monitoring and Oberservability)首次将 Oberservability 一词带入开发者的视野。然而,在谷歌,其著名的 SRE 体系在此之前就已经奠定了可观察性的理论基础,也就是说在微服务、可观测性等概念或者出现以前,前辈们将这套理论称为监控,其中 Google SRE 特别强调白盒监控的重要性,而将当时技术圈常用的黑盒监控放在了相对次要的位置。而白盒监控正是应和了可观察性中“主动”的概念。


这里引用一下 Baron SchSchwarz 大咖的一个定义:“监控告诉我们系统的哪些部分是不工作的。可观察性告诉我们那里为什么不工作了。”


由此可见,可观察性是云原生系统中提供稳定性和性能监控、诊断分析的一套理念。和监控相比,可观察性从单一的度量扩展为 Metrics、Tracing、Logging 三大支柱:




在上文中我们提到,可观察性提供了一套理念来监控、诊断云原生应用系统。因此,CNCF 发起了 OpenTelemetry 项目,希望借此统一可观察性三种数据的标准规范和统一的采集实现。但在现实世界中,我们更关心的是采集的数据如何被存储和使用。由此,Erda MSP(MicroService Platform)中的应用监控子系统也在逐渐演进为以“可观察性分析诊断 ” 为核心的微服务观测平台。





Erda MSP 当前覆盖从基础设施、业务系统、到端应用的数百种指标和状态采集:




我们也根据监控运维常见的场景和指标,在 Erda 中提供了默认的观测视图:

多云集群状态和资源使用率观测

集群节点指标观测

服务请求和延迟观测


针对于业务系统的慢请求和错误请求,我们集成了 log、trace 和 metric 的关联,让用户可以在很容易的定位到请求的异常上下文信息:


错误请求检索

错误请求和慢请求 Top

慢请求和错误请求下钻分析

exception 分析

exception 下钻关联到 trace 和 log


Erda MSP 支持使用自定义 Dashboard 定制用户自己的分析场景,Dashboard 详细使用参考: 《上手后才知道,这套仪表盘系统用起来是真的爽!》 。



对日志数据的处理,Erda 支持全文检索和结构化标签检索两种方式,并且实现一键关联日志和调用链路的分析能力。


日志关联链路追踪分析


Erda 作为开源的一站式云原生 PaaS 平台,具备 DevOps、微服务观测治理、多云管理以及快数据治理等平台级能力 。点击 下方链接 即可参与开源,和众多开发者一起探讨、交流,共建开源社区。欢迎大家关注、贡献代码和 Star!



声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
缘起缘灭美文 个人取得交易手续费返还收入需缴个人所得税吗 个人所得税返还手续费交增值税吗 输血有什么不良反应? 总是梦见很恐怖的快速飞 梦里面还知道自己在做梦想赶紧醒来 问题... 武汉商学院地址是什么 武汉商学院交通方便吗。离市区远吗 武汉商学院地理位置很偏吗 ...2013年10月10日, 农历2013年9月6日, 阴历二零一三癸巳年九月初六日12... 男孩 出 生于2013年10月10日(农历九月初六)凌晨3:07分五行缺什么啊? 在微服务架构下,如何实现接口调用链路的跟踪? 苹果8X更新完系统信号微弱是什么问题? the next door,next the door和next door哪个正确 in the next room是什么意思 inthe next door和in the next room有什么区别? 大内侍卫的武功有多牛? 最后的大内高手,其武功到底强到了什么地步呢? 张作霖贴身保镖,清末最后一位大内高手的武功到底有多厉害? 一个长方形,剪两刀,变成四个大小、形状都一样的图形有几种方法? 红枣鸡蛋糖水的作用? 什么是养颜滋补的汤或糖水 马油羊奶皂本色丽人 用了两三个月感觉粉刺多了 自从用了美容院那种粉调峰蜜摸面后一直长闭口粉刺是怎么回事? 中国农业银行办理银行卡需要什么 大众的7挡双离合真像网上说的那么容易坏吗 大众7速干式双离合容易坏吗 双离合变速箱的通病,7速双离合很容易坏吗 求经典电影。。。 告诉我几部经典动作片 电视剧频道英雄不流泪今天为嘛没播放 spring cloud和dubbo哪个会被淘汰? 蚂蚁借呗提额方法你都知道吗? 立夏了,再吃人参好吗? 支付宝借呗提额竟然如此简单?教你几招神操作! 做梦梦见小狗开车跟着我是什么意思? 梦见狗开车 我曾经梦到我家的狗在马路上跑,没躲开车,被面包车轧了,然后它跳了起来,只不过边叫唤边跛脚跑。梦到这 怎样学好语文文言文和现代文 什么叫毒舌? 现实生活中毒舌是什么意思 你知道毒舌是什么意思吗? 你对毒舌了解多少? 毒舌是什么样子 我梦见佛闪闪发光还会说话 南国早报相亲网网址 南国早报相亲网网址如题 谢谢了 南国早报相亲网26号举行,大龄青年相亲是吗? 南国早报相亲网怎么修改自己的id论坛名称 南国早报在南宁航洋国际举行的七夕相亲到8月23日还有吗??急地址在哪里? 南国早报网“南国早茶”的版主小小伤心到底是男的还是女的啊?