在巨大流量冲击下 如何保证网站的稳定性?

时间:2021-01-27 10:32:37 作者: MM

微博又崩了,知乎又崩了,网易云又崩了……每当这样的词语冲上热搜榜,也就意味着程序员们的加班噩梦来了,这背后反映的却是企业系统稳定性的问题。

这样的问题,李嘉鹏之前所在的阿里同样需要面对。每逢双十一,天猫和淘宝的服务器都要承载数亿用户的访问,产生近亿笔支付订单。在零点的一瞬间,在线的用户数更是达到千万级。在巨大流量的冲击下,如何保证网站的稳定,这是对技术团队的极大考验。

李嘉鹏就是一位保障系统稳定的技术专家。他在阿里供职7年,是内部公认的JVM(Java虚拟机)大神,帮助很多程序员解决了技术难题。

2017年,李嘉鹏和童庭坚从阿里辞职创办了PerfMa,为企业提供IT系统稳定性保障解决方案,旗下有XSea压测平台、XLand性能分析平台等产品,广泛服务于金融、零售、交通、物流、互联网等行业客户。同时,PerfMa还搭建了性能技术社区,推出了一系列性能开源工具,帮助数十万开发者解决了应用性能调优问题。

近日,PerfMa完成了由高瓴创投领投、老股东嘉御基金跟投的1.5亿元人民币A++轮融资。这已是PerfMa近一年来的第三轮融资。李嘉鹏表示,PerfMa的产品未来将向更多行业渗透,并招揽到更多优秀的人才。

注:李嘉鹏承诺文中数据无误,为内容真实性负责。记者作客观真实记录,已备份速记录音。

阿里技术大牛离职创业

李嘉鹏在阿里工作了七年。刚到阿里时,他被分到了基础架构部,负责支付宝的框架开发。几年下来,他成了支付宝框架的专家,业务部门出了底层技术问题都知道来找他。2014年,他在阿里内部做了一款性能分析工具。基于这款工具,技术人员可以发现程序具体的问题出在了哪里。“阿里今天仍在用这个工具,无论是双十一还是日常工作,它的应用面很广。”

随着移动支付的普及,支付宝开始暴露出越来越多的性能问题。例如,支付宝每逢双十一都会面临比日常高很多倍的流量,如何保证页面的正常访问是一个很大的考验。2011年,李嘉鹏第一次参与优化支付宝交易查询系统,在没有特别多调优经验的情况下,将其TPS(服务器每秒处理的事务数)从60多提升到了140多,相当于为支付宝节省了上亿元的成本。

2014年底,他加入了蚂蚁金服的JVM团队,从JVM层面做一些优化来提升系统的整体运行效率。

对于习惯了Java编程的程序员而言,JVM是块难啃的硬骨头。Java是一种相对简单的编程语言,开发者上手写起来会比较容易;JVM是用相对复杂的C/C++语言写成的,很多逻辑都需要开发者自己控制。“你如果从Java入手编程的话,看C/C++的源码会非常累,有时候会看不下去。”

虽然难,但李嘉鹏在JVM里一扎就是3年,并且很快成为了这个领域的专家。他还是一个乐于分享的人,将JVM相关的很多调优经验更新到个人公众号“你假笨”中,在2017年的时候就积累了5万多粉丝。

没想到在这个过程中,他找到了创业的机会。在公众号后台,他经常能收到京东、美团、唯品会等大公司技术员工的提问;在自己组织的技术人员微信群里,他也时常看到大家热烈地讨论JVM难题。在专业领域的不断深耕以及对市场的敏锐嗅觉,令他逐渐意识到,随着数字化转型,越来越多的企业会面临系统稳定性及性能问题,而国内还没有专门的解决方案供应商。

这其中蕴藏着巨大的市场机会。2017年,李嘉鹏从阿里辞职,和合伙人童庭坚创办了PerfMa,为企业提供IT系统稳定性保障解决方案。童庭坚来自蚂蚁金服SRE团队,曾主导建设了蚂蚁全链路压测平台和性能容量体系。

对于IT系统而言,压测可以暴露性能问题。李嘉鹏认为,二人的经验正好形成了一个商业闭环。

开发标准化产品 搭建技术社区

创业初期,PerfMa团队定下的商业模式是为传统行业的大企业提供私有化部署,在企业自己的服务器上安装软件

“我们当初也是面临一道选择题,到底是做SaaS,还是私有化部署。”最后综合考虑了企业对其核心数据的安全性以及服务的专业性需求,李嘉鹏和团队选择了私有化部署。

2018年,合伙人童庭坚找到了PerfMa的第一个客户——太平洋保险,开始从0到1搭建产品。

当PerfMa带着互联网公司相对领先的技术到传统行业,便比较顺利地打开了市场。李嘉鹏发现,传统企业上线一个新功能时,从压力测试到监控到调优基本依靠比较分散的产品和技术,导致公司内部缺乏一个整体的产品解决方案。“他们觉得我们有他们正需要的实战经验,很乐意与我们一起打磨产品。”完成PerfMa产品的私有化部署后,原来太平洋保险需要四五十个技术人员解决的技术问题,现在只需要几个人。

在和太平洋保险合作的过程中,PerfMa创始团队开始探索产品的标准化。“一款产品最起码在一个行业是可复制的。只有这样,PerfMa才能打开未来的市场局面。”

目前,PerfMa已经面向企业推出了几款标准化产品,客户也由保险拓展到银行、券商、第三方支付、零售快消等行业,包括招商银行、浦发银行、东方证券、兴业证券、电信翼支付、达美乐、麦当劳、爱马仕、露露乐蒙等。

性能分析平台XLand

产品实现标准化后,PerfMa在产品边界上也有突破。李嘉鹏在服务客户的过程中发现,PerfMa可以把视野投向IT系统的稳定性保障上,不仅包括性能问题,还包括高可用性、正确性和安全性等方面。他举例,支付宝曾经历过一次服务器瘫痪,原因是挖掘机把光纤挖断了。“如果一个地方的系统瘫痪了,能不能把流量引到其他地方,让用户能正常访问服务器?这些都是要提前布局的。”

除了企业产品,PerfMa还从2019年9月起开始搭建技术社区,并推出了一系列开源工具。2021年1月15日,PerfMa开源了XPocket的2.0版本。李嘉鹏将最新版的XPocket比作“性能领域的乐高”。“开发者在排查性能问题的时候,不仅可以在XPocket里面使用已有的性能插件,还能像乐高一样把这些插件组合起来使用,甚至可以把不同类型的故障所需的步骤和工具变成SOP(标准程序)固化下来。”

“无论是个人开发者还是创业公司的技术团队,都可以通过PerfMa技术社区找到很多性能问题的解决方案。”李嘉鹏希望PerfMa技术社区可以成长为一个性能领域的精品社区。目前,这个社区注册用户超过十万,已经服务了数十万开发者。

相关推荐
AI桌面浏览器

热文推荐

  • 48小时热文
  • 每周热文

在巨大流量冲击下 如何保证网站的稳定性?