2025年9月16日,在云平台SRE团队例行周例会上,正式启动60天共读一本书之《SRE: Google运维解密》。
1.核心目标
理解并内化SRE核心理念: 如SRE与传统运维的区别 、SRE的核心目标(稳定性与效率的平衡 )、50%工程时间原则 、主动性与被动性工作管理 。
掌握关键实践方法论: 如错误预算(Error Budget)、服务水平协议(SLA)、监控(四大黄金指标) 、事故响应与复盘、发布工程、容量规划、自动化 。
推动团队实践改进: 将书中理念和方法应用于当前工作,识别改进点,制定初步行动计划。
2.计划周期及分组
60天,约8周半,含最后一次分享
将16人分为4个小组(A, B, C, D),每组4人:
轮流主讲: 每周由一个小组作为“主分享小组”,负责深入研读指定章节并进行提炼和分享,并在周二例会上进行分享。分享时长控制在 20-25分钟
全员参与讨论: 分享结束后,留出 10-15分钟,全体成员结合当前工作进行开放式讨论。
任务驱动: 每次例会结束时,明确本周需要团队共同完成的“行动项”,将学习落地
| 小组 | 组长 | 成员 | 备注 |
| A组 | 代冰 | 张宁涛、张建利、李灯泰 | |
B组 | 朱伟健 | 陈志康、张春亮、苗强 | |
| C组 | 刘桂海 | 吴召旺、张玉繁、吴杨雅辉 | |
| D组 | 于震 | 李国强、冯辉、李泽波 |
附录: