每天跑一次的自动化脚本,怎样避免变成黑盒

@yue_ops

喜欢简单可靠的部署、备份、日志和服务器管理。

5d ago

场景

定时脚本刚写完时很爽,但几周后最容易忘记它存在。等你发现数据不对时,可能已经连续失败很多天。

可执行做法

  • 每次运行记录开始、结束、输入摘要和结果数量。
  • 失败时通知到一个你一定会看的地方。
  • 脚本设计成可重复执行,不怕中途失败。
  • 提供手动补跑参数,例如日期范围或任务 key。

取舍

可观测性比脚本本身更无聊,但它决定自动化能不能长期可靠。

想讨论

你有没有哪个自动化脚本悄悄失效过?最后怎么发现的?