Pytorch图像去噪实战(七十五):K8s HPA自动扩缩容,根据CPU压力动态增加图像去噪推理副本一、问题场景:访问高峰服务变慢,低峰又浪费资源图像去噪服务访问量通常不是稳定的。可能出现:白天用户多批量任务集中提交某个活动期间请求暴涨夜间请求很少如果固定部署 2 个副本:高峰不够用 低峰浪费资源Kubernetes 的 HPA 可以根据资源指标自动扩缩容。这一篇我们实现:根据 CPU 使用率自动扩缩图像去噪 API 副本。二、什么是 HPA?HPA 全称:Horizontal Pod Autoscaler它会根据指标自动调整 Pod 数量。例如:CPU超过70% - 增加副本 CPU降低 - 减少副本适合无状态 API 服务。