用Python玩转模拟退火算法：从物理退火到TSP路径优化的保姆级代码拆解

张

张建站

2026/5/31 7:44:41

10分钟阅读

Python实现模拟退火算法从金属冷却到旅行商问题的奇妙之旅想象一下你是一位铁匠正在打造一把完美的剑。你将金属加热至白热化然后缓慢冷却让金属内部的原子找到最稳定的排列方式。这种古老的工艺竟然与现代计算机科学中的优化算法有着惊人的相似之处。这就是我们今天要探讨的模拟退火算法——一种将物理现象转化为数学智慧的经典案例。对于Python开发者来说模拟退火算法不仅是一个强大的优化工具更是一次理解自然与算法美妙联系的绝佳机会。我们将从物理退火的基本原理出发逐步构建算法框架最终实现一个完整的旅行商问题(TSP)求解器。在这个过程中你会看到温度参数如何控制搜索过程Metropolis准则如何帮助算法跳出局部最优以及Python如何优雅地实现这些复杂概念。1. 物理退火与算法思想的桥梁金属退火是一个历经千年的工艺过程。当金属被加热到极高温度时其内部粒子获得足够能量进行随机运动随着温度缓慢降低粒子逐渐趋向于能量最低的稳定排列状态。这一物理现象在1983年被Kirkpatrick等人抽象为一种优化算法用于解决复杂的组合优化问题。在算法视角下金属的能量状态对应着我们需要优化的目标函数值而温度则成为控制算法探索行为的关键参数。高温时算法像熔化的金属一样自由探索解空间随着温度降低算法逐渐聚焦于有希望的搜索区域最终结晶出一个优质解。核心对应关系物理系统能量 → 目标函数值粒子排列状态 → 问题的候选解温度参数 → 控制搜索随机性的变量冷却速率 → 算法收敛速度# 温度衰减的简单实现 def temperature_cooling(initial_temp, cooling_rate, iteration): return initial_temp * (cooling_rate ** iteration)这个简单的温度衰减公式体现了算法如何模拟物理冷却过程。选择合适的冷却速率(cooling_rate)至关重要——太快会导致淬火(陷入局部最优)太慢则增加不必要的计算开销。2. 算法核心Metropolis准则的Python实现Metropolis准则是模拟退火算法的灵魂所在它决定了何时接受一个更差的解从而使算法有机会跳出局部最优陷阱。这一准则源自统计力学描述了物理系统在恒定温度下达到热平衡的状态转移概率。对于极小化问题(如TSP)当新解的目标值(路径长度)优于当前解时我们总是接受这个改进当新解更差时我们以一定概率接受它这个概率取决于恶化程度和当前温度import math import random def metropolis_acceptance(delta, temperature): if delta 0: # 新解更优 return True else: # 新解更差以概率接受 probability math.exp(-delta / temperature) return random.random() probability关键参数实践建议初始温度应足够高使得算法初期有足够探索能力终止温度接近零时停止此时只接受改进解马尔可夫链长度每个温度下的迭代次数通常与问题规模相关冷却系数0.8-0.99之间控制温度下降速度下表展示了不同温度下接受劣解的概率变化Δf (目标值变化)T1000T100T10T1599.5%95.1%60.7%0.7%1099.0%90.5%36.8%0.0%5095.1%60.7%0.7%0.0%3. 旅行商问题的建模与邻域设计旅行商问题(TSP)是组合优化中最著名的问题之一给定一系列城市和它们之间的距离找到访问每座城市一次并返回起点的最短路径。这个问题看似简单但随着城市数量增加解空间呈阶乘级膨胀成为测试优化算法的经典基准。TSP解的表示我们采用排列编码即城市访问顺序的排列。例如对于5个城市的问题[0,2,1,4,3]表示一种可能的路径。邻域结构设计算法需要通过当前解生成邻近的新解。我们实现三种常用方法import numpy as np def swap_two_cities(solution): 交换随机两个城市的位置 i, j np.random.choice(len(solution), 2, replaceFalse) new_solution solution.copy() new_solution[i], new_solution[j] new_solution[j], new_solution[i] return new_solution def reverse_segment(solution): 反转随机选择的子路径 i, j sorted(np.random.choice(len(solution), 2, replaceFalse)) new_solution solution.copy() new_solution[i:j1] new_solution[i:j1][::-1] return new_solution def insert_city(solution): 随机选择一个城市插入到另一位置 city np.random.randint(len(solution)) new_solution np.delete(solution, city) insert_pos np.random.randint(len(new_solution)) return np.insert(new_solution, insert_pos, solution[city])目标函数计算路径总长度是各段距离之和包括返回起点的最后一段def calculate_distance(solution, distance_matrix): total 0 for i in range(len(solution)-1): total distance_matrix[solution[i]][solution[i1]] total distance_matrix[solution[-1]][solution[0]] # 返回起点 return total4. 完整Python实现与可视化现在我们将所有组件整合成一个完整的模拟退火算法实现并添加可视化功能来观察算法运行过程。import matplotlib.pyplot as plt from matplotlib.animation import FuncAnimation class TSPSolver: def __init__(self, cities, distance_matrix): self.cities cities self.dist_matrix distance_matrix self.num_cities len(cities) self.best_solution None self.best_distance float(inf) self.history [] def generate_initial_solution(self): return np.random.permutation(self.num_cities) def perturb_solution(self, solution): method np.random.choice([swap, reverse, insert]) if method swap: return swap_two_cities(solution) elif method reverse: return reverse_segment(solution) else: return insert_city(solution) def run_annealing(self, initial_temp10000, final_temp0.1, cooling_rate0.95, iterations_per_temp100): current_temp initial_temp current_solution self.generate_initial_solution() current_distance calculate_distance(current_solution, self.dist_matrix) while current_temp final_temp: for _ in range(iterations_per_temp): new_solution self.perturb_solution(current_solution) new_distance calculate_distance(new_solution, self.dist_matrix) delta new_distance - current_distance if metropolis_acceptance(delta, current_temp): current_solution new_solution current_distance new_distance if current_distance self.best_distance: self.best_solution current_solution.copy() self.best_distance current_distance self.history.append((current_temp, self.best_distance)) current_temp * cooling_rate return self.best_solution, self.best_distance def plot_solution(self, solutionNone): if solution is None: solution self.best_solution x [self.cities[i][0] for i in solution] [self.cities[solution[0]][0]] y [self.cities[i][1] for i in solution] [self.cities[solution[0]][1]] plt.figure(figsize(10, 6)) plt.plot(x, y, o-, markersize8) plt.title(fTSP Solution - Total Distance: {calculate_distance(solution, self.dist_matrix):.2f}) plt.xlabel(X Coordinate) plt.ylabel(Y Coordinate) plt.grid(True) plt.show() def plot_convergence(self): temps, distances zip(*self.history) plt.figure(figsize(10, 5)) plt.plot(distances) plt.title(Optimization Progress) plt.xlabel(Iteration) plt.ylabel(Best Distance) plt.grid(True) plt.show()使用示例# 生成随机城市坐标 np.random.seed(42) num_cities 20 cities np.random.rand(num_cities, 2) * 100 # 计算距离矩阵 distance_matrix np.zeros((num_cities, num_cities)) for i in range(num_cities): for j in range(num_cities): dx cities[i,0] - cities[j,0] dy cities[i,1] - cities[j,1] distance_matrix[i,j] np.sqrt(dx*dx dy*dy) # 创建并运行求解器 solver TSPSolver(cities, distance_matrix) best_solution, best_distance solver.run_annealing( initial_temp10000, final_temp0.1, cooling_rate0.95, iterations_per_temp100 ) # 可视化结果 print(fBest solution found: {best_solution}) print(fTotal distance: {best_distance:.2f}) solver.plot_solution() solver.plot_convergence()性能优化技巧增量计算避免每次完全重新计算路径长度只计算变化部分并行化在不同温度下可以并行评估多个候选解自适应冷却根据搜索进度动态调整冷却速率记忆机制保留历史上发现的优质解防止丢失模拟退火算法的魅力在于它能够平衡探索与开发在随机性和确定性之间找到优雅的平衡点。通过调整温度参数和邻域结构这个框架可以适应各种优化问题从物流路径规划到集成电路设计从机器学习超参数调优到金融投资组合优化。