ai-vi-12026年6月27日 17:22说话人000:00当你的大脑识别出一个部分被遮挡的物体或者人工智能根据文本提示生成一幅生动的图像时两者都是在解决同一个深层次的难题在数据不完整的情况下进行不确定性推理。说话人000:12这个基本问题是自然智能和人工智能的核心所在。如何根据有限的线索创建复杂世界的高效且准确的模型说话人000:20在本视频中我们将探讨变分推断这是一种精妙的数学工具能将这项艰巨的任务转变为大脑和计算机都能掌握的内容。说话人000:31从基本原理出发进行构建我们将揭示证据下界。这个概念已成为现代智能系统的基石甚至可能阐明我们人类大脑的工作原理。说话人000:44先快速说明一下虽然我尽量让这个视频内容完整独立但我们还是会以稍快的节奏从头开始构建所有内容。说话人000:50所以如果你觉得需要复习概率论基础知识可以查看我之前的视频。说话人000:59它从随机。说话人001:03变量一直讲到交叉熵、KL散度啊这些都是我们今天会大量用到的概念。如果想更深入地了解生物方面的内容……说话人001:07我最近发布的关于自由能原理的视频和这个视频非常搭配。我们直接开始吧。大脑和人工神经网络都会受到复杂输入的冲击。说话人001:22对于大脑来说这可能是视网膜神经元的激活模式。对于人工智能系统来说这可能是图像中的像素值。说话人001:29这之所以具有挑战性是因为这些数据是高维的每个观测值都包含许多相互关联的变量。例如一张 100×100 像素的图像就包含 1 万个独立数值。这些数值并非相互独立而是遵循复杂的模式。核心洞见在于智能系统能够利用这些内在模式构建压缩模型从而捕捉所观察事物的本质。说话人001:53对于生物大脑而言这种建模能力对生存至关重要。说话人002:02对于 Intelligent systems尤其是生成式建模领域我们会明确设计它们来捕捉并重现这些模式。说话人002:06为了让这个概念更具体我们来设置一个简化的例子。想象你是一艘海洋研究船正试图了解海洋生物。说话人002:17你有三个传感器分别测量水温、盐度和叶绿素浓度。说话人002:23每次将这些传感器放入海洋你都会收集到一个数据点也就是一个包含三个数字的向量。说话人002:31当你在海洋中收集样本时模式开始显现。这些测量值并非相互独立例如可能存在不同的海洋生物群系它们会限制这些变量之间的相互关系。说话人002:40特定的温度范围可能只出现在特定的盐度水平内。而叶绿素浓度则会根据其他变量呈现出一定的模式。说话人002:51这种测量过程本质上是从潜在的三维概率分布中进行采样。说话人002:56一个数学。说话人003:02函数会将这个测量空间中的每个向量与一个正数及其概率相关联定义哪些区域是极有可能被观测到的。说话人003:09比如常见的生物群系以及哪些是自然界中不存在的近乎不可能的组合。我们将把X 称为单个数据点在这种情况下就是一个包含三个测量值的向量。而PX​ 是该数据的真实潜在概率分布。我们的目标是从有限数量的样本中构建一个能够有效描述这种复杂分布的模型。说话人003:40这就是我们引入一个强大的简化假设的地方。我们将把观测值建模为由一个隐藏的或潜在的随机变量 Z 决定。说话人003:48该变量具有其自身的概率分布()P(Z)。例如它可能代表我们无法直接测量的海洋生物群系的基本属性但却能解释我们所观察到的模式。说话人003:55妙就妙在我们甚至不需要知道这个潜在因素究竟代表什么。我们会让模型自己去发现它。这种方法将我们的高维建模问题转化为更容易处理的问题。从机制上讲我们的模型是这样工作的。首先我们从称为先验的初始分布中随机采样潜在因素Z的值。说话人004:20然后给定这个特定值我们确定与这个潜在因素兼容的可能测量值的分布。说话人004:30我们本质上是将两个采样过程连接在一起。因此X 的分布取决于我们采样的Z 值。这就形成了所谓的 条件概率即在给定特定Z 值的情况下观察到X 的概率即为(∣)P(X∣Z)。说话人004:47在概率符号中我们可以写出以下公式。这个等式告诉我们X和Z 同时发生的联合概率等于首先偶然得到潜在因素正确值的概率乘以我们的测量值在该特定因素下的概率。说话人004:57在继续之前让我们澄清一个经常被忽略的重要点。