n 维向量 用 n 个数字化特征去具象化现实信息是现实世界和人工智能数学计算的中间桥梁。任何信息图像、音频、文字、电信号要想被AI模型处理必须先被具象化成n维度向量的数值数据。并实例说明图像、音频、文字是如如何向量化的。核心公理图像、音频、文本、传感电信号计算机无法直接理解原始数据全部要映射为 n 维数值向量向量就是现实信息→AI 数学运算的标准化媒介。原始信号像素 / 声波 / 汉字→特征提取→N 维特征向量→送入模型训练 / 推理。一、文本向量化NLP前面已学四类方案1.OneHot单词稀疏向量词典[苹果,香蕉,书桌]\(n3\)苹果\([1,0,0]\)、香蕉\([0,1,0]\)每一维是否为对应词语。2.BoW 词袋文本稀疏向量词典\([\text{我,爱吃,苹果,香蕉}]\)句子我爱吃苹果 \(\rightarrow[1,1,1,0]\)每一维对应词语出现频次。3.Word2Vec 稠密词向量单个词语映射 \(n300\) 维浮点向量\(\vec{苹果}[0.12,0.35,-0.21……]\)维度是模型自学的隐性语义特征。4.BGE 稠密句向量整段文本直接输出 768/1024 维向量承载全句语义。本质文字符号 → 语义特征 → N 维向量。二、图像向量化CV 计算机视觉1. 原始像素向量最简单2. 深度学习特征向量CNN/ResNet图片经过卷积神经网络丢弃原始像素模型自动提取轮廓、纹理、颜色特征语义信息输出固定维度稠密向量如 512 维、1024 维。猫的图片→512 维特征向量同类动物图片特征向量余弦相似度更高。本质像素点阵 → 视觉特征 → N 维向量。三、音频向量化语音识别 / 声纹原始波形采样声波是连续模拟电信号采样量化变成时序数字一段 1s 音频采样率 16000原始向量维度\(n16000\)。工程常用MFCC 梅尔倒谱特征对音频做傅里叶变换 梅尔滤波压缩提取声学特征单条音频转为39 维 / 128 维固定向量。例“你好” 音频 \(\rightarrow[2.31,0.55,-1.22……]\)128 维。说话人相同音频向量相似度偏高。本质模拟声波电信号→频域声学特征→N 维向量。四、传感器电信号向量化工业 / 物联网温度、电压、震动这类连续模拟电信号定时采样得到数值序列。设备 1 秒采集 5 项指标温度、电压、电流、湿度、震动值\(n5\)。样本\([25.3,220.5,1.2,45,0.02]\)送入异常检测模型做故障识别。本质连续模拟电信号→离散采样特征→N 维向量。五、统一总结四类数据演进规律原始非数值信息文字 / 图片 / 声波 / 电信号特征工程 / 模型提取特征标准化 n 维数值向量稀疏 / 稠密模型输入矩阵运算、梯度下降、相似度计算、分类预测六、稀疏 / 稠密区分回顾稀疏向量OneHot、原始大尺寸像素、原始采样音频大量数值为 0维度极高、信息冗余稠密向量Word2Vec、BGE、CNN 图像特征、MFCC 音频特征低维浮点数组特征高度压缩是现代 AI 主流输入。