谷歌搜索AI升级后频现拼写问题AI虽有用却有不少黑历史像算不准Strawberry中r的数量、知道马嘉祺却叫不出名字还有AI幻觉问题也一直困扰着用户。如今谷歌搜索又出了新问题。有用户发现近日升级了AI能力的谷歌搜索面对“google里面有几个P”这样简单的问题竟答错了此事引发广泛关注和测试热潮。实际上不只是google这个词谷歌搜索在处理很多其他词时也会出现字母计数和拼写问题甚至纯汉语提问也可能遇到此类问题。问题根源LLM结构性缺陷要理解这次的问题得先了解谷歌最近的动作。今年5月的Google I/O 2026大会上谷歌宣布了一次被称为“搜索框25年来最大升级”的搜索改版。新版谷歌搜索以重新设计的“智能搜索框”为核心将AI Overview与AI Mode整合为统一的搜索流程。但问题也随之而来数周前就有用户发现谷歌搜索框输入“disregard”时AI将其当成指令虽该bug已修复但拼写错误问题仍存在。谷歌相关人士称词内数字母是大语言模型已知难题。真正原因是AI其实“看”不见字母这是所有LLM共同面临的结构性缺陷。LLM处理文字基本单位是token而非字母这导致它在数字母时表现不佳。老问题与特殊影响“Strawberry里有几个r”早在大模型兴起之初就是测试AI的经典梗主流模型不加提示大多答错。不过若提问时加上特定提示模型通常能答对。大模型存在“Jagged Intelligence”现象能力分布不均是普遍特征。这次谷歌搜索问题引发更大讨论是因为谷歌搜索一直是很多人获取准确信息的默认入口用户容错预期低且这次翻车的是“Google”本身。此外Google AI Overviews此前也出现过离谱错误说明大模型存在系统性缺陷。修复方向与代价从技术角度解决字母感知缺陷有方向但代价大。一是抛弃现有分词机制如Meta AI团队的Byte Latent TransformerBLT架构虽在字符级任务测试中表现优异但抛弃分词会使序列长度剧增计算量大幅上升且目前实验规模与生产级模型有差距重新训练成本高昂。另一个方向是让模型“知道自己不擅长什么”如Meta在Llama 3训练中针对此做了系统性工程这类训练层面的修补成本低但治的是症状不是病根。谷歌也在针对“词内字母计数”做优化但修复周期长且涉及成本问题。