1. 测序技术的起点Sanger测序如何改变生物学1975年的一个实验室里弗雷德里克·桑格正在调试电泳装置。这位后来两度获得诺贝尔奖的科学家不会想到他发明的链终止法即Sanger测序会成为未来40年基因研究的基石。这项技术的精妙之处在于用最朴素的生物化学原理解决了DNA序列读取的难题——通过ddNTP这种分子剪刀随机终止DNA链延伸再用电泳分离不同长度的片段。我曾在实验室用传统Sanger法测过质粒序列至今记得放射自显影后X光片上那些深浅不一的条带。每个泳道对应一种碱基从下往上读条带位置就像破译摩尔斯电码。这种一代测序虽然每次只能读800-1000bp但准确率高达99.99%使得人类基因组计划在2001年得以完成。不过它的短板也很明显一个反应只能测一条片段通量低且成本昂贵当年完成一个人基因组约需1亿美元。2. 二代测序的革命当生物学遇上半导体技术2005年454生命科学公司推出的GS20测序仪掀起了NGS下一代测序风暴。我在2010年第一次接触Illumina HiSeq时被其数据产出量震惊——单次运行就能产生200GB数据相当于5万次Sanger测序。这背后的核心技术突破是边合成边测序Sequencing by Synthesis把DNA测序变成了类似计算机的并行处理任务。以Illumina为例其核心工艺是将DNA片段固定在流动槽表面进行桥式PCR扩增形成数百万个克隆簇。每个循环加入带荧光标记的可逆终止dNTP用激光扫描记录颜色信号。这种设计就像用显微镜同时观察数百万个微型Sanger反应把通量提升了百万倍。但代价是读长缩短到150-300bp给后续拼接带来挑战。有趣的是不同厂商选择了不同的信号检测路径454测序仪监测焦磷酸释放的发光信号Ion Torrent通过半导体芯片检测氢离子浓度变化SOLiD系统采用双碱基编码的荧光探针3. 单分子实时测序三代技术的破局之道当二代测序的短读长问题困扰着结构变异研究时PacBio公司的SMRT技术给出了新思路。我有幸在2016年试用过RS II测序仪看着那些纳米级零模波导孔ZMW中发生的实时合成反应真切感受到单分子技术的魅力。DNA聚合酶在孔底持续工作每秒可合成10个碱基读长轻松突破10kb。更颠覆认知的是Oxford Nanopore的蛋白质纳米孔技术。2014年我们团队测试MinION时这个U盘大小的设备竟能实时输出数据。当DNA分子穿过纳米孔时引起的电流变化就像摩斯密码般传递着序列信息。这种直接测序方式甚至能检测碱基修饰读长记录保持者已达到惊人的2.3Mb不过三代测序的软肋也很明显PacBio的原始错误率约15%需通过环形一致性测序纠错Nanopore对实验条件敏感需要优化文库制备两者成本仍是二代的5-10倍4. 技术迭代背后的关键突破点回看三代测序的发展轨迹有几个关键创新节点特别值得关注信号检测方式的进化从Sanger的放射性标记到二代的荧光成像再到三代的电子信号检测检测灵敏度提升了8个数量级。这背后是光电传感器、半导体工艺等跨学科技术的融合。比如Ion Torrent的CMOS芯片本质上就是把生化反应转化为数字信号。模板制备的简化之路二代测序依赖复杂的文库构建和PCR扩增而Nanopore只需在DNA两端加接头发送蛋白就能直接测序。我们做过对比实验从样本到数据产出Nanopore比Illumina节省2天预处理时间。读长与通量的螺旋上升技术迭代不是简单的线性替代而是呈现螺旋式发展。PacBio最新发布的Revio平台已实现1300Gb/run的通量兼具长读长和高产出。这种鱼与熊掌兼得的突破往往来自底层技术的重构。5. 测序技术的未来超越四代的可能性在纳米孔技术方兴未艾之时一些实验室已开始探索更前沿的方向。例如直接读取DNA电子隧穿信号的原位测序或利用CRISPR系统进行靶向富集。最近试用的Element Biosciences AVITI系统给我留下深刻印象——它通过空间分隔技术将成本降至$2/GB准确率却保持Q30以上。测序技术演进的本质是解码生命信息效率的竞赛。从桑格时代的手工操作到现在的全自动化流程从单次反应到超高通量每次突破都推动着生物学研究范式的变革。或许不久的将来我们能在手机上实时监测自身基因组变化那将是测序技术带给人类的又一次惊喜。