分子生物学
IVD分子诊断
细胞培养与分析
蛋白研究
细胞因子
重组蛋白
抗体
高通量测序建库
病原检测UCF系列
生物医药
工具酶
抑制剂激活剂与常用试剂
仪器
耗材
COI条形码遇上NGS:一场物种鉴定的高通量革命

37

2026-04-30

说起DNA宏条形码,相信大家都不陌生。它就像是每种生物独特的“基因身份证”,通过一段短小的标准DNA序列,就能快速区分不同的物种。在动物界,这张“身份证”最常用的就是COI基因——细胞色素c氧化酶亚基I基因。由于进化速率较快,COI基因在亲缘关系密切的种、亚种之间表现出足够高的变异率,因而成为动物DNA条形码的主流标记,被广泛应用于物种鉴定、食品安全检测、生态监测等众多领域。

然而,传统基于Sanger测序的DNA条形码技术有一个天然的短板:一次只能处理一个样本或一个条形码。如果面对的是水体、土壤这样的环境样本,或者批量采集的昆虫群落,里面可能混有几十甚至上百种生物,逐个鉴定的话效率和成本都会让人望而却步。

这就是COI条形码与NGS测序相结合——DNA宏条形码技术应运而生的原因。简单来说,DNA宏条形码就是“DNA条形码+高通量测序”,它能够一次性对一个复杂混合样本中的全部物种进行同步检测,堪称物种鉴定的高通量革命。

一、技术原理:COI + NGS如何实现物种高通量鉴定?

DNA宏条形码的核心流程并不复杂:首先,从环境样品(水体、土壤)或混合生物样品(如批量采集的昆虫)中提取总DNA;然后,使用针对COI基因的通用引物进行PCR扩增,富集目标片段;接着,将扩增产物进行高通量NGS测序,一次实验就能获得数百万甚至上亿条序列;最后,将这些测序结果与参考数据库(如BOLD、NCBI)进行比对,从而鉴定出样品中包含的全部物种组成。

与传统方法相比,DNA宏条形码具有三大核心优势:一是高通量,单次测序可分析数百万条DNA序列,覆盖多种物种;二是高灵敏度,即使样品中含量极低的物种也能被检测到;三是快速高效,检测周期可缩短至48小时以内。

值得一提的是,COI基因在NGS应用中有一个特殊挑战:传统的标准COI条形码片段长达658 bp(Folmer区域),这个长度对于部分NGS平台(尤其是早期的平台)来说偏长,难以在一次测序中得到完整覆盖。因此,在实际应用中通常选择更短的“微型条形码”(mini-barcode)片段,长度一般在150–300 bp之间,不仅适配NGS平台,还能在DNA降解程度较高的加工食品等样本中获得更好的扩增效果。

二、应用领域:从深海到餐桌,COI条形码无处不在

1. 生态监测与生物多样性评估

基于COI宏条形码的环境DNA技术,正在彻底改变生物多样性监测的方式。研究人员只需从水体、土壤中采集样本,提取其中的DNA,再通过高通量测序,就能无创式地监测整个水域的鱼类群落、昆虫种群或底栖动物多样性,而不需要实际捕捉任何生物。这种方法在昆虫数量全球性下降的大背景下,为大规模物种多样性监测提供了可靠的工具。例如,一项研究利用COI宏条形码结合优化的生物分类验证方法,检测了492个混合甲虫样本,大幅提升了物种发现的准确性和效率。

更值得一提的是,反向流程(reverse workflow)的创新让每个单个标本都能通过NGS批量测序获得自己的DNA条形码。在热带蚂蚁的研究中,该方法成功为4032个标本中的3290个获取了313 bp的COI条形码,每个标本的实验室成本不到0.50美元——远低于传统Sanger测序的成本,从而加速了无脊椎动物的物种发现和分类学研究。

最新研究还提出了BOLDistilled算法,它通过0.75%的序列差异阈值从BOLD系统中智能筛选代表性序列,将COI条形码参考库从1570万条压缩至170万条(压缩率高达89.2%),使宏条形码分析耗时降低98%以上,同时不损失分类准确性。这一进展极大地提升了大规模物种鉴定的效率。

2. 食品与商品的真伪鉴别

食品安全是COI宏条形码最贴近公众生活的应用场景之一。“驴肉中掺马肉”“海参产品以次充好”“加工肉制品来源不明”……这些食品安全事件背后,COI微型条形码结合NGS技术正在成为打击造假的强力武器。

一项针对高度加工海参产品的研究揭示,高达83.33%(10/12)的产品存在贴假标签的问题。另一项研究利用COI微型条形码结合NGS,成功在复杂和掺假的加工肉制品中准确鉴定出猪、牛、山羊、鱼类、虾和禽类等多种动物源成分,其准确性和灵敏度远超传统的克隆测序法。

在鱼胶产品鉴定方面,研究人员筛选出了一组扩增目标片段约190 bp的微型条形码引物组合,PCR测序成功率达100%,物种鉴定准确率达98.15%。通过对市售鱼胶样品进行检测,发现仅56.25%的样本与标注物种一致——表明食品标签造假在高端海产品中是一个相当普遍的问题。

3. 物种发现与分类学

NGS高通量测序正在加速COI条形码参考数据库的构建和完善。COInr数据库是一个免费的、易于访问的非冗余COI参考序列数据库,从BOLD和NCBI两大数据库提取而成,覆盖范围广泛,并不限于特定的分类群或基因区域,是开展宏条形码物种鉴定的理想起点。

得益于BOLDistilled等高压缩比数据库的推出,物种鉴定变得更加快捷高效。这些进展为全面构建全球生物DNA条形码参考库铺平了道路。

4. 食性分析与生态系统研究

通过高通量测序动物粪便或肠道内容物中的COI基因片段,研究人员可以客观、详细地解析动物的食谱组成,揭示复杂的食物网关系。这种方法不仅比传统形态学分析更加高效,还能检测到传统方法难以发现的隐蔽猎物,为生态学研究提供了全新的视角。

5. 医学与法医学应用

在临床诊断和法医鉴定中,快速、低成本的物种鉴定也至关重要。新一代便携式测序平台(如ONT MinION)结合COI条形码技术,能够在短时间内完成物种鉴定,为法医昆虫学和快速病原体鉴定等领域带来了新的可能性。

三、常用参考引物:COI宏条形码的关键工具

在COI宏条形码实验中,引物选择是最关键的步骤之一。以下是在动物类群中应用最为广泛且经过验证的几组引物。

(1)Leray引物(mlCOIintF)与Folmer引物(HCO2198)

这是COI宏条形码中最经典的引物组合。正向引物mlCOIintF由Leray等人于2013年设计,反向引物HCO2198源自Folmer等人1994年的经典工作,两者组合扩增的“Leray片段”长度适中,广泛适用于真核生物环境DNA宏条形码研究。

在Protocols.io的标准方案中,该引物对的具体序列如下:

  • 正向引物 mlCOIintF:GGWACWGGWTGAACWGTWTAYCCYCC
  • 反向引物 HCO2198:TAAACTTCAGGGTGACCAAARAAYCA

注意:序列中的W代表混合碱基(A/T),R代表混合碱基(A/G),Y代表混合碱基(C/T)。这些简并设计确保了引物在多个物种中的通用性。

(2)完整的Folmer引物对(LCO1490 / HCO2198)

这是动物DNA条形码领域历史最悠久、引用最广泛的引物,由Folmer等人于1994年开发。该引物对扩增的片段约658 bp,涵盖经典的COI条形码区域,适合于Sanger测序,也可用于NGS建库。

  • 正向引物 LCO1490:GGTCAACAAATCATAAAGATATTGG
  • 反向引物 HCO2198:TAAACTTCAGGGTGACCAAARAAYCA

(3)fwhF2 / fwhR2N 引物对

专门针对淡水大型无脊椎动物设计的微型条形码引物,扩增片段较短,特别适合已经发生降解的DNA样本(如陈旧的博物馆样本或深度加工食品),在法国淡水环境的宏条形码研究中得到了系统验证。

四、引物选择实用建议

  1. 环境DNA样本(如水体、土壤):Leray引物(mlCOIintF + HCO2198)表现优异,推荐首选。
  2. 新鲜组织样本(如昆虫标本):标准Folmer引物(LCO1490/HCO2198)效果最佳。
  3. 加工食品/降解样本(如熟肉、干货):优先选用135–257 bp的微型条形码引物。
  4. 扩增失败时:可尝试更换引物组合或多对引物混合扩增,以提高分类覆盖度。

五、实验步骤详解:从样本到数据全流程

以下以环境DNA样品的COI宏条形码实验为例,分步说明完整的操作流程。

1. 样品采集与DNA提取

样品采集:根据研究目的,采集代表性环境样品(如2L水样、10g土壤)。使用无菌容器,避免交叉污染,每个样品独立采集。

过滤/沉降:对于水样,建议使用0.45μm或0.22μm滤膜进行抽滤,将微生物聚集在滤膜上。

DNA提取:使用商用试剂盒(如MolPure® Bacterial DNA Kit(18806ES,细菌DNA提取)或MolPure® Mag Soil/Stool DNA Kit(18526ES磁珠法土壤/粪便DNA提取试剂盒)),严格按照说明书提取总DNA,并测定DNA浓度和质量(OD260/280在1.8–2.0之间为佳)。

DNA浓度测定:使用qubit定量设备(单通道核酸定量仪80571ES83509ES,96通道核酸定量仪80575ES83652ES)搭配qubit试剂(12642ES)测定浓度。

2. 目标片段富集:PCR扩增(注,不同测序平台,扩增引物会有差异)

设置PCR反应:50 μL PCR体系中包括以下成分:

组分

体积(μL)

终浓度

模板DNA

1 ng -200 ng

-

正向引物(10 μM)*

1

0.1 μM-0.5 μM

2×Multiplex Long PCR Master Mix(17228ES

25

反向引物(10 μM)*

1

无菌超纯水

up to 50

-

配置好以上体系后,在PCR仪中设置以下PCR程序:

循环步骤

温度(℃)

时间

循环数

热盖

105℃

On

-

预变性

98℃

30 sec

1

变性

98℃

10 sec

 

30-35(根据实验要求)

退火

60℃*

5 sec

退火延伸

68°C~72°C**

5~10 sec/Kb

终延伸

72℃

2 min

1

暂存

4℃

-

-

3. 扩增产物0.9×纯化

1) 准备工作:将Hieff NGS® DNA Selection Beads(12601ES)磁珠由冰箱中取出,室温平衡至少30 min,配制80%乙醇。

2) 涡旋振荡或充分颠倒磁珠以保证充分混匀。

3) 吸取 45 μL Hieff NGS® DNA Selection Beads(0.9×,Beads:DNA=0.9:1)至一轮PCR产物中,室温孵育5 min。

4) 将 PCR 管短暂离心并置于磁力架中分离磁珠和液体,待溶液澄清后(约 5 min),小心移除上清。

5) 保持PCR管始终置于磁力架中,加入200 μL新鲜配制的80%乙醇漂洗磁珠,室温孵育 30 sec后,小心移除上清。

6) 重复步骤5,总计漂洗两次。

7) 保持PCR管始终置于磁力架中,开盖空气干燥磁珠至刚刚出现龟裂(不超过5min)。

8) 直接加入11 μL ddH2O,将PCR 管从磁力架中取出,涡旋振荡或使用移液器轻轻吹打至充分混匀,室温静置5 min。进入下一步反应。

4. 电泳检测

取1 μL PCR产物进行2%琼脂糖凝胶电泳(10208ES),确认目标条带明亮清晰,无非特异性扩增。

5-1 选择二代测序时:二次PCR(添加样品标签与测序接头)

二次PCR加标签:以纯化后的一次PCR产物为模板,使用带Illumina或者MGI接头的引物进行二次PCR扩增(13344ES),为每个样品添加独特的index标签,以便混合测序后区分不同样品。

纯化二次PCR产物:再次使用磁珠法纯化加标签后的文库产物(12601ES)。

5-2. 选择三代测序时:直接搭配通用建库试剂即可完成三代文库构建(13306ES)。

建库完成后,对文库进行纯化以便后续上机测序(12601ES)。。

6. 文库定量、混合与测序

浓度检测:使用qubit定量设备(单通道核酸定量仪80571ES83509ES,96通道核酸定量仪80575ES83652ES)搭配qubit试剂(12642ES)测定浓度。

等摩尔混合:将所有样品文库按等摩尔浓度混合,形成最终的测序pool。

高通量测序:将混合文库送检至NGS平台,常用平台包括Illumina NovaSeq、MGI T7或ONT、Cyclone等测序仪。

7. 生物信息学分析

数据质控与预处理:

  • 使用FastQC评估原始测序数据质量。
  • 使用Trimmomatic或cutadapt去除低质量序列和接头序列。
  • 使用DADA2或QIIME2进行去噪和OTU/ASV聚类。

物种注释:

将处理后序列与参考数据库进行BLAST比对

(推荐使用BOLD数据库(生命条形码数据系统)或NCBI GenBank,也可使用整合数据库COInr,它整合了BOLD和NCBI两大来源,覆盖全面且避免了序列冗余。CREST等算法可用于环境样本的精确分类鉴定)

结果可视化与报告:

  • 使用R进行Alpha多样性(Shannon指数、Chao1)与Beta多样性(PCoA、NMDS)分析。
  • 绘制物种组成条形图。
  • 生成包含物种列表及相对丰度的检测报告,检出非预期物种即判定为样品存在掺假或异常。

六、展望与启示

COI条形码与NGS技术的结合,正以前所未有的效率加速着生物学研究的各个领域。从深海生物群落到餐桌上的美食,从广袤森林的昆虫群落到医院里的快速诊断,这项技术正在重塑我们认识和追踪世界上物种的方式。

当然,没有一种技术是完美无缺的。COI宏条形码也面临着引物偏差、参考数据库不完整、生物信息学分析复杂等挑战。但随着测序成本的持续降低、Bioinformatic工具的日趋完善,以及全球DNA条形码参考数据库(如BOLD)的不断扩展,这些限制正在被逐一打破。

对科研工作者而言,COI宏条形码已成为生物多样性监测、分子生态学和食品安全检测的标配工具。对每一位关注食品质量和生态环境的普通人而言,这项技术也正在以不易察觉但影响深远的方式,为更透明、更安全的生活保驾护航。

七、参考文献与推荐数据库

  1. BOLD(Barcode of Life Data System):https://www.boldsystems.org
  2. NCBI GenBank:https://www.ncbi.nlm.nih.gov/genbank
  3. COInr(非冗余COI参考数据库):https://doi.org/10.5281/zenodo.6555985
  4. Protocols.io COI宏条形码标准方案:https://www.protocols.io

产品推荐

实验步骤

产品名称

产品货号

DNA提取

MolPure® Bacterial DNA Kit
细菌DNA提取

18806ES

MolPure® Mag Soil/Stool DNA Kit磁珠法土壤/粪便DNA提取试剂盒

18526ES

COI扩增

Hieff NGS® Multiplex Long PCR Master Mix/ 长片段多重扩增酶

17228ES

二代建库

2× Ultima HF Amplification Mix
高保真DNA文库扩增模块

13344ES

Illumina平台接头

12327~12330ES

MGI平台接头

13350~13353ES

三代建库

Hieff® LongSeq Amplicon End repair and Ligation Module
全长扩增子建库

13306ES

纯化磁珠

Hieff NGS® DNA Selection Beads

12601ES

Qubit定量

1× dsDNA HS Assay Kit
即用型dsDNA qubit定量试剂

12642ES

联系我们
购物车
客服
转染试用