基于NGS的动物宏条形码(Metabarcoding)——原理、引物与实验方案
43
2026-04-30
一、动物宏条形码的背景介绍
1.1 从DNA条形码到宏条形码
DNA条形码技术自Hebert等人于2003年首次提出以来,已成为物种鉴定和生物多样性评估的重要分子工具。该方法利用短而标准化的DNA序列作为分子标记,实现了快速、标准化和可重复的物种鉴定。对于动物而言,线粒体细胞色素c氧化酶亚基I(COI)基因被确立为核心条形码标记,其长度约650 bp,具有足够的种间变异性和种内保守性,能够有效区分绝大多数动物物种。
传统的DNA条形码(Single Barcoding)对单一样本逐个进行PCR扩增、Sanger测序和物种鉴定,适用于形态学鉴定困难的样本、隐存种发现、食品和中药材溯源等场景。然而,当面对环境样本(如水体、土壤、粪便)中难以计数甚至无法辨认的混合生物群落时,传统条形码的通量瓶颈和成本问题便凸显出来。
DNA宏条形码(Metabarcoding)正是为解决这一问题而发展的技术演进。它将高通量测序技术与DNA条形码深度结合,能够同时对环境样本中数十至数百个物种的混合DNA进行扩增、测序和并行鉴定,突破了传统条形码“单一样本-单一物种”的低通量模式。宏条形码技术的核心思想是:一次PCR扩增多物种混合模板,一次NGS测序获取海量序列,一次生物信息分析解读群落组成,使得大规模、非侵入式的生物多样性监测成为可能。
1.2 技术原理与检测能力
动物宏条形码的实验流程可概括为以下环节:
- 环境样本采集:从水体、土壤、粪便、空气等介质中采集样品;
- DNA提取:提取环境样本中的全部遗传物质(包括生物残体、分泌物、排泄物中的DNA);
- PCR扩增:使用通用引物对目标条形码区域进行扩增(通常引物带有样本特异性“条形码”或“索引”以便多重样品混合测序);
- 高通量测序:将扩增产物构建成文库,在NGS平台(如Illumina MiSeq、NovaSeq,或纳米孔平台MinION等)上进行大规模并行测序;
- 生物信息分析:对原始测序数据进行质量控制、序列聚类(OTU聚类或ASV降噪)、物种注释(通常依赖NCBI BLAST或BOLD数据库),最终获得样本的生物多样性信息。
与传统形态学鉴定和单一样本条形码相比,宏条形码技术的突出优势在于:高效通量(可一次性分析数百个环境样本)、高灵敏度(能检测到微量甚至降解的环境DNA)、非入侵性(无需捕获或杀死目标生物)、标准化与可重复性。
二、动物宏条形码的主要应用领域
2.1 水生生物多样性监测
水生生态系统是宏条形码技术应用最为广泛的场景。通过采集水样、抽滤富集环境DNA,研究者可同时对鱼类、浮游动物、底栖无脊椎动物等多类群进行监测。例如,北京大学生命科学学院姚蒙研究组系统评估了18对无脊椎动物宏条形码通用引物,发现COI引物在淡水eDNA样本中可检出91~1524个无脊椎动物OTU,在海洋样本中可检出74~624个。eDNA宏条形码现已成为国内外淡水鱼类多样性调查的主流方法,应用于湖泊、河流和人工水库等各类水体。
2.2 动物食性分析与营养网络构建
通过分析动物粪便或肠道内容物的宏条形码数据,可以高效、非侵入地推断其食物组成。Leray等人开发的短片段COI引物(mlCOIintF/HCO2198)广泛应用于珊瑚礁鱼类食性分析。2024年一项研究中,研究者采用多标记宏条形码对加拿大濒危物种驯鹿(Rangifer tarandus)的粪便DNA进行分析,同时检测了肠道微生物群、寄生虫以及组成冬季饮食的植物和地衣。
在昆虫-植物互作网络研究方面,一项发表于《Methods in Ecology and Evolution》的研究开发了多重长片段DNA宏条形码方法,在一个PCR反应中同时扩增昆虫COI基因和植物的rbcL、ITS和trnL四个长片段条形码,结合自主开发的分析工具NGSdiet,昆虫COI鉴定准确率达到98.26%,植物条形码组合准确率达92.17%。
2.3 濒危物种监测与保护遗传学
宏条形码在高通量濒危物种监测中展现出显著潜力。2026年发表的一项研究利用Oxford Nanopore纳米孔测序平台在沙特阿拉伯干旱环境中进行食肉动物eDNA宏条形码监测,成功检测到包括阿拉伯豹在内的珍贵DNA,证明该方法可用于快速、非侵入性的食肉动物生物多样性评估。此外,基于粪便eDNA的多标记宏条形码工作流程已成功应用于驯鹿保护策略中,为濒危物种的饮食和健康状况提供了有价值的数据。
2.4 动物源性食品与中药材物种鉴定
高通量测序结合DNA条形码在动物源性食品掺假检测和中药材溯源中也有重要应用。研究者以牛、羊、猪、鸭等物种为对象建立了COI基因的通用扩增体系,用于肉类制品的物种鉴定。在中药材领域,动物类中药材及其基原物种均要求扩增COI序列进行分子鉴定。
2.5 入侵物种与检疫监测
宏条形码还可用于边境口岸动植物检疫、入侵物种早期预警和流行病学监测。例如,在对寄生线虫的研究中,宏条形码技术在物种鉴定、隐存种发现及流行病学监测中发挥着日益重要的作用。
三、常用引物及引物序列
动物宏条形码研究中常用的目标基因包括线粒体COI、12S rRNA、16S rRNA和核糖体18S rRNA基因。不同标记各有优势和局限:COI种间分辨率高、参考数据库丰富,但在某些类群(如部分节肢动物)中可能存在引物匹配度问题;12S/16S更适合鱼类和哺乳动物,扩增片段短(约150~300 bp),对降解的eDNA更友好;18S rRNA基因则可覆盖更广泛的无脊椎动物门类,可作为COI引物的有效补充。
3.1 COI基因常用引物
COI是动物宏条形码最核心的标记。以下列出常用的COI引物组:
|
引物名称 |
方向 |
序列(5′→3') |
产物长度 |
说明 |
|
LCO1490 |
正向 |
GGTCAACAAATCATAAAGATATTGG |
~650 bp |
标准条形码引物对,源于Folmer et al.,适用于 |
|
HCO2198 |
反向 |
TAAACTTCAGGGTGACCAAAAAATCA |
~650 bp |
与LCO1490配对 |
|
mlCOlintF |
正向 |
GGWACWGGWTGAACWGTWTAYCCYCC |
~313 bp |
宏条形码短片段,于2013年开发,广泛用于食性 |
|
jgHCO2198 |
反向 |
TAIACYTCIGGRTGICCRAARAAYCA |
~313 bp |
与mlCOlintF配对◎ |
|
fwhF2 |
正向 |
GGDACWGGWTGAACWGTWTAYCCICC |
~250~350 bp |
无脊椎动物宏条形码常用引物 |
|
fwhR2N |
反向 |
GTRATWGCHCCDGCTARWACWGG |
~250~350 bp |
与fwhF2配对 |
|
dgHCO2198 |
反向 |
一 |
一 |
部分研究中使用的嵌套引物变体7 |
|
M19/BR2 |
正向/反向 |
一 |
一 |
海洋无脊椎动物生境中表现最佳的CO引物对7 |
注:北京大学姚蒙研究组的研究表明,COI引物P03_HCO2198和P04_dgHCO2198在淡水生境中检出的无脊椎动物OTU数量最多,而P07_M19/BR2在海洋生境中表现最佳,说明最优引物的选择受到研究环境和生物组成的影响。
3.2 12S rRNA基因引物(重点推荐用于鱼类和哺乳动物)
12S rRNA基因是鱼类eDNA宏条形码中使用频率最高的标记。Miya等人开发的MiFish引物对已被广泛采用:
|
引物名称 |
方向 |
序列(5'→3') |
产物长度 |
说明 |
|
MiFish-U-F |
正向 |
GTCGGTAAAACTCGTGCCAGC |
~165~180 bp |
鱼类eDNA宏条形码通用引物对 |
|
MiFish-U-R |
反向 |
CATAGTGGGGTATCTAATCCCAGTTT |
~165~180 bp |
与MiFish-U-F配对 |
V12S-U、V16S-U和VCOl-U是近年来新开发的通用引物组,同时靶向12S、16S和COI三个线粒体基因,兼顾了覆盖度和分辨率,对脊椎动物多样性评估特别有效。
|
引物名称 |
靶标基因 |
产物长度(约) |
|
V12S-U |
12S rRNA |
~160 bp |
|
V16S-U |
16S rRNA |
~200 bp |
|
VCOl-U |
COI |
~300 bp |
3.3 16S rRNA基因引物
16S rRNA基因在哺乳动物物种鉴定和混合检材分析中也有较多应用:
|
引物名称 |
方向 |
序列(5′ →3') |
产物长度 |
说明 |
|
16Smam1 |
正向 |
CGGTTGCGCTGACTATTCAA |
~150 bp |
哺乳动物宏条形码常用 |
|
16Smam2 |
反向 |
GCTGTTATCCCTAGGGTAACT |
~150 bp |
与16Smam1配对 |
3.4 18S rRNA基因引物(无脊椎动物补充标记)
18S rRNA基因可作为COI引物的有效补充,覆盖更广泛的无脊椎动物门类,但总OTU检出数通常低于COI引物。研究表明,引物P14_1380F在无脊椎动物门级覆盖度方面表现良好:
|
引物名称 |
方向 |
序列(5′ →3') |
产物长度 |
说明 |
|
1380F |
正向 |
cCCTGCCHTTTGTACACAC |
~140 bp |
真核生物通用(V4区) |
|
1510R |
反向 |
CCTTCYGCAGGTTCACCTAC |
~140 bp |
与1380F配对 |
3.5 引物选择建议
综合现有研究,选择宏条形码引物时可考虑以下几点:
- 研究目标和类群:鱼类优先选用12S标记(MiFish引物);无脊椎动物多样性评估优先选用COI标记(如mlCOIintF/HCO2198),必要时辅以18S引物;哺乳动物可选用12S或16S标记。
- 环境类型:淡水生境引物P03_HCO2198和P04_dgHCO2198表现最佳,海洋生境引物P07_M19/BR2表现最佳。
- 序列降解程度:降解严重的eDNA样本需要采用较短产物(如150~300 bp)的引物。
- 参考数据库的匹配程度:建议在使用引物前通过in silico PCR评估引物对目标类群的覆盖度,并尽可能地构建或采用本地参考数据库。
- 多标记联用:采用COI/12S/16S等多标记联用策略可增强分类鉴定的可靠性。
四、实验步骤详解:从样本到数据全流程
以下以环境DNA样品的COI宏条形码实验为例,分步说明完整的操作流程。
1. 样品采集与DNA提取
样品采集:根据研究目的,采集代表性环境样品(如2L水样、10g土壤)。使用无菌容器,避免交叉污染,每个样品独立采集。
过滤/沉降:对于水样,建议使用0.45μm或0.22μm滤膜进行抽滤,将微生物聚集在滤膜上。
DNA提取:使用商用试剂盒(如MolPure® Bacterial DNA Kit(18806ES,细菌DNA提取)或MolPure® Mag Soil/Stool DNA Kit(18526ES磁珠法土壤/粪便DNA提取试剂盒)),严格按照说明书提取总DNA,并测定DNA浓度和质量(OD260/280在1.8–2.0之间为佳)。
DNA浓度测定:使用qubit定量设备(单通道核酸定量仪80571ES、83509ES,96通道核酸定量仪80575ES、83652ES)搭配qubit试剂(12642ES)测定浓度。
2. 目标片段富集:PCR扩增(注,不同测序平台,扩增引物会有差异)
设置PCR反应:50 μL PCR体系中包括以下成分:
|
组分 |
体积(μL) |
终浓度 |
|
模板DNA |
1 ng -200 ng |
- |
|
正向引物(10 μM)* |
1 |
0.1 μM-0.5 μM |
|
2×Multiplex Long PCR Master Mix(17228ES) |
25 |
|
|
反向引物(10 μM)* |
1 |
|
|
无菌超纯水 |
up to 50 |
- |
配置好以上体系后,在PCR仪中设置以下PCR程序:
|
循环步骤 |
温度(℃) |
时间 |
循环数 |
|
热盖 |
105℃ |
On |
- |
|
预变性 |
98℃ |
30 sec |
1 |
|
变性 |
98℃ |
|
30-35(根据实验要求) |
|
退火 |
60℃* |
5 sec |
|
|
退火延伸 |
5~10 sec/Kb |
||
|
终延伸 |
72℃ |
2 min |
1 |
|
暂存 |
4℃ |
- |
- |
3. 扩增产物0.9×纯化
1) 准备工作:将Hieff NGS® DNA Selection Beads(12601ES)磁珠由冰箱中取出,室温平衡至少30 min,配制80%乙醇。
2) 涡旋振荡或充分颠倒磁珠以保证充分混匀。
3) 吸取 45 μL Hieff NGS® DNA Selection Beads(0.9×,Beads:DNA=0.9:1)至一轮PCR产物中,室温孵育5 min。
4) 将 PCR 管短暂离心并置于磁力架中分离磁珠和液体,待溶液澄清后(约 5 min),小心移除上清。
5) 保持PCR管始终置于磁力架中,加入200 μL新鲜配制的80%乙醇漂洗磁珠,室温孵育 30 sec后,小心移除上清。
6) 重复步骤5,总计漂洗两次。
7) 保持PCR管始终置于磁力架中,开盖空气干燥磁珠至刚刚出现龟裂(不超过5min)。
8) 直接加入11 μL ddH2O,将PCR 管从磁力架中取出,涡旋振荡或使用移液器轻轻吹打至充分混匀,室温静置5 min。进入下一步反应。
4. 电泳检测:取1 μL PCR产物进行2%琼脂糖凝胶电泳(10208ES),确认目标条带明亮清晰,无非特异性扩增。
5-1 选择二代测序时:二次PCR(添加样品标签与测序接头)
二次PCR加标签:以纯化后的一次PCR产物为模板,使用带Illumina或者MGI接头的引物进行二次PCR扩增(13344ES),为每个样品添加独特的index标签,以便混合测序后区分不同样品。
纯化二次PCR产物:再次使用磁珠法纯化加标签后的文库产物(12601ES)。
5-2. 选择三代测序时:直接搭配通用建库试剂即可完成三代文库构建(13306ES)。
建库完成后,对文库进行纯化以便后续上机测序(12601ES)。。
6. 文库定量、混合与测序
浓度检测:使用qubit定量设备(单通道核酸定量仪80571ES、83509ES,96通道核酸定量仪80575ES、83652ES)搭配qubit试剂(12642ES)测定浓度。
等摩尔混合:将所有样品文库按等摩尔浓度混合,形成最终的测序pool。
高通量测序:将混合文库送检至NGS平台,常用平台包括Illumina NovaSeq、MGI T7或ONT、Cyclone等测序仪。
7. 生物信息学分析
五、总结与展望
宏条形码与NGS技术的结合极大地拓展了DNA条形码的应用边界,使研究者能够在单次实验中高效获取复杂的生物群落组成信息。这一技术已成为现代生物多样性调查、生态监测和物种鉴定的“新标准”。从水体鱼类监测到土壤线虫分析,从动物食性揭示到濒危物种追踪,宏条形码正在深刻地改变生态学和保护生物学的实践方式。
随着第三代测序技术的不断发展(如Oxford Nanopore和PacBio HiFi),长读长宏条形码将有望解决短读长在区分复杂多基因家族和近缘物种方面的分辨率瓶颈。同时,人工智能辅助物种注释和大规模参考数据库(如iBOL全球项目、BIOSCAN倡议)建设将持续提升宏条形码的分类可靠性和自动化水平。可以预见,在未来的生物多样性研究中,宏条形码将与无人机遥感、自动化野外采样设备和实时测序技术进一步深度融合,真正实现“全自动、全物种、全天候”的生物监测新范式。
六、产品推荐
|
实验步骤 |
产品名称 |
产品货号 |
|
DNA提取 |
MolPure® Bacterial DNA Kit |
|
|
MolPure® Mag Soil/Stool DNA Kit磁珠法土壤/粪便DNA提取试剂盒 |
||
|
COI扩增 |
Hieff NGS® Multiplex Long PCR Master Mix/ 长片段多重扩增酶 |
|
|
二代建库 |
2× Ultima HF Amplification Mix |
|
|
Illumina平台接头 |
||
|
MGI平台接头 |
||
|
三代建库 |
Hieff® LongSeq Amplicon End repair and Ligation Module |
13306ES |
|
纯化磁珠 |
Hieff NGS® DNA Selection Beads |
|
|
Qubit定量 |
1× dsDNA HS Assay Kit |





