用于识别纤毛虫物种的DNA条形码的NGS应用——纤毛虫宏条形码技术综述
38
2026-04-30
纤毛虫是一类高度多样化的单细胞真核微生物,在微生物环流(microbial loop)、营养物循环和生态系统维持中扮演关键角色。传统上依赖形态学特征对纤毛虫进行物种鉴定,但这通常耗时且需要专业分类学知识。近年来,结合条形码技术的下一代测序(NGS)即宏条形码(metabarcoding)方法的发展,从根本上改变了对纤毛虫群落结构和生物多样性的描述方式。本文综述纤毛虫宏条形码技术的背景、应用、常用引物及其序列、实验流程及局限性,为该领域的初学者提供系统参考。
1 背景
1.1 纤毛虫及其生态重要性
纤毛虫隶属于原生动物界纤毛门(Ciliophora),是单细胞真核微生物中多样性最高的类群之一。它们在各类水体和土壤生态系统中广泛分布,通过捕食细菌和微型藻类,将微生物物质和能量向上传递至更高营养级,是连接微生物与后生动物的重要环节。此外,纤毛虫群落对有机污染、重金属污染和环境胁迫高度敏感,已被广泛用作水质和生态系统健康的生物指示剂。
1.2 DNA条形码与宏条形码
DNA条形码技术利用标准化的短基因片段作为物种鉴定的分子标签。宏条形码则是条形码技术与高通量测序的结合,通过对环境样品(如水体、沉积物、土壤)中提取的总DNA进行PCR扩增和NGS测序,可一次性获得整个微生物群落中多种物种的条形码序列,从而高效评估群落组成和多样性。
1.3 纤毛虫条形码的目标基因选择
纤毛虫宏条形码研究最常用的目标基因是小亚基核糖体RNA基因(SSU rRNA基因,即18S rDNA)的超变区。该基因在所有真核生物中高度保守,适合设计通用引物,同时在序列间存在足够的变异,可用于物种间的区分。常用的超变区包括V4区和V9区,两者的长度适中(约300–500 bp),适合Illumina平台的高通量测序。
研究表明,V4超变区的遗传距离与全长SSU rDNA的遗传距离最为匹配,比V9区更接近基于更长片段的分类结果,且在纤毛虫纲(class)水平上适合进行精确的进化推断。V9区虽然较短(约120–200 bp),但对纤毛虫物种内变异的分辨能力与形态分类结果具有良好的相关性,且因其较短,尤其适合降解程度较高的环境DNA(如沉积物eDNA)的扩增和测序。
近年研究提出,对于需要物种级分辨率的研究,内转录间隔区(如ITS1和ITS2)及28S rRNA基因可能优于18S rRNA基因。研究发现ITS1和ITS2在种间和种内水平的变异程度均高于18S rRNA基因,ITS1能检测到18S rRNA基因未能检出的更多纤毛虫种类,推荐将ITSI用于淡水环境和瘤胃环境中纤毛虫群落的增强型元分类学分析。
2 主要应用方向
2.1 纤毛虫多样性评估
宏条形码技术能够揭示传统显微镜方法难以发现的隐存种和稀有种。Abraham等(2024)首次利用高通量DNA宏条形码方法对印度德里地区三个淡水样点的纤毛虫多样性进行调查,基于18S V4区测序共检测到106个OTU,其中寡膜纲(Oligohymenophorea)、前口纲(Prostomatea)和旋毛纲(Spirotrichea)为优势类群。
2.2 环境监测与生物指示
由于纤毛虫对环境变化高度敏感,宏条形码技术已广泛应用于水质评价和污染监测。Silva等(2024)在巴西Sapucaí河沿城市污染梯度设置的7个样点,利用V4 18S-rRNA分子标记进行DNA宏条形码分析,共记录125个纤毛虫OTU,其中城市区域样点的纤毛虫丰富度和多样性最低,证实了污染梯度对群落的影响。
2.3 与形态分类学的整合研究
分子与形态方法的整合有助于更全面地理解纤毛虫多样性及其生态功能。在一项对巴西罗德里戈·德弗雷塔斯泻湖纤毛虫的研究中,宏条形码分析(V4区)检测到37个MOTU,约仅为显微镜检测出的65个形态型的56.9%,两者均显示旋毛纲和寡膜纲为优势类群。另一项对喀斯特河流的研究中,eDNA宏条形码方法检测到的纤毛虫类群显著多于传统方法,且揭示了传统方法未能识别的采样点间群落结构差异,表明eDNA方法建立的分析系统能够更准确地反映生物指示潜力。
3 常用引物与参考数据库
3.1 常用引物序列
鉴于SSU rDNA(18S rRNA基因)是纤毛虫宏条形码使用最广泛的靶标区域,实际应用中更倾向于根据目标基因区域选择引物。目前使用最广泛的引物对如下:
|
目标区域 |
引物名称 |
序列(5′ →3') |
长度(bp) |
应用 |
|
18S V4区 |
TAReuk454FWD1 |
CCAGCASCYGCGGTAATTCC |
~380 |
真核微生物通用,纤毛虫多样性评估 |
|
TAReukREV3 |
ACTTTCGTTCTTGATYRA |
|||
|
18S V4区 |
528F |
GCGGTAATTCCAGCTCCAA |
~351 |
纤毛虫/原生生物多样性 |
|
706R |
AATCCRAGAATTTCACCTCT |
|||
|
18S V9区 |
1380F |
CCCTGCCHTTTGTACACAC |
~130 |
eDNA样品,降解DNA,海洋监测 |
|
1510R |
CCTTCYGCAGGTTCACCTAC |
|||
|
ITS1 |
ITS1-F |
TCCGTAGGTGAACCTGCGG |
~200-300 |
物种级分辨率 |
|
ITS1-R |
GCTGCGTTCTTCATCGATGC |
|||
|
ITS2 |
ITS2-F |
ATGCGATACTTGGTGTGAAT |
~200-350 |
物种级分辨率 |
|
ITS2-R |
GACGCTTCTCCAGACTACAAT |
3.2 参考数据库
|
数据库名称 |
主要特点 |
适用平台/工具 |
|
PR2数据库 |
专注于原生生物的SSU rRNA序列,高度手动整理,支持环境进化枝定义 |
QIIME2、Mothur、Lotus |
|
SILVA数据库 |
包含完整SSU和LSU基因,覆盖细菌、古菌和真核生物 |
QIIME2、Mothur、ARB |
|
NCBI RefSeq |
TS序列最为丰富,适合ITS区域的物种分类 |
BLAST、 QIIME2 |
|
瘤胃纤毛虫数据库 |
专门针对瘤胃纤毛虫18S rRNA基因,涵盖23科53属100种 |
QIIME2 |
注:进行纤毛虫宏条形码数据分类学分配时,常用的参考数据库包括PR2数据库(原生生物RNA数据库)和SILVA数据库。PR2数据库专注于原生生物的18S rRNA序列,经过高度的人工整理和环境进化枝定义,也支持纤毛虫的分类分配。对于ITS区域的分析,NCBI ITS RefSeq数据库提供了最丰富的物种级分类参考,可支持更多物种的分类鉴定。近期的研究还构建了专门针对瘤胃纤毛虫的18S rRNA基因参考数据库,覆盖23科53属100种,适合在QIIME2等元分类学流程中使用。
4 实验流程
纤毛虫宏条形码的完整实验流程可分为样本采集与预处理、DNA提取、PCR扩增、NGS文库构建与测序、生物信息学分析五个步骤。
4.1样本采集与预处理
根据研究目标和纤毛虫栖息环境选择合适的采样方法:
- 水样:使用Niskin采水器或采样瓶采集,经53 μm或20 μm浮游生物网预过滤富集纤毛虫。
- 沉积物/土壤:使用无菌铲采集表层(0–5 cm)样品,低温保存运输。
- 生物膜/附生植物:刮取基质表面附着物,无菌水悬浮。
- 瘤胃内容物:通过瘤胃导管或屠宰场获取样品,立即冷冻或置于RNAlater中保存。
采样后应在冰上保存(4°C),尽快运回实验室进行DNA提取或–80°C保存。eDNA样品通常经过滤(0.22 μm或0.45 μm滤膜)富集微生物细胞和游离DNA。采样全过程中需设置阴性对照(如无菌水)以监测潜在的污染。
样品采集:根据研究目的,采集代表性环境样品(如2L水样、10g土壤)。使用无菌容器,避免交叉污染,每个样品独立采集。
DNA提取:使用商用试剂盒(如MolPure® Mag Plant DNA Kit(18529ES,植物通用DNA提取)或MolPure® Mag Soil/Stool DNA Kit(18526ES磁珠法土壤/粪便DNA提取试剂盒)),严格按照说明书提取总DNA,并测定DNA浓度和质量(OD260/280在1.8–2.0之间为佳)。
DNA浓度测定:使用qubit定量设备(单通道核酸定量仪80571ES、83509ES,96通道核酸定量仪80575ES、83652ES)搭配qubit试剂(12642ES)测定浓度。
注:对于具有坚硬外壁的纤毛虫或复杂环境样本,可能需要增加预处理步骤,如多次冻融(液氮速冻后37°C水浴解冻,重复3次)或珠磨研磨(1–3分钟,中速)以提高裂解效率。
4.2 目标片段富集:PCR扩增(注,不同测序平台,扩增引物会有差异)
设置PCR反应:50 μL PCR体系中包括以下成分:
|
组分 |
体积(μL) |
终浓度 |
|
模板DNA |
1 ng -200 ng |
- |
|
正向引物(10 μM)* |
1 |
0.1 μM-0.5 μM |
|
2×Multiplex Long PCR Master Mix(17228ES) |
25 |
|
|
反向引物(10 μM)* |
1 |
|
|
无菌超纯水 |
up to 50 |
- |
配置好以上体系后,在PCR仪中设置以下PCR程序:
|
循环步骤 |
温度(℃) |
时间 |
循环数 |
|
热盖 |
105℃ |
On |
- |
|
预变性 |
98℃ |
30 sec |
1 |
|
变性 |
98℃ |
|
30-35(根据实验要求) |
|
退火 |
60℃* |
5 sec |
|
|
退火延伸 |
5~10 sec/Kb |
||
|
终延伸 |
72℃ |
2 min |
1 |
|
暂存 |
4℃ |
- |
- |
4.3 扩增产物0.9×纯化
1) 准备工作:将Hieff NGS® DNA Selection Beads(12601ES)磁珠由冰箱中取出,室温平衡至少30 min,配制80%乙醇。
2) 涡旋振荡或充分颠倒磁珠以保证充分混匀。
3) 吸取 45 μL Hieff NGS® DNA Selection Beads(0.9×,Beads:DNA=0.9:1)至一轮PCR产物中,室温孵育5 min。
4) 将 PCR 管短暂离心并置于磁力架中分离磁珠和液体,待溶液澄清后(约 5 min),小心移除上清。
5) 保持PCR管始终置于磁力架中,加入200 μL新鲜配制的80%乙醇漂洗磁珠,室温孵育 30 sec后,小心移除上清。
6) 重复步骤5,总计漂洗两次。
7) 保持PCR管始终置于磁力架中,开盖空气干燥磁珠至刚刚出现龟裂(不超过5min)。
8) 直接加入11 μL ddH2O,将PCR 管从磁力架中取出,涡旋振荡或使用移液器轻轻吹打至充分混匀,室温静置5 min。进入下一步反应。
4.4 电泳检测:取1 μL PCR产物进行2%琼脂糖凝胶电泳(10208ES),确认目标条带明亮清晰,无非特异性扩增。
4.5.1 选择二代测序时:二次PCR(添加样品标签与测序接头)
二次PCR加标签:以纯化后的一次PCR产物为模板,使用带Illumina或者MGI接头的引物进行二次PCR扩增(13344ES),为每个样品添加独特的index标签,以便混合测序后区分不同样品。
纯化二次PCR产物:再次使用磁珠法纯化加标签后的文库产物(12601ES)。
4.5.2 选择三代测序时:直接搭配通用建库试剂即可完成三代文库构建(13306ES)。
建库完成后,对文库进行纯化以便后续上机测序(12601ES)。。
4.6 文库定量、混合与测序
浓度检测:使用qubit定量设备(单通道核酸定量仪80571ES、83509ES,96通道核酸定量仪80575ES、83652ES)搭配qubit试剂(12642ES)测定浓度。
等摩尔混合:将所有样品文库按等摩尔浓度混合,形成最终的测序pool。
高通量测序:将混合文库送检至NGS平台,常用平台包括Illumina NovaSeq、MGI T7或ONT、Cyclone等测序仪。
4.7 生物信息学分析
5 技术与局限性
尽管宏条形码技术在纤毛虫多样性研究中显示出强大优势,但仍存在诸多局限和偏差来源:
- 数据库不完整性:许多纤毛虫物种(尤其是热带和咸水/半咸水生境物种)在公共数据库中缺乏参考序列。一项研究中,超过三分之一(35.3%)的纤毛虫MOTU与NCBI现有序列的相似度低于97%,提示这些MOTU可能代表尚未被描述或收录的新物种。
- PCR扩增偏好:不同引物对不同纤毛虫类群的扩增效率存在差异,可能导致某些类群被低估或高估。
- 分子拷贝数变异:纤毛虫细胞中SSU rDNA的拷贝数在不同类群间差异显著,可影响物种丰度的定量准确性。
- 定量能力的限制:基于序列读数的相对丰度并不一定准确反映群落中实际物种的生物量。由于细胞大小、rDNA拷贝数和PCR偏好等因素的差异,宏条形码数据的丰度分布与实际形态型丰度存在显著偏离。
- 分辨率不足:18S rRNA基因V4区和V9区的保守性较高,在属或科水平上分辨能力较好,但在物种水平上分辨率有限。
6 总结与展望
该方法凭借高通量、快速的特性,已成为现代纤毛虫生态学和生物多样性研究的核心工具。选择适当的分子标记、优化的实验方案和标准的生物信息学流程,可显著提高从纤毛虫群落的效率和准确性。未来随着长读长测序技术(如Oxford Nanopore、PacBio)和第三方测序平台的不断成熟,以及参考数据库的持续完善,宏条形码将进一步提升其在纤毛虫隐存种发现、群落物种组成精细化解析和环境DNA/RNA联合监测中的应用潜力。
在实践应用中,建议将宏条形码方法与形态分类学方法整合使用:形态学方法提供物种定性鉴定和生态功能推断,分子方法揭示隐存多样性和群落结构全貌,两者相辅相成,可以更全面地理解和描述纤毛虫多样性。
7. 产品推荐
|
实验步骤 |
产品名称 |
产品货号 |
|
DNA提取 |
MolPure® Mag Plant DNA Kit |
|
|
MolPure® Mag Soil/Stool DNA Kit磁珠法土壤/粪便DNA提取试剂盒 |
||
|
COI扩增 |
Hieff NGS® Multiplex Long PCR Master Mix/ 长片段多重扩增酶 |
|
|
二代建库 |
2× Ultima HF Amplification Mix |
|
|
Illumina平台接头 |
||
|
MGI平台接头 |
||
|
三代建库 |
Hieff® LongSeq Amplicon End repair and Ligation Module |
13306ES |
|
纯化磁珠 |
Hieff NGS® DNA Selection Beads |
|
|
Qubit定量 |
1× dsDNA HS Assay Kit |





