Published at 2021-04-20 18:49
Author:maorf
View:2453
第三代测序技术以单分子测序为特点已在基因组学研究中发挥重要作用。它在纳米级的反应空间内对DNA进行单分子水平的边合成边测序。该方法有着更快的数据读取速度,测序读长可达到20 kb,不需要PCR扩增,简化了测序的步骤,降低了测序成本,提高了测序通量和数据产出。单分子测序通过检测原始状态的样本获取了直接真实的遗传信息,实现了RNA和核酸修饰的直接测序。第三代测序技术以其无与伦比的优势取得了越来越多的关注和应用,而Nanopore则是英国牛津纳米孔公司采用电泳技术,借助电泳驱动单个分子逐一通过纳米孔来实现测序的第三代测序技术。
如下图所示,Nanopore测序可分为以下过程。
Nanopore测序仪种类很多,都是基于Nanopore芯片来搭建的平台,大的有多个芯片阵列组成的,如PromethION,GridION系列测序仪,小的有可以连接手机的Type C,电脑USB的MinION系列便携式测序仪。
MinlON是Nanopore推出的第一款测序仪产品,也是目前该公司测序平台中最成熟和广泛的一款。MinION是一款手持测序仪,能够提供实时的、长读长的测序数据。体积小到可以放到口袋里。带有512个有效通道,数据量高达30Gb,USB驱动在广泛的应用领域帮助研究者快速研究生物学,是适合很多实验室的入门选择。
GridION可运行5张MinION芯片或Flongle芯片,GridION有多达2560个有效通道进行测序。可以理解为5个MiniION在加一台高性能服务器,内置一些软件。适合做大型基因组相关分析。
PromethION是一款灵活、高产量的台式测序仪,适合大型项目和高通量实验室。可以同时或单独运行多达24个或48个测序芯片,根据需求可提供高达Tb级别的长读长测序数据。集成的高性能计算能力可实时进行碱基识别和后续分析,以便快速获得结果。单张测序芯片内部最高通量220Gb,用户手中最高通量180Gb。现通过PromethION开展的大型项目如: 人类X染色体、100天测序100个番茄基因组、10万人的结构变异分析。
Flongle是MinION和GridION的转换器,Flongle芯片可以随时随地进行快速、小型的测试。单张芯片数据产出为1.8G。Flongle设计适用于较小或者较频繁的测试及实验的快速和经济的测序系统。其可应用于微生物测序或者肿瘤panel数据,带有126个通道的测序芯片。
MinION Mk1C测序设备整合高性能计算和高分辨率屏幕,是MinIon与MinIT的结合产品,可连接Sim卡和蓝牙,适合野外微生物快速鉴定
SmidgION是目前为止体积最小的测序设备,具有与MinION 和 PromethION相同的纳米孔传感技术,可在任何地点与智能手机配套使用。
在纳米孔测序中,读长长度可以等于输入片段长度。读长长度不受限于测序设备,可以通过所使用的文库制备实验方案来控制片段长度。长读长提供了明确的方法来比对和匹配DNA或RNA序列,提供高质量、更完整、更连续的基因组组装。
纳米孔技术基于电学原理,允许直接测序原始DNA和RNA。不需要通过DNA拷贝、进行链合成或使用亚硝酸盐进行转化,节省了时间和成本,碱基修饰的信息也被完整保留,且包含在测序运行产生的原始信号中,可随时进行分析。因为纳米孔技术支持无需PCR的直接测序,因此没有了扩增偏好性,且文库制备工作流程也更简单。
纳米孔技术提供了动态、实时的测序,可在较短时间内获得病原体鉴定等时间关键性应用的检测结果。测序时,DNA快速通过纳米孔,DNA片段通过纳米孔的速率从每秒35个碱基提升到了每秒450个碱基。每一个在阵列上完成的读长,在数秒后就能用来开始数据分析。因此可以在测序早期了解样本的质量和状态,也可以在获得足够的数据后停止测序。
在纳米孔测序中,可以自行掌握测序时间、地点、以及需要使用的芯片数量。例如,可以单次使用的最小型的测序芯片Flongle适合快速质量检测、小型基因组实验和靶向测序。便携式测序仪MinION,重量不足100g,携带方便,可携带至任何地方测序。台式测序仪GridION和PromethION分别具有5个和24或者48个测序芯片,每个芯片可以独立运行,也可以同时使用,并结合实时的数据传送,因此可以根据样本的数量选择芯片数量,随数据量要求随时启动和停止实验。
传统的高通量测序价格昂贵,而纳米孔测序目前启动套装只需要17271元,包括MinION测序仪,两张测序芯片,一盒建库试剂盒,一盒清洗试剂盒。两张芯片最多可以测序60G数据。
Oxford Nanopore测序设备都使用同样的核心技术,可以根据应用测试实验来扩大或缩小规模。从最小型的Flongle和掌上MinION,到桌面型的GridION和PromethION。这些设备都可用于进行按需测序实验。用于纳米孔测序的DNA或RNA建库过程变的简单直接,最快的建库方法只需5~10分钟即可。
Nanopore测序错误率目前相对较高,且是随机错误,而不是聚集在读取的两端。
Nanopore测序数据错误率主要有三种类型,一种是单碱基替换(Substitution),另外两种为插入错误(Insertion)和缺失错误(Deletion)。其中插入错误和缺失错误占到了75%~80%,当碰到同聚物时,插入错误和缺失错误的概率还会增加。这些错误可通过序列一致性进行矫正,矫正后准确率可达99.9%~99.99%,若使用二代数据纠错,准确率会更高。
Nanopore测序输出的结果文件为fast5格式,为原始电信号文件,以.fast5为文件结尾。此文件中既有测序得到的序列信息,还有甲基化修饰信息。fast5其实是hdf5文件格式的一种变种,而HDF (Hierarchical Data Format) 是一种设计用于存储和组织大量数据的文件格式,一般扩展名为.hdf5或.h5。fast5里面可以包含很多的内容,并且可以继续添加。这种文件可理解为类似于一个经过压缩的文件夹,里面包含很多文件,如下图所示。查看fast5格式文件可使用HDFView软件。
优点:fasta5格式文件包含所有的信息,内容非常全。
缺点:fasta5格式文件占用空间过大。
通过Nanopore官方提供的软件ont_fast5_api可以对fast5格式文件进行拆分与合并操作。
软件的安装
#使用pip安装
pip install ont-fast5-api
#源码编译安装
git clone https://github.com/nanoporetech/ont_fast5_api
cd ont_fast5_api
python3 setup.py install
软件的使用
#多个文件合并为一个文件
single_to_multi_fast5 -i fast5_files/ -s multi -n 4000 --recursive
#一个文件拆分为多个文件
multi_to_single_fast5 -i multi/ -s single --recursive -t 6
图片摘自:Nanopore官网、NSF Neon