PBR基因变异检测实操：40分钟极速搞定，错误率直降25.5%！

各位跨境战友、业界同仁，大家好！在咱们追求海外市场，深挖技术红利的过程中，前沿科技的应用往往能帮我们打开新局面。今天，新媒网跨境就和大家聊一个在生物基因分析领域颇有分量的“利器”——NVIDIA Parabricks。它在基因变异检测方面又有了新突破，值得我们关注。

大家都知道，NVIDIA Parabricks 这套可扩展的基因组学软件套件，一直以来都是数据科学家和生物信息学专家的好帮手。它通过GPU加速，让很多开源工具运行得更快、更准，帮助科研人员更迅速地发现生物奥秘。最近，Parabricks 发布了 v4.6 版本，这次升级，核心亮点就是对谷歌 DeepVariant 和 DeepSomatic 1.9 的大力支持，尤其引入了 DeepVariant 的“泛基因组感知模式”（pangenome-aware mode）。简单来说，这个模式能更好地处理不同人群的基因多样性，让变异检测的准确性更上一层楼。

这次更新，主要带来了几个让人眼前一亮的新功能和优化：

DeepVariant 和 DeepSomatic 1.9 全面支持： 尤其是 DeepVariant 的泛基因组感知模式，它能有效提升跨基因变异和多样化人群的检测准确性。
DeepSomatic 增强： 现在它也能支持长读长测序数据和全外显子组测序（WES）分析了，应用场景更广。
STAR 工具优化： 引入了 quantMode 中的 GeneCounts 选项。
STAR 运行速度飞升： 在两块 NVIDIA RTX PRO 6000 GPU 上，相比纯 CPU 方案，速度提升了近 8 倍。
Mutectcaller 参数拓展： 新增了包括线粒体模式在内的更多参数，让分析更精细。

变异检测，这可是基因组分析里最关键的一步。它就像在海量的基因数据中，找出个体（或群体）与参考基因组之间的那些细微却重要的差异。理解了这些基因差异，科学家们就能更好地理解疾病的发生机制，并探索潜在的治疗方案。市面上有很多变异检测工具，比如美国博德研究所（Broad Institute）GATK 套件里的 HaplotypeCaller 和 Mutect2，它们都是行业标准。而基于深度学习的变异检测工具，近些年也异军突起，变得越来越普及。
基因双螺旋近景图

谷歌（Google）开发的 DeepVariant 和 DeepSomatic，就是深度学习在变异识别上的杰出应用。对于种系数据（也就是遗传自父母的基因），DeepVariant 能精确识别出遗传变异。而 DeepSomatic 则专注于体细胞变异，比如那些非遗传性的突变，在肿瘤细胞研究中尤为关键。

提升变异检测的准确性，这事儿太重要了，尤其是在考虑人类基因多样性的时候。外媒了解到，根据一份最新研究报告显示，与基于线性参考的 DeepVariant 相比，泛基因组感知的 DeepVariant 在各种设置下，错误率最高能降低 25.5%。

正如谷歌研究部门的产品负责人安德鲁·卡罗尔（Andrew Carroll）所说：“考虑到基因多样性，对于准确的基因组分析至关重要，尤其是在不同人群之间。新的泛基因组方法能提供更全面的基因变异图谱，从而指导分析。我很高兴 Parabricks v4.6 能支持泛基因组感知的 DeepVariant v1.9，它将 Parabricks 令人惊叹的速度与 DeepVariant 在变异检测过程中直接使用泛基因组信息的新能力结合在了一起。” 这位来自美国的专家，对这种融合表现出了极大的热情。

结合 Giraffe 和 DeepVariant v1.9，准确性再上台阶

传统的线性参考基因组，比如人类基因组参考联盟的 GRCh38 版本，通常是基于少数几个个体的DNA构建的。它们为基因组研究提供了一个统一的坐标系统，但却未能完全捕捉到广泛人群中存在的基因变异全貌。这就导致一些重要的亚群多样性被低估，可能在后续的分析中引入偏差，比如读取比对（read mapping）和变异检测时，就可能错过或错误解读与祖源或疾病相关的重要基因差异。

而泛基因组（pangenome）则不同了。它通过整合来自不同个体的多个高质量基因组来构建，从而捕捉到更广泛的人群基因变异。这种全面的方法能有效减少参考偏差，提高跨人群的变异检测能力，最终支持更准确、更公平的基因组分析。

美国加州大学圣克鲁斯分校（University of California, Santa Cruz）的科研人员开发了一款名为 Giraffe 的软件工具，它能高效地将测序片段比对到泛基因组图谱上。Giraffe 的作用，就是把基因组序列映射到泛基因组参考上，而不是传统的线性参考，这大大提高了不同人群变异检测的准确性。

现在，Parabricks v4.6 已经将 Giraffe 和 DeepVariant 的泛基因组感知模式结合起来了。新媒网跨境了解到，这一组合不仅提高了识别变异的准确性，还充分利用了 Parabricks 的 GPU 加速优势。

准确性数据： 开放源代码的泛基因组感知 DeepVariant 比传统 BWA 更准确，其 F1 分数表现如下（数据来源于《泛基因组感知 DeepVariant》）：
泛基因组感知 DeepVariant：SNP：0.9981 | Indel 0.9971
BWA：SNP：0.9973 | Indel：0.9968

速度表现： 在 Parabricks 的 GPU 加速下，Giraffe 和 DeepVariant 的运行时间，比纯 CPU 方案（使用泛基因组感知模式的 Giraffe 和 DeepVariant）快了 14 倍以上，这在四块 NVIDIA RTX PRO 6000 GPU 上得到了验证。
泛基因组感知DeepVariant 1.9 和 Giraffe 总运行时间在4块NVIDIA RTX PRO 6000 GPU上加速超过14倍。

图1. 使用四块 NVIDIA RTX PRO 6000 GPU，泛基因组感知 DeepVariant 1.9 和 Giraffe 的总运行时间从纯 CPU 方案的超过 9 小时，缩短到 40 分钟以内。

来自罗氏（Roche）计算科学副总裁约翰·曼尼翁（John Mannion）表示：“罗氏的 SBX 技术能够以无与伦比的数据速率进行测序，并为不同的测序应用提供灵活的数据处理工作流程。通过与 NVIDIA 的合作，我们计划利用多个比对器的 GPU 加速版本，包括 Giraffe，为用户提供一个集成解决方案，从而实现更快、更准确的分析。” 这位来自瑞士公司的专家，对双方合作的潜力充满期待。

快速上手 Giraffe 和 DeepVariant

如果你已经是 Parabricks 的老用户，那么运行 DeepVariant 就更轻松了。你需要先准备好从 Giraffe 索引文件得到的 FASTA 参考文件、一个 BAM 文件，以及运行 Giraffe 后输出的 graph GPZ 文件。具体如何获取这些文件，在 Parabricks Giraffe 的官方文档中都有详细说明，特别是在“使用 Giraffe 进行变异检测工作流程”这一部分。

下面，新媒网跨境手把手教你如何操作：

第一步：生成 FASTA 文件（一次性操作）
这一步是用 vg 工具从图谱中提取序列，生成一个 FASTA 文件。记住，这一步通常只需要运行一次。一旦你得到了这个 FASTA 文件，以后再处理新的 FASTQ 样本时，就直接跳过这一步，从第二步开始。
```
# 提取与路径列表对应的序列到FASTA文件
docker run --rm --volume $(pwd):/workdir \
--workdir /workdir \
quay.io/vgteam/vg:v1.59.0 \
vg paths -x hprc-v1.1-mc-grch38.gbz -p hprc-v1.1-mc-grch38.paths.sub -F > hprc-v1.1-mc-grch38.fa
# 索引FASTA文件
samtools faidx hprc-v1.1-mc-grch38.fa
```
这里，我们首先用 vg paths 命令，根据一个基因组图谱文件（.gbz）和路径子集文件（.paths.sub），生成一个包含参考序列的 FASTA 文件。然后，使用 samtools faidx 对这个 FASTA 文件进行索引，这是很多下游工具（包括 DeepVariant）的必要准备。
第二步：运行 Giraffe 进行比对
接下来，就是运行 Giraffe，将你的测序数据（FASTQ 文件）比对到泛基因组参考上，生成 BAM 文件。这个命令假设所有输入输出文件都在当前工作目录。
```
# 此命令假定所有输入都在当前工作目录，所有输出都到同一个地方。
docker run --rm --gpus all --volume $(pwd):/workdir --volume $(pwd):/outputdir \
--workdir /workdir \
nvcr.io/nvidia/clara/clara-parabricks:4.6.0-1 \
pbrun giraffe --read-group "sample_rg1" \
--sample "sample-name" --read-group-library "library" \
--read-group-platform "platform" --read-group-pu "pu" \
--dist-name /workdir/hprc-v1.1-mc-grch38.dist \
--minimizer-name /workdir/hprc-v1.1-mc-grch38.min \
--gbz-name /workdir/hprc-v1.1-mc-grch38.gbz \
--ref-paths /workdir/hprc-v1.1-mc-grch38.paths.sub \
--in-fq /workdir/${INPUT_FASTQ_1} /workdir/${INPUT_FASTQ_2} \
--out-bam /outputdir/${OUTPUT_BAM}
```
这里 docker run 命令指定了使用所有可用的 GPU (--gpus all)，并将当前目录挂载到容器内部的工作目录和输出目录。pbrun giraffe 是 Parabricks 调用 Giraffe 的命令，后面跟着一系列参数，包括样本信息（--read-group, --sample 等）、泛基因组索引文件（--dist-name, --minimizer-name, --gbz-name, --ref-paths），以及输入的 FASTQ 测序文件（--in-fq）和输出的 BAM 比对文件（--out-bam）。记得把 ${INPUT_FASTQ_1}, ${INPUT_FASTQ_2} 和 ${OUTPUT_BAM} 替换成你的实际文件名。
第三步：使用 DeepVariant 进行变异检测
最后，你就可以把第二步得到的 BAM 文件、第一步生成的 FASTA 文件，以及泛基因组的 GPZ 文件，作为输入，运行 DeepVariant 进行变异检测了。
```
# Pangenome_aware_deepvariant
# 此命令假定所有输入都在当前工作目录，所有输出都到同一个地方。
docker run --rm --gpus all --volume $(pwd):/workdir --volume $(pwd):/outputdir \
--workdir /workdir \
nvcr.io/nvidia/clara/clara-parabricks:4.6.0-1 \
pbrun pangenome_aware_deepvariant \
--ref /workdir/hprc-v1.1-mc-grch38.fa \
--pangenome /workdir/hprc-v1.1-mc-grch38.gbz \
--in-bam /workdir/${INPUT_BAM} \
--out-variants /outputdir/${OUTPUT_VCF}
```
同样是 docker run 命令启动 Parabricks 容器。pbrun pangenome_aware_deepvariant 命令后面跟着的参数包括参考 FASTA 文件（--ref）、泛基因组图谱文件（--pangenome）、输入的比对 BAM 文件（--in-bam），以及最终输出的变异结果 VCF 文件（--out-variants）。别忘了把 ${INPUT_BAM} 和 ${OUTPUT_VCF} 替换成你的实际文件名。

STAR 工具再升级：新增 `quantMode GeneCounts` 功能

除了 DeepVariant 的泛基因组感知模式，Parabricks 最新版本还对 STAR 工具进行了改进。STAR 是一个用于加速 RNA 测序比对的工具，以其在不同测序平台上的速度和准确性而闻名，尤其适合处理大型数据集。

Parabricks 中原有的 STAR 工具，在 GPU 加速下，运行速度已经非常快了。现在，在两块 NVIDIA RTX PRO 6000 GPU 上，它的运行速度比纯 CPU 方案提升了近 8 倍。

而在最新版本中，STAR 新增了一个非常实用的选项：quantMode GeneCounts。这个功能在比对过程中，能够快速生成基因水平的读取计数，对于基因表达分析、质量控制（QC）、数据标准化以及数据整合等多种应用都非常有价值。
STAR运行时间在2块RTX PRO 6000 GPU上加速近8倍，相比纯CPU方案。

图2. 相比纯 CPU 方案需要超过 105 分钟，STAR 在两块 NVIDIA RTX PRO 6000 GPU 上的运行时间缩短到了 14 分钟以内。

想开始使用 STAR 的 QuantMode GeneCounts 吗？很简单，只需要在运行 STAR 时，把它作为一个参数添加进去就行。下面是一个示例命令：

docker run --rm --gpus all --volume $(pwd):/workdir --volume $(pwd):/outputdir \
--workdir /workdir \
nvcr.io/nvidia/clara/clara-parabricks:4.6.0-1 \
pbrun rna_fq2bam \
--genome-lib-dir ${GENOME_DIR} \
--in-fq ${FASTQ1} ${FASTQ2} \
--output-dir ${OUT_DIR} \
--ref ${GENOME} \
--out-bam ${OUT_BAM} \
--num-gpus ${GPU_NUM} \
--quantMode GeneCounts

在这个命令中，除了指定基因组库目录、输入 FASTQ 文件、输出目录、参考基因组、输出 BAM 文件和 GPU 数量等常规参数外，我们只需在最后加上 --quantMode GeneCounts，就能开启这个快速生成基因水平读取计数的功能了。别忘了将 ${GENOME_DIR} 等变量替换为你的实际路径和文件名。

风险前瞻与时效提醒

各位伙伴，虽然这些技术进步让人振奋，但在实际操作中，我们也要保持清醒的头脑，注意潜在的风险。

首先是数据合规性。基因组数据是高度敏感的个人信息，涉及数据隐私和伦理问题。在跨境合作或数据处理时，务必严格遵守所在国家和地区的数据保护法规（如欧盟的 GDPR、中国的《个人信息保护法》等）。确保数据传输、存储和使用的合法性、安全性，避免任何合规风险。

其次是操作严谨性。基因组分析的结果往往直接影响科研判断甚至临床决策。所以，在运行这些工具时，每一步都需要细致入微，参数设置、文件路径等都不能有丝毫差错。一旦出错，可能导致分析结果偏差，甚至产生严重后果。建议在正式分析前，先用小样本数据进行测试和验证。

最后是教程时效性。大家要知道，软件技术更新迭代是非常快的，尤其是像 NVIDIA Parabricks 这样的前沿工具。本文基于 Parabricks v4.6 版本进行讲解，并假设当前时间为 2025 年。未来新的版本可能会有新的功能、参数调整甚至命令修改。因此，当你实际使用时，务必前往 NVIDIA 官方网站或开发者论坛，查阅最新版本的用户手册和文档，确保你使用的教程和工具是同步的。持续学习、紧跟技术前沿，是我们跨境人必备的素养！

想要深入了解 GPU 加速的基因组分析，并立即体验 NVIDIA Parabricks v4.6 的强大功能，就赶紧下载吧！同时，也欢迎大家到 NVIDIA Parabricks 开发者论坛上，与全球的同行们一起交流学习。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/pbr-variant-detect-40min-fast-25-5-percent-err-red.html