
BriefingsinBioinformatics——[11.622]
①由于菌株的重要性,作者调查了20种关于细菌菌株基因组分析的工具;②在模拟和实验数据集上评估了六种工具,包括所有关于从头细菌菌株基因组重建的工具;③发现尽管一些工具可以很好地预测菌株的数量和丰度,但没有一个工具可以完全预测细菌菌株中的实际菌株变化;④细菌菌株基因组的未来重建可能会考虑在多个宏基因组样本中具有相似丰度的辅助基因和细菌菌株。
确定菌株水平的微生物组成至关重要,这项研究调查了20种计算工具,试图从鸟枪读长中推断出细菌菌株的基因组,并第一次讨论了这些工具背后的方法。作者还在相同数据集上系统地评估了六种新型菌株靶向工具,发现BHap、mixtureS和StrainFinder的性能优于其他工具,但由于最佳工具的性能仍然欠佳,作者讨论了可能解决这些限制的未来方向。(@刘永鑫-中科院-宏基因组)
【原文信息】
Computationalanalysesofbacterialstrainsfromshotgunreads
2022-02-08,doi:10.1093/bib/bbac013
Nature子刊:从大量宏基因组数据中对病毒基因组进行分箱NatureCommunications——[14.919]
①开发了一个基于重叠群分箱的框架(PHAMB),以直接从大量宏基因组数据中发现病毒基因组;②当应用于人类微生物组计划2(HMP2)数据集时,PHAMB从1024个病毒群中恢复了6077个高质量基因组,并确定了病毒-微生物宿主的相互作用;③与现有的病毒预测工具相比,它可以从任何数据集中以非常高的准确度(93-99%)对非噬菌体分箱进行分类;④PHAMB可以有利地应用于现有和未来的宏基因组,以用其他菌群成分阐明病毒生态动力学。
人类肠道病毒组及其与胃肠道细菌的相互作用目前尚不清楚,是由于缺乏全病毒组数据集以及当前识别宏基因组数据中病毒序列的方法存在局限性。在此,作者将基于深度学习的宏基因组分箱算法与配对的宏基因组和宏病毒组数据集相结合,开发了来自宏基因组分箱的噬菌体(PHAMB),这种方法允许直接从大量宏基因组数据中分箱数千个病毒基因组,同时能够将病毒基因组聚类成准确的病毒分类种群,PHAMB工作流程可在。(@刘永鑫-中科院-宏基因组)
【原文信息】
Genomebinningofviralentitiesfrombulkmetagenomicsdata
2022-02-18,doi:10.1038/s41-5
METABOLIC:对微生物基因组的功能特征、新陈代谢、生物地球化学和群落尺度功能网络进行高通量分析Microbiome——[14.65]
①微生物基因组在个体生物和群落尺度上的代谢功能谱对于了解生态系统过程是至关重要的,并且也是实现基于功能特征的生物地球化学建模的一个渠道;②作者介绍了一个工具:METABOLIC,可以基于微生物基因组或宏基因组组装基因组(MAGs)来分析单个微生物或者菌群的代谢功能网络;③METABOLIC促进了标准化,超越了目前的基因组/蛋白质注释平台框架,提供蛋白质注释和代谢途径分析。
作者展示了METABOLIC软件(微生物的代谢和生物地球化学分析),它以基于基因组的微生物代谢为基础,能够对菌群生态学和生物地球化学进行一致且可重复的研究,并将推动未培养的生物体整合到代谢和生物地球化学模型中。作者预计METABOLIC将使从宏基因组和基因组中更容易解释微生物代谢和生物地球化学,并使菌群研究在不同领域成为可能。METABOLIC是用Perl和R编写的,网址为。(@刘永鑫-中科院-宏基因组)
【原文信息】
METABOLIC:high-throughputprofilingofmicrobialgenomesforfunctionaltraits,metabolism,biogeochemistry,andcommunity-scalefunctionalnetworks
2022-02-16,doi:10.1186/s43-8
BarBIQ:菌群中单菌的高通量鉴定和定量的新方法NatureCommunications——[14.919]
①开发BarBIQ对单个细菌细胞进行分类群(cOTUs)鉴定并以高通量的方式对每个cOTU进行量化,该方法具有单碱基准确性;②用BarBIQ准确鉴定并量化来自小鼠粪便的3.4x10^5个细菌细胞的810个cOTUs,其结果高度可重复;③对比VA充足和VA缺乏的小鼠发现粪便菌群cOTUs丰度在肠道不同位置均有差异,且cOTUs在近端位置比远端位置差异更大;④以上现象无法用传统的基于16SrRNA基因的方法(ASV和OTUs)准确识别,说明基于细胞的BarBIQ更准确且全面。
BarBIQ(条形码细菌的鉴定和定量)方法基于具有单碱基精度的细胞条形码16SrRNA序列,将单个细菌细胞划分为分类群——本文命名为基于细胞的可操作分类单元(cOTU),并以高通量方式量化菌群中每个cOTU的细胞数。BarBIQ是一种被开发的高通量和准确的方法,在单细胞水平上定义了菌群,可用于与菌群相关的广泛研究领域。BarBIQ可以准确地可视化全体菌群和单个细菌成员,将有助于有效了解菌群的功能。(@刘永鑫-中科院-宏基因组)
【原文信息】
High-throughputidentificationandquantificationofsinglebacterialcellsinthemicrobiota
2022-02-22,doi:10.1038/s46-1
评测菌群数据无监督聚类方法的性能决定因素Microbiome——[14.65]
①本研究系统地比较了来自四项已发表研究对菌群观察结果进行聚类的方法;②尽管没有一种方法始终优于其他方法,但作者确定了某些方法可能表现不佳的关键场景;③BrayCurtis(BC)指标在高丰度OTUs相对稀少的数据集中导致聚类效果不佳,未加权的UniFrac(UU)指标在低丰度OTUs普遍存在的数据集上聚类效果不佳;④作者合理地结合了BC和UU来生成一个新的指标,其在所有数据集上都显示出高的性能。
本文系统地比较了菌群分析中常用的β多样性和聚类方法。作者将这些应用于四个已发布的数据集,其中可以在样本组之间看到高度不同的微生物组,以及在组之间分离不太清晰的临床数据集。作者表示没有现有的聚类方法可以在所有数据集中普遍表现最佳,并提出了BC(BrayCurtis)和UU(unweightedUniFrac)的组合指标,利用了这两个指标的互补优势。(@刘永鑫-中科院-宏基因组)
【原文信息】
Performancedeterminantsofunsupervisedclusteringmethodsformicrobiomedata
2022-02-05,doi:10.1186/s49-3
Nature子刊:利用蛋白语言模型可预测全部五种类型的信号肽NatureBiotechnology——[54.908]
①信号肽(SPs)控制着所有生物体的蛋白质分泌和易位,可从序列数据中推测其类型;②研究者编译了一个含5种信号肽的蛋白序列数据集,并根据SP类型定义了区域标记规则,同时采用三重嵌套交叉验证来训练和评估模型;③基于蛋白质语言模型(LMs),作者升级了SignalP,与5.0版本(只能推测3种,Sec/SPIII和Tat/SPII无法预测)相比可以预测全部5种信号肽类型;④6.0新版本可适用于宏基因组数据,能够准确预测未知起源和进化遥远的蛋白质序列。
信号肽(SPs)是控制所有生物体中蛋白质分泌和易位的短氨基酸序列,其可以从序列数据中被预测,但现有算法无法检测所有已知类型的SPs。本研究,作者介绍了,这是一种机器学习模型,可检测所有五种SP类型并适用于宏基因组数据。可在。(@刘永鑫-中科院-宏基因组)
【原文信息】
2022-01-03,doi:10.1038/s46-3
测序数据鉴别和去除rRNA序列利器RiboDetectorNucleicAcidsResearch——[16.971]
①RiboDetector是一款用于从宏基因组、宏转录组、ncRNA和核糖体测序数据中准确而快速地检测和去除rRNA序列的软件;②RiboDetector能抓取更长距离的序列特征,从而具有更好的准确性;③在测试数据上,RiboDetector比其他软件的错误预测率低6到2000倍;④RiboDetector有很好的泛化能力,能预测发现新的rRNA序列;⑤在测试数据上它的假阳性预测序列没有显著的对某些功能的偏向性。
rRNA序列污染是广泛存在于各类高通量测序数据中的。除了在实验建库过程中对文库进行去核糖体的处理,数据分析层面也可通过一些序列比对的策略去除。本研究中,作者基于深度学习算法开发了高效准确去除核糖体序列的工具-RiboDetector,其是基于深度学习的BiLSTM(一款双向的循环神经网络架构)开发的软件,其可以快速准确地识别转录组、宏基因组、宏转录组、非编码RNA和核糖体测序数据中的rRNA读长,RiboDetector可在。(@刘永鑫-中科院-宏基因组)
【原文信息】
RapidandaccurateidentificationofribosomalRNAsequencesviadeeplearning
2022-02-21,doi:10.1093/nar/gkac112
iMeta:刘洋彧等基于物种组合的深度学习方法预测菌群结构iMeta——[N/A]
①本研究提出了一个深度学习框架可以在菌群动力学未知的情况下仅从训练数据学习物种组合到菌群结构的映射;②作者使用由经典生态动力学模型生成的合成数据系统地验证了其框架;③该框架应用于体外和体内群落的真实数据,包括海洋和土壤菌群、黑腹果蝇肠道菌群,以及人类肠道和口腔菌群;④仅从一小部分训练样本便可准确地预测菌群的结构组成;⑤研究结果证明了深度学习可以帮助我们理解和操控复杂菌群。
复杂微生物群落的众多物种和未知的种群动力学一直是我们理解菌群结构变化(例如移除或添加物种)的根本障碍。推动这个领域向前发展可能需要失去一些解释机制的能力。从这个意义上说,深度学习方法可以使我们合理操控和预测复杂微生物群落的动态变化。哈佛医学院刘洋彧团队与合作者近期在iMeta发表研究,开发了一个深度学习框架来预测物种组合的群落组成,该框架不需要了解任何微生物动力学,并且各种数据的验证显示了其准确的预测能力。(@刘永鑫-中科院-宏基因组)
【原文信息】
Predictingmicrobiomecompositionsfromspeciesassemblagesthroughdeeplearningt
2022-03-01,doi:10.1002/
iMeta:陈同等开发高颜值高被引绘图网站imageGPiMeta——[N/A]
①ImageGP可以在线生成常见的线图、柱状图、散点图、箱线图、集合图、热图和直方图等;②用户只要粘贴数据矩阵,即可一键快速出图;③ImageGP还支持火山图、富集分析泡泡图、主成分分析类图等和4种微生物领域的功能预测和生物标志物鉴定分析,包括FAPROTAX,BugBase,PICRUSt和LEFSe;④在满足方便易用的同时,ImageGP也提供了灵活性,可以设置多种参数、调整样式,输出发表质量的图,提供脚本实现可重复分析和用户进一步修改。
2022年2月21日,iMeta期刊在线发表了中国中医科学院黄璐琦院士、陈同副研究员和中国科学院遗传与发育生物学研究所刘永鑫高级工程师合作题为“ImageGP:Aneasy-to-usedatavisualizationwebserverforscientificresearchers”的研究论文。该论文介绍了一款简单易用、功能强大的在线绘图工具ImageGP,访问地址是。(@刘永鑫-中科院-宏基因组)
【原文信息】
ImageGP:Aneasy-to-usedatavisualizationwebserverforscientificresearchers
2022-02-21,doi:10.1002/
的创作者:Yuice,刘永鑫-中科院-宏基因组,王玲玲,点点,Hairong
03-13|高脂饮食乱代谢、伤肝肠,吃啥可助改善?
03-12|复旦Cell子刊突破:“坏”菌群产物或助乳腺癌免疫治疗
03-11|欲护脑,先护肠!Nature子刊揭示菌群影响大脑衰老的新机制
03-10|“癌王”早筛新突破:粪便菌群助准确检测胰腺癌
03-09|分析1.3万中国人数据,浙大团队揭示“吃草”的学问
03-08|今日Cell:肠球菌如何毒害宿主细胞?发现关键毒素
03-07|于君等GUT:促肠癌、乱肠菌,一种关键脂代谢酶被锁定
03-06|人未老,脑先衰?Cell子刊2文聚焦“补脑”新知
03-05|46.8分综述详解:基于肠道菌群的疾病标志物
03-04|牛!王军等喜提NBT:用AI在肠道超高效“挖”抗菌肽
版权所有©Copyright © 2022-2030 汉缘网网站地图