外链论坛

 找回密码
 立即注册
搜索
查看: 8|回复: 3

地球微生物组计划介绍(EMP)

[复制链接]

2984

主题

330

回帖

9919万

积分

论坛元老

Rank: 8Rank: 8

积分
99199274
发表于 2024-10-3 08:50:58 | 显示全部楼层 |阅读模式

Introduction

The Earth Microbiome Project (EMP) 是一个旨在描述和解释地球上微生物多样性的国际性科学计划。这个项目的目的经过对地球各样环境中的微生物群落进行大规模的DNA测序和元数据采集,构建一个全世界微生物群落的参考数据库,以更好地理解和科研微生物的生态学、功能和进化。

1. 全世界科研 EMP 的目的是收集世界各地区别环境的微生物数据,包含土壤、水体、空气、植被、动物等。

2. DNA测序: 项目运用高通量的DNA测序技术,基本都是16S rRNA基因测序,以科研微生物的遗传信息。

3. 元数据采集:除了DNA数据,项目还关注采集样本的关联元数据,如环境要求、地理位置、季节等,以更好地理解微生物与环境之间的关系。

4. 开放数据: EMP 采用开放科学的理念,旨在使其数据对全世界专家社群开放,以促进更广泛的科研和合作。

5. 生态学和生物多样性: 经过科研微生物群落,该项目有助于揭示地球各个生态系统中微生物的生态学角色,并促进对生物多样性的更深入理解。

6. 技术和计算工具的发展: 除了数据的收集,该项目还致力于发展新的技术和计算工具,以更好地处理和分析大规模的微生物组学数据。

EMP 的工作针对咱们理解地球上微生物的分布、演变和功能,以及它们与生态系统健康的关系都拥有重要的道理

官方网址:https://earthmicrobiome.org/

首发成果

原文链接: https://www.nature.com/articles/nature24621 (Nature 2017 (1[1]))

重点介绍了微生物世界的重要性和多样性与对其基本结构的有限理解之间的对比。尽管近期DNA测序技术取得了重大发展,但缺乏标准化的科研办法一起的分析框架阻碍了科研之间的比较,从而妨碍了对地球微生物生命的全世界推断的发展。

科研经过对地球微生物计划中收集的微生物群落样本进行荟萃分析。经过协调的科研办法和新的分析办法尤其运用精确序列而不是聚类的操作归类单元咱们能够跨多个科研跟踪细菌和古菌核糖体RNA基因序列,并探索前所未有的规模下的多样性模式。结果是一个供给全世界背景的参考数据库,为将来的科研数据供给框架,并促进对地球微生物多样性的越来越完整的描述。

办法与结果

1.样品收集

EMP向全世界科学界征集环境样本和关联数据,跨越区别的环境,空间、时间和理学化学变量。 来自97个独立科研的27751个样本表率区别的环境类型(图a)、地理位置(图b)。所有样品进行了DNA提取和16S rRNA测序,并对细菌和古菌部分进行了分析。

2.DNA提取,PCR扩增,测序和序列预处理

• 运用 MO BIO PowerSoil DNA 提取试剂盒进行 DNA 提取。

• 采用 16S rRNA V4 区域的引物对(515F-806R)进行 PCR 扩增。

• 序列测定周期选取 Illumina HiSeq 或 MiSeq 测序平台。

• 利用 QIIME 1.9.1 脚本 split_libraries_fastq.py 对测序得到的数据进行拆分,运用默认参数进行质量掌控,并生成 FASTA 序列文件。

3.序列标记、OTU筛选以及群落分析办法

在这项科研中,思虑到与植物关联的样本和无宿主影响的样本中有三分之一以上的序列不可与现有的 rRNA 数据库匹配,科研采用了一种无需参考序列的办法,即Deblur。这种办法经过去除错误的序列并供给单核酸精度上的子操作单元(sOTU,sub-OTU),在文案中被叫作为“标记序列”(tag sequence)。因为初期 EMP 计划中的测序长度为90bp,为了进行跨时期的序列结果比较,科研将所有序列都截断至90bp,相应的结果显示了90bp、100bp 和150bp 等区别长度对科研结果的影响不大。

在与参考数据库(Greengenes 13.8 和 Silva 128)的全长序列进行比对时,运用了 VSEARCH 工具进行全局比对,并需求100%的类似性(类似此刻常用的ASV)。 针对90bp 的 Deblur 结果,每一个样本随机抽取了5000个观测到的序列,用于分析微生物群落的 alpha 多样性(observed_otus、shannon、chao1、faith_pd)和 beta 多样性(基于 UniFrac 距离矩阵,进行 PCoA 分析)。

针对16S rRNA 基因拷贝数的计算,运用了基于 PICRUSt 1.1.0 的命令行脚本“normalize_by_copy_number.py”,将每一个OTU的丰度除以相应推测出的16S rRNA基因的拷贝数。

针对 Deblur 90 bp 结果中的2000个样本,采用随机森林归类树的办法进行样本归类分析,将区别环境下的样本划分至相应的环境标签中。在这一办法运用了 R 语言下的 caret 和 randomForest 包。

为了确定 tag sequence 在多个环境样本中的分布程度,科研运用 SourceTracker 分析。在进行分析之前,对每一个样本的序列总数进行了稀释至1000。

1. 多样性模式与环境的关系

经过运用微生物环境的结构化归类变量 EMPO,科研分析了 EMP 目录中的多样性,包含观察到的标签序列数量(α多样性)、类群周转和嵌套性(β多样性)以及预测的基因组特性(生态策略)。

宿主相关是区分微生物群落的基本环境原因,而盐水群落和非盐水群落之间存在重点构成差异。环境原因对α和β多样性的影响显示环境类型和宿主物种对多样性贡献很强

监督设备学习结果表示按照群落构成就可将样本准确区分为动物关联、植物关联、含盐自由生活或非含盐自由生活,而对环境进行更仔细归类的准确度相对较高。源跟踪分析支持对环境类型的高度归类

另一,16S rRNA 基因的预测平均群落拷贝数 (ACN) 是区分宿主关联群落和自由生活群落中微生物群落的另一个指标。这个指标反映了区别环境之间的生态策略差异,尤其在动物宿主中与较高的全基因组 rRNA 操作子拷贝数关联

5.用更为精确的归类单元代替OTU。

准确序列使咱们能够以比传统OTU更精细的分辨率观察和分析微生物分布模式。

经过Shannon熵分析标签序列和更高的归类群,以测绘类群分布中的偏差,咱们能够更好地认识区别类群在各样环境中的分布模式。标签序列在环境中表现出很高的特异性,而更高的归类水平则在区别环境中分布更均匀。熵的分布表示了这一模式的广泛性。经过科研怎样随着系统生长距离的变化而变化,能够更准确地衡量类群对环境的特异性。结果表明,个体16S rRNA序列最好地捉捕了环境特异性,远小于定义微生物物种的典型阈值(16S rRNA基因的97%同一性)。EMP数据集拥有跟踪地球微生物群落中个体序列的能力。运用EMP的表率性子集,科研人员生成为了序列计数和分布表,包含区别环境(EMPO)和沿环境梯度(pH、温度、盐度和氧气)中的分布。从中生成的’EMP交易卡’可促进对数据集的探索,并明显了三个广泛或与环境关联的标签序列的分布模式。

EMP目录能够运用Redbiom软件查找拥有命令行和Web界面,以按照序列、归类或样本元数据查询样本,并导出所选样本数据和元数据。EMP协议生成的用户数据能够容易整合到该框架中。将来,针对相同基因组区域的区别办法测序的数据集的组合可能是能够接受的,但需要思虑办法学偏差。EMP目录的持续增长预计将在科研和工业中发挥功效,标签序列将用作环境指标,并表率培养、基因组测序和实验室科研目的另外,尽管这些工具和办法是为细菌和古细菌研发的,但能够扩展到生命的所有行业。为了增多EMP和类似项目的效用,我们必须持续改进元数据收集和整理、本体论、对多组学数据的支持以及对计算资源的拜访

微生物生态再也不需要OTU聚类,而是一个更为精确的归类单元。这般一来,序列的特异性更高,环境归类能够更细,使咱们能够在更精确的分辨率下观察和分析微生物分布模式。在该文案中,作者以shannon熵值为标准,分别对tag sequence和较高的物种归类区别环境中的分布进行分析。能够看出,新办法中的标记序列对环境拥有较高的特异性,分布偏向于一个或几个环境(低Shannon熵);相比之下,更高的物种归类学水平常常更均匀地分布在区别的环境(高Shannon熵,低特异性)(图a)。区别物种归类级别上的所有标记序列的熵的分布证实了这一观点(图b) 。为了精确衡量每一个归类单元对环境的差异,作者探究了熵随着生态系统距离的变化而变化的模式(图c)。

此刻的16S rRNA测序分析用的更加多的是ASV (amplicon sequence variant) (2[2]),符合运用准确序列这一倡议,能够参考 https://www.jianshu.com/p/f31581bbfb80。

结论:

EMP框架和全世界综合分析的价值超出了各个科研的贡献。然则因为数据重点是为了回答区别问题而收集的,而不是针对一个主题的元分析,因此呢结论应该小心对待,并能够做为将来假设导向科研的起点。

另外,有必要更均匀地覆盖地理和化学梯度,并运用更全面的元数据收集和整理工具来跟踪环境变化。

另一,未在本科研测绘的生物原因(例如动物、真菌、植物、病毒和真核微生物)在确定群落结构方面起着重要功效。这个可扩展的框架能够用来处理这些需要:填补生理化学空间中的空白、为微生物真核生物和病毒供给扩增子数据,以及进行全基因组和全代谢组分析。在当前学术和环境学家都认识到生物多样性和生态系统功能的重要性时,这般科研框架拥有重要道理

将来肯定会有基于鸟枪法测序和质谱的EMP(Earth Metagenome Project, Earth Metabolome Project),哈哈。

衍生成果

基于EMP供给的protocol与软件进行独立科研基于EMP数据进行荟萃分析的科研近些年有非常多这儿介绍几篇表率性的。

1. A macroecological theory of microbial biodiversity (3[3])

微生物是地球上最丰富、多样且功能重要的生物。在过去的十年中,微生物生态学家们产生了有史败兴最大的群落数据集。然而,这些数据很少被用来揭示广泛性和稀有性的类似定律的模式,检验生物多样性理论,探索微生物群落结构的统一解释。

经过对来自环境和宿主关联生态系统的>20,000个样本的全世界范围汇编,咱们测试了竞争理论预测微生物丰度和多样性-丰度缩放规律的能力。咱们显示,这些模式最好由随机过程的协同功效来解释,这些过程由对数正态动态所捕捉。咱们证明对数正态动态在丰度的各个尺度上都拥有预测能力,这是生物多样性理论所必需的。经过理解生态过程的乘性和随机性质,专家能够更好地认识地球上最大且最多样化的生态系统的结构和动态。

1. Standardized multi-omics of Earth’s microbiomes reveals microbial and metabolite diversity (4[4])

因为缺乏标准化办法全世界范围内比较区别栖息地类型对微生物群落结构和功能的科研面临重大挑战。本科研对地球微生物组项目收集的880个微生物群落样本进行了多组学分析,包含16S、18S和ITS扩增子数据、鸟枪测序数据,以及基于液相和气相色谱-质谱的非靶向代谢组数据。采用标准化的协议和数据处理办法描述微生物群落,重点关注微生物关联代谢物和微生物类群在区别环境中的关系和共现性。

结果创立了宏基因组和代谢组学数据的参考数据库,并供给了整合其他科研的框架,为跨越尺度探索多样性供给支持。经过验证“每种微生物和代谢物无处不在,但受到环境选取”的假设,证明了数据库的实用性。科研发掘代谢物的多样性与微生物群落和环境关联,并揭示了与特定栖息地关联的微生物群共存方式。另外,某些化学物质(如萜类化合物)在区分区别地球环境方面表现出色,为微生物和化学生态学供给深入见解,为宿主和环境的多组学微生物组科研供给基本办法

1. Earth microbial co-occurrence network reveals interconnection pattern across microbiomes (5[5])

背景:微生物相互功效塑造了微生物群落的结构和功能;在特定环境中,微生物共存网络已被广泛构建以探索这些繁杂系统,但它们在全球范围内跨各样环境中的互联模式仍未被探索。在这儿咱们从地球微生物组项目数据集的23,595个样本和12,646个精确序列变体中推断了一个微生物共存网络。

结果:这个非随机的无标度地球微生物共存网络包含8个归类学上区别的模块,与区别的环境相连接,拥有特定环境的微生物共存关系。从修剪成统一体积的数据集中推断出的亚网络的区别拓扑特征显示各样环境的微生物群落中存在区别的共存模式。海量专业边的存在突显了环境特异性共存关系是微生物群落中的重要特征。各样环境的微生物群落被聚类成两组,这两组重点由植物和动物表面的微生物群落连接。在大都数亚网络中,酸杆菌Gp2和Nisaea被识别为中心枢纽。负边的比例范围从土壤亚网络的1.9%到非盐性表面亚网络的48.9%,显示各样环境经历了区别强度的竞争或生态位分化。

结论:这项科研突显了各样环境中微生物群落之间的互联模式,并强调了从网络视角理解微生物群落的共存特征的重要性。

实质运用

首要应该找到咱们期盼运用的数据:

EMP 观测表、元数据以及其他数据和结果可从 Nature 论文的 Zenodo 存档 (https://zenodo.org/record/890000)、FTP 站点 (ftp://ftp.microbio.me/emp/release1)和 Qiita EMP 门户(https://qiita.ucsd.edu/emp/)获取。

FTP 站点上的内容包含

• 描述存储库的自述文件

• 描述映射文件和数据集子集的 Markdown 文件

• 选取最适合您分析的 BIOM 表的流程图

• EMP 样本类型本体 (EMPO) 文本文件

• 映射文件

• OTU 观测表

• OTU信息:序列和树

• OTU分布表

• 结果:α 和β 多样性

选取最适合您分析的 BIOM 表的流程图:

emp_studies.csv记录了所有97个科研的信息,包含科研文案,原始数据在EBI的编号,样本数量等等。

然则在寻找原始数据的时候发掘The soil microbiome influences grapevine-associated microbiota这个科研的数据找不到了(ERP006348),值得重视

metadata

metadata能够运用emp_qiime_mapping_release1_20170912.tsv文件,其中标准化地记录了27751的样本非常多的信息,运用的时候关键是这些列:

• #SampleID – unique identifier for sample

Ontology

• env_biome – ENVO biome

• env_feature – ENVO feature

• env_material – ENVO material

• envo_biome_0 – ENVO biome level 0

• envo_biome_1 – ENVO biome level 1

• envo_biome_2 – ENVO biome level 2

• envo_biome_3 – ENVO biome level 3

• envo_biome_4 – ENVO biome level 4

• envo_biome_5 – ENVO biome level 5

• empo_0 – EMPO level 0

• empo_1 – EMPO level 1

• empo_2 – EMPO level 2

• empo_3 – EMPO level 3

倘若要结合地理和环境原因分析,就加上这些列:

Geography

• collection_timestamp – date and time sample was collected

• country – country where sample was collected

• latitude_deg – latitude where sample was collected

• longitude_deg – longitude where sample was collected

• depth_m – depth in meters where sample was collected (blank if altitude is given)

• altitude_m – altitude in meters where sample was collected (blank if depth is given)

• elevation_m – elevation in meters where sample was collected

Environment

• temperature_deg_c – temperature of sample in degrees Celsius

• ph – pH of sample

• salinity_psu – salinity of sample in practical salinity units

• oxygen_mg_per_l – oxygen concentration of sample in mg/L

• phosphate_umol_per_l – phosphate concentration of sample in umol/L

• ammonium_umol_per_l – ammonium concentration of sample in umol/L

• nitrate_umol_per_l – nitrate concentration of sample in umol/L

• sulfate_umol_per_l – sulfate concentration of sample in umol/L

metadata记录的#sampleID应该是人工整理的结果,倘若咱们从原始数据分析会发掘咱们的样本名是EBI数据库里的编号如ERR1591463,因此要用上metadata的话就要找到ERR编号和metadata中的#sampleID的对应关系。

咱们要在EBI数据库中找到每一个科研的project,而后看read files里的信息,通常Run Accession和Sample Title对应的便是ERR编号和#sampleID。倘若Sample Title有问题的话,通常Run Alias中会包括#sampleID,因此有些需要自己手动map一下。

其他就能够运用16S的分析流程进一步看了。

References

1. L. R. Thompson, J. G. Sanders, D. McDonald, A. Amir, et al.A communal catalogue reveals Earth’s multiscale microbial diversity[6]Nature551, 457–463 (2017).

2. B. J. Callahan, P. J. McMurdie, S. P. Holmes, Exact sequence variants should replace operational taxonomic units in marker-gene data analysis[7]The ISME Journal11, 2639–2643 (2017).

3. W. R. Shoemaker, K. J. Locey, J. T. Lennon, A macroecological theory of microbial biodiversity[8]Nature Ecology & Evolution1, 1–6 (2017).

4. J. P. Shaffer, L.-F. Nothias, L. R. Thompson, J. G. Sanders, et al.Standardized multi-omics of Earth’s microbiomes reveals microbial and metabolite diversity[9]Nature Microbiology7, 2128–2150 (2022).

5. B. Ma, Y. Wang, S. Ye, S. Liu, et al.Earth microbial co-occurrence network reveals interconnection pattern across microbiomes[10]Microbiome8, 82 (2020).

关注公众号,获取最新推送

关注公众号 biollbug,获取最新推送。

引用链接

[1] 1

: #ref-thompsonCommunalCatalogueReveals2017

[2] 2

: #ref-callahanExactSequenceVariants2017

[3] 3

: #ref-shoemakerMacroecologicalTheoryMicrobial2017

[4] 4

: #ref-shafferStandardizedMultiomicsEarth2022

[5] 5

: #ref-maEarthMicrobialCooccurrence2020

[6] A communal catalogue reveals Earth’s multiscale microbial diversity: https://doi.org/10.1038/nature24621

[7] Exact sequence variants should replace operational taxonomic units in marker-gene data analysis: https://doi.org/10.1038/ismej.2017.119

[8] A macroecological theory of microbial biodiversity: https://doi.org/10.1038/s41559-017-0107

[9] Standardized multi-omics of Earth’s microbiomes reveals microbial and metabolite diversity: https://doi.org/10.1038/s41564-022-01266-x

[10] Earth microbial co-occurrence network reveals interconnection pattern across microbiomes: https://doi.org/10.1186/s40168-020-00857-2




上一篇:报表工具的动态数据源实现
下一篇:微前端学习笔记(4):从微前端到微模块之EMP与hel-micro办法探索
回复

使用道具 举报

3129

主题

3万

回帖

9996万

积分

论坛元老

Rank: 8Rank: 8

积分
99968654
发表于 2024-10-17 11:13:39 | 显示全部楼层
外链发布论坛学习网络优化SEO。
回复

使用道具 举报

3039

主题

3万

回帖

9606万

积分

论坛元老

Rank: 8Rank: 8

积分
96065878
发表于 2024-11-2 11:38:23 | 显示全部楼层
哈哈、笑死我了、太搞笑了吧等。
回复

使用道具 举报

3056

主题

3万

回帖

9913万

积分

论坛元老

Rank: 8Rank: 8

积分
99138998
发表于 2024-11-5 09:00:30 | 显示全部楼层
论坛的成果是显著的,但我们不能因为成绩而沾沾自喜。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|外链论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-11-20 19:33 , Processed in 0.111909 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.