生信器具分享|超仔细的cancerSEA数据库的运用教程
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">实用<span style="color: black;">研究</span><span style="color: black;">工具</span><span style="color: black;">举荐</span> 、详实生信软件教程分享、前沿创新组学<span style="color: black;">文案</span><span style="color: black;">诠释</span>、独家生信视频教程<span style="color: black;">颁布</span>,欢迎关注<span style="color: black;">微X</span>公众号:基迪奥生物 (gene-denovo)</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本文作者:Jusser</p>
<h2 style="color: black; text-align: left; margin-bottom: 10px;">背景</h2>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">人类癌症是一种高度多样化和<span style="color: black;">繁杂</span>的<span style="color: black;">疾患</span>,由<span style="color: black;">拥有</span>不同遗传、表观遗传和转录状态的癌细胞<span style="color: black;">构成</span>,形成异质功能的癌细胞群,这是癌症诊断和治疗的<span style="color: black;">重点</span><span style="color: black;">阻碍</span>。例如,<span style="color: black;">有些</span>癌细胞<span style="color: black;">拥有</span>高增殖活性,<span style="color: black;">有些</span><span style="color: black;">拥有</span>肿瘤侵袭性和转移能力,<span style="color: black;">有些</span>表现出干细胞样特性,而<span style="color: black;">有些</span>表现出“惰性”静止状态。这些功能异质的癌细胞在<span style="color: black;">全部</span>肿瘤进化过程中协同或竞争<span style="color: black;">功效</span>,<span style="color: black;">引起</span>不同的肿瘤表型。<span style="color: black;">因此呢</span>,全面、充分地<span style="color: black;">认识</span>癌细胞的功能状态至关<span style="color: black;">要紧</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">日前</span>,基于单细胞测序技术为探索<span style="color: black;">繁杂</span>的生态系统(尤其是癌症)开辟了新<span style="color: black;">办法</span>,彻底改变了<span style="color: black;">全部</span>生物学<span style="color: black;">科研</span>的方式。它为以单细胞分辨率破译癌细胞的功能状态<span style="color: black;">供给</span>了前所未有的机会,从而使<span style="color: black;">科研</span>人员能够准确<span style="color: black;">没</span>偏见地探索癌细胞的功能异质性,并加深对癌细胞<span style="color: black;">做为</span>功能单元执行特定生物学功能的理解。但<span style="color: black;">发掘</span>大部分<span style="color: black;">文案</span>都是专注于收集scRNA-seq数据集,<span style="color: black;">日前</span>仍缺乏一个专门用于破译癌症单细胞功能状态的数据库。<span style="color: black;">因此呢</span>,哈尔滨医科大学的肖云老师和他的团队<span style="color: black;">研发</span>了CancerSEA数据库,旨在全面解码癌细胞在单细胞水平上的不同功能状态。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">下面<span style="color: black;">博主</span>对该数据库的<span style="color: black;">运用</span>进行<span style="color: black;">仔细</span>介绍。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">cancerSEA数据库<span style="color: black;">拜访</span>链接:</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><a style="color: black;"><span style="color: black;"><span style="color: black;">home</span><span style="color: black;"><span style="color: black;"></span>biocc.hrbmu.edu.cn/CancerSEA/</span></span><span style="color: black;"><img src="https://pic1.zhimg.com/v2-8c0ab5e6f0cd587daf974d4f5e488fac_ipico.jpg" style="width: 50%; margin-bottom: 20px;"></span></a></div>
<h2 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">1、</span>内容丰富的cancerSEA数据库</h2>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">一进入数据库,映入眼帘的<span style="color: black;">便是</span>一丛花朵,花丛以血管<span style="color: black;">做为</span>枝干,间或分布有灰色的细胞。这14朵花对应的<span style="color: black;">便是</span>数据库<span style="color: black;">供给</span>了14种癌症<span style="color: black;">关联</span>功能状态(血管生成、细胞凋亡、细胞周期、细胞分化、DNA<span style="color: black;">损害</span>、DNA修复、EMT、细胞缺氧、炎症<span style="color: black;">出现</span>、癌细胞侵袭、转移、增殖、细胞静息、干细胞特性)。</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic4.zhimg.com/80/v2-15e8f6ff49b16ddf6ec95d86be223913_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图1 cancerSEA数据库首页<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">如今,该数据库收集了72个单细胞数据集,共计25种人类癌症的41,900个癌症单细胞,<span style="color: black;">供给</span>了这14种癌症<span style="color: black;">关联</span>功能状态在不同癌症的单细胞功能状态的图谱,并在单细胞水平上将这些功能状态与18,895条蛋白编码基因(PCGs)和15,571条lncRNA<span style="color: black;">相关</span>起来,以促进对癌症细胞功能差异的机制理解<a style="color: black;"></a>。</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic3.zhimg.com/80/v2-c3076defe8950a22e952e652efb6d53e_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图2 14种功能状态和数据库统计<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic1.zhimg.com/80/v2-4dc6a76565aac5f311f1251406c0b778_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图3 25种癌症中细胞数量的比例(图例为<span style="color: black;">各样</span>癌症名<span style="color: black;">叫作</span>缩写)<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">下面<span style="color: black;">博主</span>就<span style="color: black;">按照</span>cancerSEA数据库的<span style="color: black;">重点</span>功能区:Search、Download分别进行介绍。</p>
<h2 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">2、</span>Search功能</h2>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">搜索功能有3种方式:</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">第1</span>种,输入基因名<span style="color: black;">叫作</span>,该种方式<span style="color: black;">能够</span>在自己<span style="color: black;">科研</span>的项目中筛选出<span style="color: black;">有些</span>与癌症<span style="color: black;">关联</span>的基因,<span style="color: black;">此时</span><span style="color: black;">能够</span>输入一个基因ID来查看该基因的功能、基因在不同癌症中与14种状态的<span style="color: black;">关联</span>性、找到与关注的癌症<span style="color: black;">关联</span>的细胞状态;</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic1.zhimg.com/80/v2-efe11b3c4e572160c9b2399a9c662dcc_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图4 输入单个基因的搜索方式<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic1.zhimg.com/80/v2-4f89913ab376925632be5823a038f938_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">第二种,<span style="color: black;">选取</span>癌症类型和功能整体来<span style="color: black;">查找</span>特定癌症类型中与此状态<span style="color: black;">关联</span>的PCG/lncRNA,该种方式<span style="color: black;">能够</span>在数据分析之前,先<span style="color: black;">认识</span>与<span style="color: black;">科研</span>癌症的某细胞状态<span style="color: black;">关联</span>的基因和lncRNA有<span style="color: black;">那些</span>,在后续分析中<span style="color: black;">能够</span>重点关注<span style="color: black;">有些</span>基因(顺带一提,在首页的花瓣<span style="color: black;">亦</span><span style="color: black;">能够</span>直接点击对应的细胞状态进行<span style="color: black;">查找</span>);</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic2.zhimg.com/80/v2-56ddc72df9c8ae65183c2a5d30591561_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图5 <span style="color: black;">选取</span>癌症和状态的搜索方式<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">第三种是输入多基因<span style="color: black;">或</span><span style="color: black;">选取</span>GO/KEGG/MSigDB数据库的通路基因集,该方式<span style="color: black;">能够</span>在数据分析过程中<span style="color: black;">运用</span>,例如得到一个基因集后,<span style="color: black;">或</span>富集分析完成后,得到关注的重点通路,查看该基因集或通路在不同癌症中与14种状态的<span style="color: black;">关联</span>性;</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic3.zhimg.com/80/v2-882023d243ad762feba907ea1cb0a8da_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图6 输入基因集和通路的搜索方式<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这3种方式的<span style="color: black;">查找</span>结果<span style="color: black;">包括</span>4个部分,下面分别介绍:</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">第1</span>部分 <span style="color: black;">表示</span>基因的基本信息,<span style="color: black;">包含</span>基因symbol号、ensembl号、别名、<span style="color: black;">仔细</span>的基因功能,点击ID可直接<span style="color: black;">转</span>到相应的数据库,为<span style="color: black;">科研</span>基因功能<span style="color: black;">供给</span>思路。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">第二部分 <span style="color: black;">表示</span><span style="color: black;">查找</span>的基因在不同癌症中跨14个状态的<span style="color: black;">关联</span>性(图7)。<span style="color: black;">做为</span>一个总览图,它既<span style="color: black;">表现</span>了基因在同一种癌症中对不同状态的促进和<span style="color: black;">控制</span><span style="color: black;">功效</span>,又<span style="color: black;">表现</span>了基因在同种状态中对不同癌症的影响。例如,从该气泡图中<span style="color: black;">咱们</span><span style="color: black;">能够</span>看出这个基因对stemness在AST中是<span style="color: black;">显著</span>负<span style="color: black;">关联</span>的(即<span style="color: black;">控制</span><span style="color: black;">功效</span>),说明这个基因可能对星形胶质细胞瘤的复发起到<span style="color: black;">控制</span><span style="color: black;">功效</span>。</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic3.zhimg.com/80/v2-7fb1582ad9feca897b2354706a34418a_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图7 基因<span style="color: black;">关联</span>的细胞状态与不同癌症的<span style="color: black;">关联</span>性<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">第三部分<span style="color: black;">表示</span><span style="color: black;">查找</span>基因与某一癌症功能<span style="color: black;">关联</span>性。如图8所示,<span style="color: black;">能够</span><span style="color: black;">选取</span>某一癌症进行基因与癌症<span style="color: black;">关联</span>性的分析,热图<span style="color: black;">表示</span>该基因与14种细胞功能<span style="color: black;">关联</span>性。左下<span style="color: black;">表示</span>与输入基因有<span style="color: black;">明显</span><span style="color: black;">关联</span>性的功能状态被筛选出来,鼠标指到被筛选出的细胞状态峰值图时,右下角区域就会自动绘制散点图,<span style="color: black;">表示</span>P值和<span style="color: black;">关联</span>系数。相较于上一部分,这一部分的结果更为<span style="color: black;">精细</span>,将视野集中在单种肿瘤且<span style="color: black;">明显</span><span style="color: black;">关联</span>的细胞状态上。这个功能就<span style="color: black;">能够</span><span style="color: black;">选取</span>感兴趣的癌症进行<span style="color: black;">仔细</span>分析,筛选<span style="color: black;">查找</span>基因与<span style="color: black;">关联</span>性较高的细胞状态,为<span style="color: black;">咱们</span><span style="color: black;">科研</span>基因与细胞状态<span style="color: black;">供给</span>思路。</p>
<div style="color: black; text-align: left; margin-bottom: 10px;">
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic1.zhimg.com/v2-9f285d0c16bc5d89ed58d9517cbcecb8_b.jpg" style="width: 50%; margin-bottom: 20px;"></div>
</div>图8 某一癌症与基因的<span style="color: black;">关联</span>性分析结果<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">第四部分<span style="color: black;">表示</span>不同细胞亚群中的功能<span style="color: black;">关联</span>性。盒形图<span style="color: black;">表示</span>了用户<span style="color: black;">选取</span>的数据集细胞中基因或基因列表的表达分布<span style="color: black;">状况</span>。T-SNE<span style="color: black;">表示</span>基因在细胞的表达分布<span style="color: black;">状况</span>。从图9中<span style="color: black;">能够</span>看出,输入基因在大部分细胞中高表达,说明细胞有很强的肿瘤异质性,该部分让用户从全局<span style="color: black;">认识</span>基因在细胞中的表达水平<span style="color: black;">供给</span>方便。</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic2.zhimg.com/80/v2-e6495cfbad4fdc4d50f3144a289a6b41_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图9 盒形图和tsne图展示基因的表达<span style="color: black;">状况</span>
<h2 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">3、</span>Download功能</h2>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">CancerSEA中的所有数据都<span style="color: black;">能够</span>在“Download“中下载,<span style="color: black;">重点</span><span style="color: black;">包括</span><span style="color: black;">每一个</span>单细胞数据集的功能状态配置文件和PCG/lncRNA表达谱以及功能状态基因列表。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">下载癌症类型的表达量数据集,可对数据重新利用,<span style="color: black;">亦</span><span style="color: black;">能够</span>与自己项目数据比较,挖掘<span style="color: black;">更加多</span>有用信息。</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic1.zhimg.com/80/v2-ce9f744742c96e3c507c82880d6fac20_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图10 数据集细胞状态得分及PCG、lncRNA表达量下载<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">下载各细胞状态基因集,可预估自己的项目数据的各个细胞状态,可用GSVA和Seurat中的表达量权重评</p>
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic2.zhimg.com/80/v2-fc04c1e553da6b77ece4c08a00726191_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>图11 各细胞状态基因集下载<h2 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">4、</span>总结</h2>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">该数据库<span style="color: black;">重点</span>为癌症细胞异质性<span style="color: black;">科研</span><span style="color: black;">供给</span>方便,探索癌细胞在单细胞水平上的不同功能状态,<span style="color: black;">同期</span>只<span style="color: black;">必须</span><span style="color: black;">经过</span>点点点的方式就<span style="color: black;">能够</span><span style="color: black;">容易</span><span style="color: black;">得到</span>肿瘤细胞状态的<span style="color: black;">关联</span>信息,是不会代码者的福音。但<span style="color: black;">实质</span>应用中,<span style="color: black;">咱们</span><span style="color: black;">亦</span><span style="color: black;">能够</span><span style="color: black;">不仅</span>局限在癌细胞,还<span style="color: black;">能够</span>将细胞状态估计应用在单细胞正常组织的分析项目,<span style="color: black;">运用</span>这14种状态基因集去预估细胞状态,<span style="color: black;">或</span><span style="color: black;">亦</span><span style="color: black;">能够</span>自己整理数据集,进行细胞状态的预估,将预估的细胞状态与拟时分析结合,例如找到干细胞的分化轨迹等。</p>
<h2 style="color: black; text-align: left; margin-bottom: 10px;">参考</h2><a style="color: black;">^</a><span style="color: black;">Huating Yuan, Min Yan, Guanxiong Zhang, Wei Liu, Chunyu Deng, Gaoming Liao, Liwen Xu, Tao Luo, Haoteng Yan, Zhilin Long, Aiai Shi, Tingting Zhao, Yun Xiao, Xia Li, CancerSEA: a cancer single-cell state atlas, Nucleic Acids Research, Volume 47, Issue D1, 08 January 2019, Pages D900–D908.</span>
你的见解独到,让我受益匪浅,非常感谢。 你的言辞如同繁星闪烁,点亮了我心中的夜空。
页:
[1]