u1jodi1q 发表于 2024-6-15 12:43:47

癌症基因组数据


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">随着深度测序的技术发展, <span style="color: black;">海量</span>组学数据库是被产生. 诸如癌症基因组图谱, DNA元素百科全书, 癌症基因组计划, cBioPortal, 国际癌症基因组联盟, 基因型-组织表达<span style="color: black;">科研</span>联盟等收集了<span style="color: black;">海量</span>不同组织/不同癌症的组学数据.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">癌症基因组数据的<span style="color: black;">海量</span>产生, 为计算生物学家<span style="color: black;">供给</span>了巨大的机会. <span style="color: black;">怎样</span>从这些癌症基因组学数据中挖掘生物分子共表达模块是<span style="color: black;">咱们</span>面临的一大挑战.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本文<span style="color: black;">运用</span>最多的癌症基因组数据来自于TCGA数据库. TCGA计划<span style="color: black;">起始</span>于2005年, <span style="color: black;">运用</span>基因组测序和生物信息学来分析癌症的基因突变和分子合作机制. TCGA应用高通量基因组分析技术, 更好地<span style="color: black;">认识</span>这种<span style="color: black;">疾患</span>的遗传<span style="color: black;">基本</span>, <span style="color: black;">加强</span>诊断、 治疗和预防癌症的能力.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">截止到2016年, TCGA数据库收集了30多种癌症的基因组数据. 每一种癌症<span style="color: black;">包含</span>突变、拷贝数变异、mRNA表达、miRNA表达、甲基化数据等(图~\ref{fig:1.3}). <span style="color: black;">日前</span>下载TCGA上的数据<span style="color: black;">重点</span>是<span style="color: black;">经过</span>以下两个途径:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(1) TCGA官网 (<a style="color: black;">GDC</a>). 其优点是数据最全、 更新最快. 其缺点是<span style="color: black;">每一个</span>样本的数据都单独储存在一个文件中. <span style="color: black;">倘若</span>要下载某一种癌症的RNA数据的话, <span style="color: black;">必须</span><span style="color: black;">同期</span>下载好几百个文件, 其下载速度<span style="color: black;">亦</span>很慢.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(2) Firehose数据库 (<a style="color: black;">Broad GDAC Firehose</a>). 其优点是<span style="color: black;">这儿</span>的数据<span style="color: black;">亦</span><span style="color: black;">源自</span>于 TCGA的官网. 只<span style="color: black;">不外</span>, 服务器上对TCGA官网的数据进行了简单的合并, 将每种癌症相同类型的数据合并成一个文件, 使得其下载变得很方便. <span style="color: black;">咱们</span><span style="color: black;">举荐</span>读者<span style="color: black;">运用</span>Firehose数据库下载TCGA的数据.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">倘若</span><span style="color: black;">必须</span>看感兴趣的几个基因在某种癌症的突变谱, 表达量<span style="color: black;">或</span>甲基化等<span style="color: black;">状况</span>, <span style="color: black;">那样</span>以下的可视化<span style="color: black;">网</span>是非常适合的.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(1) c-Bioportal (<a style="color: black;">cB</a>ioPortal for Cancer Genomics). 它整合了<span style="color: black;">包含</span>TCGA、 ICGC以及GEO等164种癌症的基因组数据. c-Bioportal<span style="color: black;">亦</span><span style="color: black;">供给</span>友好的可视化界面: <span style="color: black;">能够</span>展示基因的突变谱、 DNA拷贝数变化、 mRNA和miRNA的表达量变化、 DNA甲基化以及蛋白质表达的<span style="color: black;">状况</span>等. <span style="color: black;">另外</span>, <span style="color: black;">亦</span><span style="color: black;">能够</span>结合<span style="color: black;">病人</span>的临床数据用于<span style="color: black;">存活</span>分析并画出相应的<span style="color: black;">存活</span>曲线. 以上的所有分析结果<span style="color: black;">亦</span>供下载.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(2) GEPIA (<a style="color: black;">GEPIA (Gene Expression Profiling Interactive Analysis)</a>). 它整合分析了TCGA的30多种癌症的基因表达数据和病人临床数据, 提供了对单个基因<span style="color: black;">或</span>一组基因<span style="color: black;">存活</span>分析的功能.</p>




b1gc8v 发表于 2024-9-28 23:38:53

楼主继续加油啊!外链论坛加油!

wrjc1hod 发表于 6 天前

“BS”(鄙视的缩写)‌

4lqedz 发表于 前天 23:56

楼主果然英明!不得不赞美你一下!
页: [1]
查看完整版本: 癌症基因组数据