针对生物信息学初学者来讲,最大挑战是缺少经验丰富的导师。但ChatGPT的显现可能会改变这种状况。此刻,朋友们能够把ChatGPT当作自己的助手,指点它来完成数据分析。
今天博主分享一篇收录在National Library of Medicine的文献《Empowering Beginners in Bioinformatics with ChatGPT》
文献位置:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10028953/#R1
帮忙更加多生物信息/医疗关联小伙伴让ChatGPT作为咱们随叫随到的“导师”
OPTICAL 模型
在本科研中,作者提出了一个迭代模型,用于微调指点 ChatGPT 生成生物信息学数据分析任务代码的指令。该模型应用于各样生物信息学主题。
用户先知道科学问题、分析任务、计算办法和预期成果,接着在指点下撰写仔细的数据分析任务提示。之后,她们经过输入提示与聊天设备人对话,生成并执行代码。
提问流程
1.供给初始指令
2.ChatGPT生成份析代码
3.执行代码
if :代码出错,调节指令
else:代码无误,进行下一步
4.检测结果
if :结果不睬想,调节指令
else:结果达标,进入下一周期
5.复审代码,确认最后指令并记录办法
全案例展示
作者经过以上ChatGPT指令流程成功绘制成果:
实战&rompt指令
短读序列比对与视觉检验在下一代测序分析中的应用
初始Prompt指令
做为一名精通ChIP-Seq数据分析的资深生物信息学专家,你将经过编写行数尽可能少的代码来帮助我。如有需求,终止线程。倘若理解,请回复“YES”。
英文Prompt
Act as an experienced bioinformatician proficient in ChIP-Seq data analysis, you will assist me by writing code with number of lines as minimal as possible. Rest the thread if asked to. Reply “YES” if understand.
执行Prompt指令
当前文件夹中有两个来自ChIP-Seq文库单端测序的fastq文件:ENCFF000AVS_1m.fastq.gz 和 ENCFF000AVS_10m.fastq.gz。对每一个fastq文件,将读段比对到人类参考基因组,保留为bam文件,而后转换为bigwig文件。运用的工具包含bowtie2、samtools和deepTools。bowtie2的索引文件位置于“../data/indx/bowtie2_whole_genome/”文件夹中,前缀为“hg38”。比对时运用24个CPU。请用bash语言编写代码。
英文Prompt
I have two fastq files in current folder from single-end sequencing of a ChIP-Seq library: ENCFF000AVS_1m.fastq.gz, and ENCFF000AVS_10m.fastq.gz. For each fastq file, align reads to the human reference genome, save to bam file, and then covert it to bigwig file. Tools to use: bowtie2, samtools, and deepTools. The index for bowtie2 is in the folder “../data/indx/bowtie2_whole_genome/” with “hg38” as the prefix. Use 24 CPU for the alignment. Please draft the code in bash.
ChatGPT生成结果 #!/bin/bash# Define variablesINDEX="../data/indx/bowtie2_whole_genome/hg38"CPUS=24FASTQ1="ENCFF000AVS_1m.fastq.gz"FASTQ2="ENCFF000AVS_10m.fastq.gz"# Align reads to reference genome using bowtie2bowtie2 -p $CPUS -x $INDEX -U $FASTQ1 | samtools sort -@ $CPUS -o ENCFF000AVS_1m.bambowtie2 -p$CPUS -x $INDEX -U $FASTQ2 | samtools sort -@ $CPUS -o ENCFF000AVS_10m.bam# Convert BAM files to bigWig format using deepToolsbamCoverage -b ENCFF000AVS_1m.bam -o ENCFF000AVS_1m.bw --binSize 10 --normalizeUsing CPMbamCoverage -b ENCFF000AVS_10m.bam -o ENCFF000AVS_10m.bw --binSize 10 --normalizeUsing CPM
迭代指令
等等,我看到你在运用 "bamcoverage" 前执行了 "samtools index"。这是不是寓意着在做为输入之前需要对bam文件进行排序?
英文Prompt
Wait, I saw that you have "samtools index" before "bamcoverage". Does bamcoverage as bam to be sorted before using as input?
运行结果:
复审Prompt指令
我需要逐行添加注释到下面的代码中,这个代码能够很好地满足数据分析任务的需要。请等待我的代码。
I need to insert line-by-line comments to the below code which works well to address the needs for the data analysis task. Wait for my code.
ChatGPT运行结果
能够与 ChatGPT 互动,就像与同伴一块学习同样,而同伴亦会即时做出回复。这针对生信的伙伴来讲非常有价值。 ChatGPT国内中文站
网站位置:cloud.dftianyi.com
✅️供给原版ChatGPT服务
支持GPT-4 | GPT-4o | GPT-4o mini最新
✅️支持语音对话、数据分析、AI绘图
适合人群:国内所有用户
(研究/编程人必须,真的比国内AI聪明非常多)
✅️GPT-4o mini免费
✅️GPT-4 /4oTeams账号39.9元/月 (≈官网价格2折)
✅️原生ChatGPT页面,100次提问/每3小时
✅️支持官网的所有功能 |