介绍NCBI,GenBank和向GenBank上传核苷酸序列。
提交原始测序数据到NCBI的SRA数据库
记录上传原始测序reads数据(二代数据和三代数据)到SRA数据库的步骤。
二代测序数据的前处理
对二代测序进行预处理。包括从NCBI下载SRA格式数据,把SRA格式转为fastq格式。对二代测序的下机数据的质控,包括fastp去除接头和低质量序列,fastqc获取质量报告,trimmomatic去除接头和低质量序列,fastuniq为genome survey等情况去除重复序列。
用SPAdes对Illumina二代测序数据进行基因组预组装
在只有Illumina二代测序数据时,用SPAdes对Illumina二代测序数据进行基因组预组装,得到较长的contigs和scaffolds。
用Trinity的脚本进行转录本定量分析
本文记录Trinity的转录本定量分析脚本`align_and_estimate_abundance.pl`的使用。
用RSEM进行转录本定量分析
本文记录软件RSEM(RNA-Seq by Expectation-Maximization)进行转录本定量分析。
用miniprot做蛋白序列和基因组序列间的比对
记录了用软件miniprot进行蛋白序列和基因组序列间的比对。
用PlantTribes做直系同源推断
简单介绍了软件PlantTribes,以及使用PlantTribes2进行推断编码序列,局部组装目标基因家族,直系同源序列推断(orthology inference),orthogroups的多序列比对和建树,以及估算Ka/Ks等的用法。
进化树处理和可视化工具Newick Utilities
使用Newick Utilities处理进化树和可视化。Newick Utilities是一套用于处理系统发育树的unix shell工具,其功能包括重置根(re-root)、提取子树、修剪、合并枝以及可视化和修饰树。
多序列比对的整体可视化
多序列比对的可视化,黑白、彩色的可视化,包括用AliView进行多序列比对的整体可视化。