介绍GetOrganelle,使用GetOrganelle基于whole genome skimming data组装植物质体、植物线粒体、动物线粒体、真菌线粒体、核基因组的核糖体RNA(18S-ITS1-5.8S-ITS2-26S)等序列。
细胞器基因组组装过程中常用软件Bandage的操作
记录细胞器基因组组装过程中常用软件Bandage的操作。
提交原始测序数据到NCBI的GenBank
记录上传原始测序reads数据(二代数据和三代数据)到GenBank的步骤。
提交核苷酸序列到NCBI的GenBank的介绍
介绍NCBI,GenBank和向GenBank上传核苷酸序列。
二代测序数据的前处理
对二代测序进行预处理。包括从NCBI下载SRA格式数据,把SRA格式转为fastq格式。对二代测序的下机数据的质控,包括fastp去除接头和低质量序列,fastqc获取质量报告,trimmomatic去除接头和低质量序列,fastuniq为genome survey等情况去除重复序列。
用SPAdes对Illumina二代测序数据进行基因组预组装
在只有Illumina二代测序数据时,用SPAdes对Illumina二代测序数据进行基因组预组装,得到较长的contigs和scaffolds。
用RSEM进行转录本定量分析
本文记录软件RSEM(RNA-Seq by Expectation-Maximization)进行转录本定量分析。
用Trinity的脚本进行转录本定量分析
本文记录Trinity的转录本定量分析脚本`align_and_estimate_abundance.pl`的使用。
用miniprot做蛋白序列和基因组序列间的比对
记录了用软件miniprot进行蛋白序列和基因组序列间的比对。
用PlantTribes做直系同源推断
简单介绍了软件PlantTribes,以及使用PlantTribes2进行推断编码序列,局部组装目标基因家族,直系同源序列推断(orthology inference),orthogroups的多序列比对和建树,以及估算Ka/Ks等的用法。