准备上传的文件
- 基因组fasta文件
- 注释tbl格式文件
tbl格式文件推荐用GB2sequin来准备。
参考博客-转换GenBank文件为tbl格式:https://yanzhongsino.github.io/2022/06/16/biosoft_fileformat_gb2tbl/。
上传步骤
上传工具
BankIt:https://www.ncbi.nlm.nih.gov/WebSub/index.cgi
使用BankIt在线上传,允许一次提交多个细胞器基因组序列。
上传步骤
- 选择上传的数据类别。细胞器基因组选择Sequence data not listed above:organelle。下面列几个常用的:
- Eukaryotic and Prokaryotic Genomes(WGS or Complete): 组装好的真核和原核物种的基因组
- Transcriptome Shotgun Assembly (TSA):组装好的转录组
- Unassembled sequence reads (SRA):未组装的测序reads
- Sequence data not listed above:mRNA, genomic DNA, organelle, ncRNA, plasmids…:其他测序数据,细胞器基因组选这个。
- Contact:填写上传人的信息,包括姓名,学院,学校,地址,城市,地区/省份,邮编,国家,和接收上传信息的邮箱【重要】。
- Reference:填写提供序列的作者和出版信息。
- Sequencing Technology:填写测序方法信息,包括测序平台,是否是组装的数据,组装软件和版本,组装样品名称,覆盖度。
- Nucleotide:填写序列的信息。
- 序列发布的时间,可以指定日期,也可以一通过上传审核就发布。
- 分子类型(Molecule Type):细胞器基因组选的genomic DNA
- 拓扑结构(Topology):线型分子(Linear)还是环形分子(Circular)。
- 是否是完整的细胞器基因组:yes/no。
- 核苷酸序列格式:fasta或者alignment,选的fasta
- 上传细胞器基因组的fasta文件
- Organism:填写Organism name信息,可填物种的学名。
- Submission Category:测序reads是上传者测序的还是使用的其他已上传序列数据。如果是使用其他已上传reads进行的组装则需要提供已上传reads的accession number。
- Source Modifiers:资源信息。
- Organelle/Location: 叶绿体/线粒体/其他器官。
- Source Modifier可以填写Country;对应的value填写China。
- Features:提供注释信息,可以选择tbl文件或者手动填写注释表格,tbl文件的ID和提交的序列ID需要一致。
- Review and Correct:回顾和确认填写的信息,即可完成提交。
没什么问题的话,两个工作日内会发邮件告知GenBank accession numbers,可用于文章引用。
- 欢迎关注微信公众号:生信技工
- 公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容,包括生物信息学工具的基本原理、操作步骤和学习心得。