1. 上传的原始测序数据

二代或三代测序的原始序列读数应提交至Sequence Read Archive(SRA)：https://www.ncbi.nlm.nih.gov/sra。

2. 上传前准备

建议先注册和登录NCBI账号再进行上传，之后的所有提交记录都会保存在你的账号下，在这里可以查看提交记录：https://submit.ncbi.nlm.nih.gov/subs/。

Unassembled sequence reads (SRA)：未组装的测序reads
3.2. 进入Submission Portal门户网站
选完数据类型，会自动进入Submission Portal门户网站

包括姓名First and Last name，邮箱Email，单位Submitting organization(学校)，部门Department(学院)，街道Street，城市City，省/州State/Province，邮编Postal code，国家Country。
在最后可以选择Update my contact information in profile会更新填写的信息到账号，下一次新填写就默认填入提交者信息了。

BioProject和BioSample是所有提交到GenBank都需要的，属于哪个项目，用了哪个样本。
可以先注册这两项再在这里提供accession number；也可以选择还未注册提交之后会增加填写BioProject和BioSample信息的步骤然后自动注册新的；
同一个项目同一个样品多个测序文件，比如基因组测序最常见的方案（Illumina PE的 DNA-Seq和RNA-Seq，以及PacBio SMRT），可以在一次提交中一同提交。
释放日期Release date可以指定日期，也可以提交通过后立即释放；释放日期可以提交后发邮件更改的；

如果是批量提交，可以用excel或csv表格提交多条信息。
样品名称Sample Name：选择BioSample Attributes中填的。
Library ID：测序前建库的ID，是独一无二的。
Title：通常用这种形式：{methodology} of {organism}:{sample info}，如RNA-Seq of Bauhinia variegata: mature flower。
Library strategy：建库策略，二代和三代测序选全基因组测序WGS。
Library source：DNA-Seq和RNA-Seq通常Genomic或Transcriptomic。
Library selection：二代和三代测序选RANDOM
Library layout：单端 single或双端 paired
Platform：测序平台，Illumina或Pacbio_SMRT等。
Instrument model：具体的测序仪器型号。如Illumina NovaSeq 6000和PacBio RS II。
Design description：建库方法的简短描述。如TruSeq library preparation from genomic DNA。
Filetype：fastq或bam等。如果选择bam格式，会被认为是比对文件，需要填写比对用的参考基因组。
Reference FASTA File：上传bam格式文件时才需要填写，填bam文件比对用的参考序列的文件名。
Reference assembly：上传bam格式文件时才需要填写，填bam文件比对用的参考序列的组装。如果上传的是未aligned的bam文件（比如PacBio三代测序原始数据，常用bam格式，但没有做比对），在这一栏填unaligned即可。
Filename：文件名，包含文件后缀。如果双端测序就两个文件名。

提交SRA文件，fastq格式或者bam格式等格式的文件，支持fq.gz压缩格式。
多种上传方式：FTP或Aspera命令行上传文件夹(10-100GB)，或者网页提交(<2GB)或Aspera Connect plugin(2-10GB)上传文件。其中Aspera命令行上传最快。
NCBI网站写着FTP或Aspera命令行上传10-100GB的数据，但实测400多GB的数据通过Aspera命令也是可以上传成功的。
Linux系统下推荐Aspera命令行上传：(1)把要上传的文件全部放在一个文件夹下；(2)下载和安装Aspera Connect software；(3)下载key file文件；(4) 运行命令 ascp -i <path/to/key_file> -QT -l100m -k1 -d <path/to/folder/containing files> subasp@upload.ncbi.nlm.nih.gov:uploads/xx_xx_xx_gmail.com_DaE3nqDQ;其中-i <path/to/key_file>必须是绝对路径；-d <path/to/folder/containing files>-d后面跟的是包含所有文件的文件夹，而不是文件，上传文件在后面的步骤是无效的;-l100m参数是指定最大传输速度为100 meg/s；实测大概是50分钟传了20Gb数据。(5)上传好了就回到这个界面，选择上传的文件夹，继续提交。
有时文件较大需要等待较长时间，可以选择自动完成提交（Autofinish submission），选择后在上传文件完成后自动检查，没有问题就自动提交。
提交之后会检查信息是否错误，按提示修改。

没什么问题的话，两个工作日内会发邮件告知GenBank accession numbers，可用于文章引用。