1. R
R是常用于统计和画图的计算机语言。
1.1. R包存储库
R 语言可以通过各种宏包来拓展功能,一般通过中央软件存储库下载R包,如R基金会资助的最常用的The Comprehensive R Archive Network (CRAN)和存储R开发的生物数据分析包的生物专业软件存储库Bioconductor。
1.2. R相关
1.2.1. RStudio
- RStudio 是 R 的集成开发环境 (IDE)。
- 它包括一个控制台、支持直接代码执行的语法高亮编辑器,以及用于绘图、历史、调试和工作区管理的工具。
- 有两种格式:RStudio Desktop 是一个常规的桌面应用程序,而 RStudio Server 运行在远程服务器上,并允许使用Web 浏览器访问 RStudio。
1.2.2. Rtools
- Rtools是 Windows 上从源代码构建 R 包所需的一组程序。
- Rtools为 Windows 平台提供了一个与 R 兼容的工具链,使得Windows平台R的使用与UNIX-ish平台R的使用许多命令一致。它主要包括 GNU make、GNU gcc 和其他在 UNIX-ish 平台上常用的实用程序。
- 如果只使用CRAN 或 Bioconductor 上提供的R包,则无需Rtools,如果使用需要编译的R包(比如ROracle)或者制作自己的R包,则需要Rtools。
2. R的安装和配置
2.1. R for Windows
2.1.1. 安装R
R官网或者R清华镜像下载安装最新版本的R(现在最新版是R4.1.2)。
双击之后按步骤安装。
2.1.2. 安装RStudio Desktop
RStudio官网下载安装最新版本的Rstudio Desktop。
双击之后按步骤安装。
2.1.3. 安装Rtools
- 安装Rtools
- Rtools4下载安装最新版本的Rtools。
- 双击之后按步骤安装。
- 把Rtools加进环境变量
- R下运行
writeLines('PATH="${RTOOLS40_HOME}\\usr\\bin;${PATH}"', con = "~/.Renviron")
,代表把rtools40/usr/bin作为环境变量写进R的配置文件~/.Renviron。 - 重启R之后输入
Sys.which("make")
- 如果环境配置成功,会有下述类似信息
make "C:\\rtools40\\usr\\bin\\make.exe"
,代表make命令可运行。 - 上面两步都ok,就测试下能不能通过以下方式安装包
install.packages("jsonlite", type = "source")
,安装成功就说明配置好了。
- 如果上面加环境变量不成功,在【我的电脑】-【属性】-【高级系统设置】-【环境变量】,把PATH的值加上自己电脑安装Rtools的路径中保存了make.exe的文件夹,比如
C:\\rtools40\\usr\\bin
,再重启R即可。
2.2. R for Linux
2.2.1. 安装R
2.2.1.1. 安装R
R 官网里参考对应系统的R安装教程。
- Ubuntu
apt update
,apt upgrade
,apt install r-base
- Centos
dnf install R
- Debian
apt-get update
,apt-get install r-base r-base-dev
- conda安装【推荐】
conda create -n r r-essentials r-base
#创建新环境r,安装r-base(目前是4.1.3版本),并从CRAN安装所有的r-essentials包,R Essentials 包包含大约 200 个最流行的数据科学 R 包,包括 IRKernel、dplyr、shiny、ggplot2、tidyr、caret 和 nnet。
安装R后R --version
查看版本,可能非最新版。
2.2.1.2. 手动安装R
R source installation ref;ref2。
- R的依赖
参考R官方文档R installation and administration,包括zlib,bzip,liblzma(XZ),PCRE等。 - R下载
R官网或者R清华镜像下载安装最新版本的R(现在最新版是R4.1.2)。 - R源码安装
R源码是C语言写的,需要编译安装。1
2
3
4
5tar zxvf R-4.1.2.tar.gz
cd R-4.1.2
./configure --enable-R-shlib #配置,生成Makefile
make #编译
make install #安装
2.2.2. 安装RStudio Server
2.2.2.1. 安装RStudio Server
RStudio Server 运行在远程服务器上,并允许使用Web 浏览器访问 RStudio。
在RStodio官网上选择RStudio Server,选相应的系统版本下载。
- Ubuntu
sudo apt-get install r-base
# for Ubuntu 16 - CentOS
wget https://download2.rstudio.org/server/centos8/x86_64/rstudio-server-rhel-2021.09.1-372-x86_64.rpm
,sudo yum install rstudio-server-rhel-2021.09.1-372-x86_64.rpm
# for CentOS 8
2.2.2.2. 卸载/更新RStudio Server
更新也需要先卸载再安装新的版本。
rstudio-server stop
#暂停当前RStudio Server服务yum remove rstudio-server
#CentOS卸载,或者apt-get remove rstudio-server
#Ubuntu卸载
2.2.2.3. 安装后配置RStudio Server
- 安装后,通过修改/etc/rstudio/rserver.conf更改端口和R所在路径
1 | www-port=8787 # 端口, 默认8787 |
- 用
rstudio-server restart
重启服务
没有任何信息就表示安装成功了,还可以rstudio-server verify-installation
验证,没有输出就是安装成功。
2.2.2.4. 使用RStudio Server
ps -aux|grep rstudio-server
查看服务是否运行,ipconfig
查看服务器IP地址。
安装配置好RStudio Server后,直接在浏览器打开http://IP:8787,输入服务器的用户名和密码,即可访问RStudio Server服务。
3. R的配置
类似conda的~/.condarc
文件配置conda,R的配置文件是~/.Renviron
。
每次启动R都会运行配置文件中的设置和命令。
打开配置文件进行编辑file.edit('~/.Renviron')
4. R包安装
R 语言可以通过各种宏包来拓展功能,一般通过中央软件存储库下载R包,如最常用的R基金会资助的The Comprehensive R Archive Network (CRAN),存储R开发的生物数据分析包的生物专业软件存储库Bioconductor,以及anaconda。
4.1. R包安装位置
R包安装前先选择默认的R包安装位置,如果R安装在C盘,原有的默认R包安装位置可能因为是不可写目录等原因在之后的R包安装过程中出现报错,所以最好的办法是自己指定一个全英文,无空格,可写的文件夹。
- 查看R包默认安装路径
1 | .libpaths() #查看R包默认安装路径,可能有多个 |
- 修改默认安装路径
file.edit('~/.Renviron')
打开配置文件进行编辑- 在文件中加入一行
R_LIBS_USER="D:/rpackages/"
,注意双引号是英文的,保存然后关闭文件。
- 重启R后再次查看默认安装路径,如果显示是新的路径即修改成功
1 | .libpaths() #查看R包默认安装路径,可能有多个 |
4.2. 通过CRAN安装R包
install.packages("packagename")
R默认的安装方式,会从CRAN下载包并安装。- 同时安装多个包:
install.packages(c("packagename1","packagename2"))
- 使用R包下载地址安装:
install.packages("http://cran.r-project.org/src/contrib/Archive/ggplot2/ggplot2_0.9.1.tar.gz", repos=NULL, type="source")
- 下载包到本地后手动安装:
install.packages("ggplot2_0.9.1.tar.gz", repos = NULL)
4.3. 通过Bioconductor后安装R包
- 安装BioconductorBiocManager的版本与R版本一一对应,安装时如果版本不对会有提示,根据提示安装对应版本即可。
1
2
3if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install(version = "3.13") - 查看可用的Bioconductor包:
BiocManager::available()
- 安装Bioconductor库里有的R包:
BiocManager::install("packagename",version="3.2")
- 同时安装多个包:
BiocManager::install(c("packagename1","packagename2"))
4.4. 通过conda安装R包
在anaconda官网查询想要安装的R包,如果库里有可以使用conda安装。
一般需要在包名称前添加r-,比如安装rbokeh和rjava。conda install r-rbokeh
,conda install r-rjava
4.5. 更新和卸载R包
- 更新:
update.packages()
;conda更新R包caretconda update r-caret
- 卸载:
remove.packages()
。
5. R包载入
- library(packagename)
如果包不存在,library会停止执行,不返回任何值。 - require(packagename)
require会根据包存在与否返回true或false,并继续下面的语句执行。
6. R包使用查询
R包使用方法: help(package="packagename")
7. reference
- 欢迎关注微信公众号:生信技工
- 公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容,包括生物信息学工具的基本原理、操作步骤和学习心得。