0%

R及相关软件的安装

1. R

R是常用于统计和画图的计算机语言。

1.1. R包存储库

R 语言可以通过各种宏包来拓展功能,一般通过中央软件存储库下载R包,如R基金会资助的最常用的The Comprehensive R Archive Network (CRAN)和存储R开发的生物数据分析包的生物专业软件存储库Bioconductor

1.2. R相关

1.2.1. RStudio

  • RStudio 是 R 的集成开发环境 (IDE)。
  • 它包括一个控制台、支持直接代码执行的语法高亮编辑器,以及用于绘图、历史、调试和工作区管理的工具。
  • 有两种格式:RStudio Desktop 是一个常规的桌面应用程序,而 RStudio Server 运行在远程服务器上,并允许使用Web 浏览器访问 RStudio。

1.2.2. Rtools

  • Rtools是 Windows 上从源代码构建 R 包所需的一组程序。
  • Rtools为 Windows 平台提供了一个与 R 兼容的工具链,使得Windows平台R的使用与UNIX-ish平台R的使用许多命令一致。它主要包括 GNU make、GNU gcc 和其他在 UNIX-ish 平台上常用的实用程序。
  • 如果只使用CRAN 或 Bioconductor 上提供的R包,则无需Rtools,如果使用需要编译的R包(比如ROracle)或者制作自己的R包,则需要Rtools。

2. R的安装和配置

2.1. R for Windows

2.1.1. 安装R

R官网或者R清华镜像下载安装最新版本的R(现在最新版是R4.1.2)。
双击之后按步骤安装。

2.1.2. 安装RStudio Desktop

RStudio官网下载安装最新版本的Rstudio Desktop。
双击之后按步骤安装。

2.1.3. 安装Rtools

  1. 安装Rtools
  • Rtools4下载安装最新版本的Rtools。
  • 双击之后按步骤安装。
  1. 把Rtools加进环境变量
  • R下运行writeLines('PATH="${RTOOLS40_HOME}\\usr\\bin;${PATH}"', con = "~/.Renviron"),代表把rtools40/usr/bin作为环境变量写进R的配置文件~/.Renviron。
  • 重启R之后输入Sys.which("make")
  • 如果环境配置成功,会有下述类似信息make "C:\\rtools40\\usr\\bin\\make.exe" ,代表make命令可运行。
  • 上面两步都ok,就测试下能不能通过以下方式安装包install.packages("jsonlite", type = "source"),安装成功就说明配置好了。
  1. 如果上面加环境变量不成功,在【我的电脑】-【属性】-【高级系统设置】-【环境变量】,把PATH的值加上自己电脑安装Rtools的路径中保存了make.exe的文件夹,比如C:\\rtools40\\usr\\bin,再重启R即可。

2.2. R for Linux

2.2.1. 安装R

2.2.1.1. 安装R

R 官网里参考对应系统的R安装教程。

  1. Ubuntu
    apt update,apt upgrade,apt install r-base
  2. Centos
    dnf install R
  3. Debian
    apt-get update,apt-get install r-base r-base-dev
  4. conda安装【推荐】
    conda create -n r r-essentials r-base #创建新环境r,安装r-base(目前是4.1.3版本),并从CRAN安装所有的r-essentials包,R Essentials 包包含大约 200 个最流行的数据科学 R 包,包括 IRKernel、dplyr、shiny、ggplot2、tidyr、caret 和 nnet。

安装R后R --version查看版本,可能非最新版。

2.2.1.2. 手动安装R

R source installation ref;ref2

  1. R的依赖
    参考R官方文档R installation and administration,包括zlib,bzip,liblzma(XZ),PCRE等。
  2. R下载
    R官网或者R清华镜像下载安装最新版本的R(现在最新版是R4.1.2)。
  3. R源码安装
    R源码是C语言写的,需要编译安装。
    1
    2
    3
    4
    5
    tar zxvf R-4.1.2.tar.gz
    cd R-4.1.2
    ./configure --enable-R-shlib #配置,生成Makefile
    make #编译
    make install #安装

2.2.2. 安装RStudio Server

2.2.2.1. 安装RStudio Server

RStudio Server 运行在远程服务器上,并允许使用Web 浏览器访问 RStudio。

RStodio官网上选择RStudio Server,选相应的系统版本下载。

  1. Ubuntu
    sudo apt-get install r-base # for Ubuntu 16
  2. CentOS
    wget https://download2.rstudio.org/server/centos8/x86_64/rstudio-server-rhel-2021.09.1-372-x86_64.rpm,
    sudo yum install rstudio-server-rhel-2021.09.1-372-x86_64.rpm # for CentOS 8

2.2.2.2. 卸载/更新RStudio Server

更新也需要先卸载再安装新的版本。

  1. rstudio-server stop #暂停当前RStudio Server服务
  2. yum remove rstudio-server #CentOS卸载,或者 apt-get remove rstudio-server #Ubuntu卸载

2.2.2.3. 安装后配置RStudio Server

  1. 安装后,通过修改/etc/rstudio/rserver.conf更改端口和R所在路径
1
2
3
www-port=8787 # 端口, 默认8787
www-address=0.0.0.0
rsession-which-r=/opt/sysoft/R-4.1.2/bin/R # 安装R的路径
  1. rstudio-server restart重启服务
    没有任何信息就表示安装成功了,还可以rstudio-server verify-installation验证,没有输出就是安装成功。

2.2.2.4. 使用RStudio Server

ps -aux|grep rstudio-server查看服务是否运行,ipconfig查看服务器IP地址。

安装配置好RStudio Server后,直接在浏览器打开http://IP:8787,输入服务器的用户名和密码,即可访问RStudio Server服务。

3. R的配置

类似conda的~/.condarc文件配置conda,R的配置文件是~/.Renviron
每次启动R都会运行配置文件中的设置和命令。
打开配置文件进行编辑file.edit('~/.Renviron')

4. R包安装

R 语言可以通过各种宏包来拓展功能,一般通过中央软件存储库下载R包,如最常用的R基金会资助的The Comprehensive R Archive Network (CRAN),存储R开发的生物数据分析包的生物专业软件存储库Bioconductor,以及anaconda

4.1. R包安装位置

R包安装前先选择默认的R包安装位置,如果R安装在C盘,原有的默认R包安装位置可能因为是不可写目录等原因在之后的R包安装过程中出现报错,所以最好的办法是自己指定一个全英文,无空格,可写的文件夹。

  1. 查看R包默认安装路径
1
2
3
.libpaths() #查看R包默认安装路径,可能有多个
C:/Users/spider/Documents/R/win-library/3.5"
C:/Program Files/R/R-3.5.2/library
  1. 修改默认安装路径
  • file.edit('~/.Renviron')打开配置文件进行编辑
  • 在文件中加入一行R_LIBS_USER="D:/rpackages/",注意双引号是英文的,保存然后关闭文件。
  1. 重启R后再次查看默认安装路径,如果显示是新的路径即修改成功
1
2
.libpaths() #查看R包默认安装路径,可能有多个
D:/rpackages

4.2. 通过CRAN安装R包

  1. install.packages("packagename") R默认的安装方式,会从CRAN下载包并安装。
  2. 同时安装多个包: install.packages(c("packagename1","packagename2"))
  3. 使用R包下载地址安装: install.packages("http://cran.r-project.org/src/contrib/Archive/ggplot2/ggplot2_0.9.1.tar.gz", repos=NULL, type="source")
  4. 下载包到本地后手动安装: install.packages("ggplot2_0.9.1.tar.gz", repos = NULL)

4.3. 通过Bioconductor后安装R包

  1. 安装Bioconductor
    1
    2
    3
    if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
    BiocManager::install(version = "3.13")
    BiocManager的版本与R版本一一对应,安装时如果版本不对会有提示,根据提示安装对应版本即可。
  2. 查看可用的Bioconductor包:BiocManager::available()
  3. 安装Bioconductor库里有的R包:BiocManager::install("packagename",version="3.2")
  4. 同时安装多个包:BiocManager::install(c("packagename1","packagename2"))

4.4. 通过conda安装R包

anaconda官网查询想要安装的R包,如果库里有可以使用conda安装。

一般需要在包名称前添加r-,比如安装rbokeh和rjava。
conda install r-rbokeh,conda install r-rjava

4.5. 更新和卸载R包

  1. 更新:update.packages();conda更新R包caretconda update r-caret
  2. 卸载:remove.packages()

5. R包载入

  1. library(packagename)
    如果包不存在,library会停止执行,不返回任何值。
  2. require(packagename)
    require会根据包存在与否返回true或false,并继续下面的语句执行。

6. R包使用查询

R包使用方法: help(package="packagename")

7. reference

  1. https://www.bioinfo-scrounger.com/archives/435/

  • 欢迎关注微信公众号:生信技工
  • 公众号主要分享生信分析、生信软件、基因组学、转录组学、植物进化、生物学概念等相关内容,包括生物信息学工具的基本原理、操作步骤和学习心得。
真诚赞赏,手留余香