生信分析、meta分析、数据挖掘
TCGA、GEO、SEER、Oncomine

无root权限编译R语言,或许只是一个体力活

正文共:10830 字 4 图

预计阅读时间: 28 分钟

如果你拥有最高权限,如果你只管理一台服务器,那么系统自带的包管理工具就帮你解决了所有问题。但是真实世界没有那么美好,所以我花了那么久时间去学习如何从源码开始编译一个软件。

环境为CentOS Linux release 7.4.1708 (Core), Linux内核version 3.10.0-693.el7.x86_64, GCC版本为4.8.5 20150623 (Red Hat 4.8.5-16) (GCC),

GCC安装

首先让我们利用系统原来老旧的GCC编译器编译出最新版本的gcc吧,毕竟安装软件的时候,GCC的版本一定要过最低要求。

第一步: 下载gcc源码

  1. mkdir -p ~/src && cd ~/src

  2. wget https://mirrors.tuna.tsinghua.edu.cn/gnu/gcc/gcc-7.2.0/gcc-7.2.0.tar.gz

  3. tar -zxvf gcc-7.2.0.tar.gz && cd gcc-7.2.0

  4. ls

第二步, 检查系统是否已经具备前置软件, 主要是GMP,MPFR, MPC。这些软件可以到ftp://gcc.gnu.org/pub/gcc/infrastructure/找到,然后下载后解压缩,并移动到gcc源码文件夹下。 可以在配置的时候用 --with-gmp, --with-mpfr --with-mpc指定具体所在路径。

  1. cd src

  2. # GNU Multiple precision Library

  3. wget ftp://gcc.gnu.org/pub/gcc/infrastructure/gmp-6.1.0.tar.bz2

  4. && tar -jxvf gmp-6.1.0.tar.bz2 && mv gmp-6.1.0 gcc-7.2.0/gmp

  5. # isl library

  6. wget ftp://gcc.gnu.org/pub/gcc/infrastructure/isl-0.18.tar.bz2

  7. && tar -jxvf isl-0.18.tar.bz2 && mv isl-0.18 gcc-7.2.0/isl

  8. # MPFR Library

  9. wget ftp://gcc.gnu.org/pub/gcc/infrastructure/mpfr-3.1.4.tar.bz2

  10. && tar -jxvf mpfr-3.1.4.tar.bz2 && mv mpfr-3.1.4 gcc-7.2.0/mpfr

  11. # MPC Library

  12. wget ftp://gcc.gnu.org/pub/gcc/infrastructure/mpc-1.0.3.tar.gz

  13. && tar -zxvf mpc-1.0.3.tar.gz && mv mpc-1.0.3 gcc-7.2.0/mpc

不过更加人性化的方法是在GCC源码根目录下运行 ./contrib/download_prerequisites,可以自动搞定。

第三步:使用 ./configure进行配置。官方强烈建议, 配置所在文件夹一定要和源码所在文件夹区分开,此外configure还可以配置很多参数,我的代码如下:

  1. mkdir build && cd build

  2. ../configure

  3.    --prefix=$HOME/usr # 指定安装路径

  4.    --disable-multilib # 取消32位库编译

  5.    --enable-threads=posix # 使用POSIX/Unix98作为线程支持库

基本上这一步不会出现太多的报错,都能够顺利生成Makefile.

第四步: 编译. 这步有一个小技巧就是利用多核处理器进行加速,例如 make -j2 就是双核。

这一部分很慢很慢,因为默认设置下是3个阶段的引导(3-stage bootstrap), 以保证能够编译出完整的GCC系统并且还不会出错,你可以在配置的时候用 --disable-bootstrap进行关闭。

第五步: 安装。如果你编译都成功了,那么安装也不会存在问题了, make install.

那么我们编译的GCC和系统自带的有什么区别吗?

  1. # 从头编译

  2. $ $HOME/usr/bin/gcc -v

  3. Using built-in specs.

  4. COLLECT_GCC=/home/zgxu/usr/bin/gcc

  5. COLLECT_LTO_WRAPPER=/home/zgxu/usr/libexec/gcc/x86_64-pc-linux-gnu/7.2.0/lto-wrapper

  6. Target: x86_64-pc-linux-gnu

  7. Configured with: ../configure --prefix=/home/zgxu/usr --disable-multilib --enable-threads=posix

  8. Thread model: posix

  9. gcc version 7.2.0 (GCC)

  10. # 系统自带

  11. $ gcc -v

  12. Using built-in specs.

  13. COLLECT_GCC=gcc

  14. COLLECT_LTO_WRAPPER=/usr/libexec/gcc/x86_64-redhat-linux/4.8.5/lto-wrapper

  15. Target: x86_64-redhat-linux

  16. Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-linker-build-id --with-linker-hash-style=gnu --enable-languages=c,c++,objc,obj-c++,java,fortran,ada,go,lto --enable-plugin --enable-initfini-array --disable-libgcj --with-isl=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/isl-install --with-cloog=/builddir/build/BUILD/gcc-4.8.5-20150702/obj-x86_64-redhat-linux/cloog-install --enable-gnu-indirect-function --with-tune=generic --with-arch_32=x86-64 --build=x86_64-redhat-linux

  17. Thread model: posix

  18. gcc version 4.8.5 20150623 (Red Hat 4.8.5-16) (GCC)

不谈安装路径和版本,基本上差别就是在配置这一步,而这些参数就需要仔细研究了。

一个错误: ‘Link tests are not allowed after GCC_NO_EXECUTABLES.’ 后来发现是第三步没有在独立的文件下构建Makefile.

参考资料:

  • installing GCC: https://gcc.gnu.org/install/

  • linux下编译gcc6.2.0: https://www.cnblogs.com/oloroso/p/5984985.html

Linux的编译体系

无管理员权限编译的常规三部曲是 ./configure --prefix=$HOME/usr && make && make install,其中最重要的一步就是 configure,它所做的任务如下

  • 检查GCC版本以及是否安装了编译所需工具

  • 如果需要头文件,则默认去 /usr/include查找

  • 如果涉及到动态编译库,则默认去 /usr/lib和 /usr/lib64查找. 注: lib的函数库仅用于开机时用,提供给/bin和/sbin.

那为何需要配置?配置主要解决软件开发和软件实际安装时平台不同所导致的问题。

首先,一个C/C++工程不可能只用到标准库,很多已有的轮子就不需要重复制造。其次,由于很多软件都重复用到相同的依赖库,那么如果把这些依赖库独立成单独的模块,在调用的时候加载,也能节省空间。早期为了适配多个平台,开发人员需要手写条件语句来检查环境依赖,后来GNU专门开发了Autotools辅助构建源码编译所需要的关键文件。

编译环境变量

用 ./configure -h查看帮助文档的时候,会提示几个和编译相关非常重要的环境变量。

  1. # 编译器

  2. CC          指定C编译器(compiler command)路径

  3. CXX         指定C++编译器

  4. # 编译器选项

  5. CFLAGS      用于C编译器的选项

  6. CXXFLAGS    用于C++编译器的选项

  7. LDFLAGS     链接相关选项,如果你有自定义的函数库(lib dir),即可以用 -L<lib dir>指定

  8. # 预编译器

  9. CXXCPP      C++ 预处理器(preprocessor)

  10. CPP         C 预处理器(preprocessor)

  11. # 预编译器选项

  12. CPPFLAGS    C/C++预处理器选项, 如果你自定义的头文件,可以用-I<include dir>

Makfile规则中的编译命令通常遵守如下规范:

1,首先从源代码生成目标文件(预处理,编译,汇编),”-c”选项表示不执行链接步骤;

  1. $(CC) $(CPPFLAGS) $(CFLAGS) example.c   -c   -o example.o

2,然后将目标文件链接为最终的结果(链接),”-o”选项用于指定输出文件的名字。

  1. $(CC) $(LDFLAGS) example.o   -o example

这些只是约定俗成的惯例,所以有些人会“随性而为”,你也拿他没有办法。尽管将源代码编译为二进制文件的四个步骤由不同的程序(cpp,gcc/g++,as,ld)完成,但是事实上 cpp, as, ld 都是由 gcc/g++ 进行间接调用的。换句话说,控制了 gcc/g++ 就等于控制了所有四个步骤。从 Makefile 规则中的编译命令可以看出,编译工具的行为全靠 CC/CXX CPPFLAGS CFLAGS/CXXFLAGS LDFLAGS 这几个变量在控制。所以控制这些变量最简单的做法是首先设置与这些 Makefile 变量同名的环境变量并将它们 export 为环境变量(全局),然后运行 configure 脚本,大多数 configure 脚本会使用这同名的环境变量代替 Makefile 中的值

  • CC/CXX: 指定C/C++编译所在路径,即可以选择不同的版本的编译器进行编译。

  • CPPFLAGS: 这是用于预处理阶段的选项。用于添加不在标准路径 /usr/include下的头文件。如 CPPFLAGS="-I$HOME/usr/include -I$HOME/usr/include/ncurses"

  • CFLAGS/CXXFLAGS: 指定头文件(.h文件)的路径,如: CFLAGS=-I/usr/include -I/path/include。同样地,安装一个包时会在安装路径下建立一个include目录,当安装过程中出现问题时,试着把以前安装的包的include目录加入到该变量中来。

CPPFLAG和CFLAGS/CXXFLAGS这两个变量可以认为是等价关系,都用在预处理阶段,也就是都能用于指定头文件所在位置。

  • LDFLAGS:gcc 等编译器会用到的一些优化参数,也可以在里面指定库文件的位置。用法: LDFLAGS=-L/usr/lib -L/path/to/your/lib。每安装一个包都几乎一定的会在安装目录里建立一个lib目录。如果明明安装了某个包,而安装另一个包时,它愣是说找不到,可以抒那个包的lib路径加入的LDFALGS中试一下。

有时候LDFLAGS指定-L虽然能让链接器找到库进行链接,但是运行时链接器却找不到这个库,如果要让软件运行时库文件的路径也得到扩展,那么我们需要增加这两个库给”-Wl,R”:

  1. LDFLAGS = -L/var/xxx/lib -L/opt/mysql/lib -Wl,R/var/xxx/lib -Wl,R/opt/mysql/lib

如在执行./configure以前设置环境变量 export LDFLAGS="-L/var/xxx/lib -L/opt/mysql/lib -Wl,R/var/xxx/lib -Wl,R/opt/mysql/lib",注意设置环境变量等号两边不可以有空格,而且要加上引号(shell的用法)。那么执行configure以后,Makefile将会设置这个选项,链接时会有这个参数,编译出来的可执行程序的库文件搜索路径就得到扩展了

除了通过以上几种环境变量为编译器提供头文件和静态和动态库文件的位置信息外,还有一种变量叫做PKG_CONFIG_PATH, 它从 xx.pc文件获取读取相应的环境环境。

注意:Linux下编译共享库时,必须加上-fPIC参数,即 export CFLAGS=" -fPIC" CXXFLAGS=" -fPIC"否则在链接时会有错误提示.这是在编译zsh时候发现明明装了ncurse却还是不能用的共享库的坑。

fPIC的目的是什么?共享对象可能会被不同的进程加载到不同的位置上,如果共享对象中的指令使用了绝对地址、外部模块地址,那么在共享对象被加载时就必须根据相关模块的加载位置对这个地址做调整,也就是修改这些地址,让它在对应进程中能正确访问,而被修改到的段就不能实现多进程共享一份物理内存,它们在每个进程中都必须有一份物理内存的拷贝。fPIC指令就是为了让使用到同一个共享对象的多个进程能尽可能多的共享物理内存,它背后把那些涉及到绝对地址、外部模块地址访问的地方都抽离出来,保证代码段的内容可以多进程相同,实现共享。

参考资料:

  • CFLAGS详解

  • Makefile编译选项CC与CXX/CPPFLAGS、CFLAGS与CXXFLAGS/LDFLAGS

几个必须要装的函数库

在安装之前需要先声明几个环境变量,可以直接添加在配置文件中。这都是后面遇到共享库的问题得到的经验教训。

  1. export CFLAGS=" -fPIC"

  2. export CXXFLAGS=" -fPIC"

  3. export CPPFLAGS="-I$HOME/usr/include -I$HOME/usr/include/ncurses -I$HOME/usr/include/X11"

  4. export LDFLAGS="-L$HOME/usr/lib -L$HOME/usr/lib64"

  5. export LD_LIBRARY_PATH=$HOME/usr/lib:$HOME/usr/lib64

  6. export PKG_CONFIG_PATH=$HOME/usr/lib/pkgconfig:$HOME/usr/share/pkgconfig

ncurses提供了一系列的函数以便使用者调用它们去生成基于文本的用户界面,许多大名鼎鼎的软件都用到了ncurses,例如vim, screen,tmux,zsh等。并且samtools如果需要tview可视化BAM文件,也需要这个库做支持。

  1. wget ftp://ftp.invisible-island.net/ncurses/ncurses.tar.gz && tar -zxvf ncurses.tar.gz

  2. ./configure --enable-shared --prefix=$HOME/usr

  3. make && make install

Libevent是一个用C语言编写的、轻量级的开源高性能事件通知库, 后续安装tmux时候需要这个依赖库。

  1. # libevent

  2. cd src

  3. wget https://github.com/libevent/libevent/releases/download/release-2.1.8-stable/libevent-2.1.8-stable.tar.gz

  4. tar -zxvf libevent-2.1.8-stable.tar.gz && cd  libevent-2.1.8

  5. ./configure prefix=$HOME/usr && make && make install

bzip2, xz, zlib: 文件压缩相关函数库,后续samtools编译时需要。

  1. wget http://www.zlib.net/zlib-1.2.11.tar.gz

  2. tar -zxvf zlib-1.2.11.tar.gz && cd zlib-1.2.11 && ./configure --prefix=$HOME/usr && make && make install

  3. wget http://www.bzip.org/1.0.6/bzip2-1.0.6.tar.gz

  4. tar -zxvf bzip2-1.0.6.tar.gz && cd bzip2-1.0.6 && ./configure --prefix=$HOME/usr && make && make install

  5. wget https://tukaani.org/xz/xz-5.2.3.tar.gz

  6. tar -zxvf xz-5.2.3.tar.gz && cd xz-5.2.3 && ./configure --prefix=$HOME/usr && make && make install

openssl, libssh2, libcurl: 计算机之间文件传输访问相关库。其中OpenSSL是一个安全套接字层密码库,囊括主要的密码算法、常用的密钥和证书封装管理功能及SSL协议,并提供丰富的应用程序供测试或其它目的使用。libssh2是一个C 函数库,用来实现SSH2协议。libcurl主要功能就是用不同的协议连接和沟通不同的服务器.

  1. # 安装有先后

  2. # openssl

  3. wget https://www.openssl.org/source/openssl-1.0.2m.tar.gz

  4. tar -zxvf openssl-1.0.2m.tar.gz && cd openssl-1.0.2m

  5. # 这里非常神奇的居然是config,添加shared生成动态库

  6. ./config prefix=$HOME/usr shared

  7. make && make install

  8. # 卸载使用 make clean

  9. # libssh2

  10. wget https://www.libssh2.org/download/libssh2-1.8.0.tar.gz

  11. tar -zxvf libssh2-1.8.0.tar.gz && cd libssh2-1.8.0

  12. ./configure --with-libssl-prefix=$HOME/usr/ssl --prefix=$HOME/usr

  13. # libcurl

  14. wget https://curl.haxx.se/download/curl-7.56.1.tar.gz

  15. tar -zxvf curl-7.56.1.tar.gz && cd curl-7.56.1

  16. ./configure --prefix=$HOME/usr --enable-http --enable-ftp --enable-file --enable-proxy --enable-telnet --enable-libcurl-option --enable-ipv6 --with-lib --with-ssl

readline: GNU提供用于这些命令补全、搜索历史命令、行编辑快捷键等等这些人性化的交互方式的函数库,缺少这个标准库,编译的R就缺少自动补全的功能。

  1. wget http://ftp.gnu.org/gnu/readline/readline-7.0.tar.gz

  2. tar -zxvf readline-7.0.tar.gz && cd readline-7.0

  3. ./configure --prefix=$HOME/usr && make && make install

PCRE: 提供和Perl5相同语法和语义正则表达式的函数库,后续安装R用到。

  1. wget ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/pcre-8.41.tar.gz

  2. tar -zxvf pcre-8.41.tar.gz && cd pcre-8.41

  3. ./configure --enable-utf --enable-pcregrep-libz --enable-pcregrep-libbz2 --prefix=$HOME/usr

x11:X11也叫做X Window系统,X Window系统 (X11或X)是一种位图显示的视窗系统,是在 Unix 和 类Unix 操作系统,以及OpenVMS上建立图形用户界面的标准工具包和协议,并可用于几乎所有已有的现代操作系统。主要是R编译的时候要用,具体用途有待开发。

x11安装比较复杂,有很多的依赖库,因此需要先安装xtrans, xextproto, xcb(lib,xcb-proto, libpthread-subs), kbproto,xproto,inputproto。但是编译很容易,仅提供下载链接

  1. https://www.x.org/releases/X11R7.7/src/lib/xtrans-1.2.7.tar.gz

  2. https://www.x.org/releases/X11R7.7/src/proto/xextproto-7.2.1.tar.gz

  3. https://www.x.org/releases/X11R7.7/src/proto/kbproto-1.0.6.tar.gz

  4. https://www.x.org/releases/X11R7.7/src/proto/xproto-7.0.23.tar.gz

  5. https://www.x.org/releases/X11R7.7/src/proto/inputproto-2.2.tar.gz

  6. https://www.x.org/releases/X11R7.7/src/xcb/libpthread-stubs-0.3.tar.gz

  7. https://www.x.org/releases/X11R7.7/src/xcb/xcb-proto-1.7.1.tar.gz

  8. https://www.x.org/releases/X11R7.7/src/xcb/libxcb-1.8.1.tar.gz

  9. https://www.x.org/releases/X11R7.7/src/lib/libSM-1.2.1.tar.gz

  10. https://www.x.org/releases/X11R7.7/src/lib/libICE-1.0.8.tar.gz

  11. https://www.x.org/releases/X11R7.7/src/lib/libXt-1.1.3.tar.gz

相当于人工检查依赖环境,仅仅是繁琐而已,并不困难

  1. # 安装X11

  2. wget -4 https://www.x.org/releases/X11R7.7/src/lib/libX11-1.5.0.tar.gz

  3. tar -zxvf libX11-1.5.0.tar.gz && cd libX11-1.5.0

  4. ./configure --prefix=$HOME/usr && make && make install

编译案例

安装zsh

zsh或许可以认为是最好的shell,用过zsh的人都不会想着bash了。不过zsh自定义配置,可供选择的插件以及主题实在是太多,因此一定要搭配oh-my-zsh。zsh依赖ncurses.

  1. wget -O zsh.tar.gz https://sourceforge.net/projects/zsh/files/latest/download

  2. tar -zxvf zsh.tar.gz && cd zsh

  3. export CPPFLAGS="-I$HOME/usr/include/" LDFLAGS="-L$HOME/usr/lib"

  4. ../configure --prefix=$HOME/usr --enable-shared

  5. make && make install

由于没有root权限,无法使用 chsh,只能通过在 ~/.bashrc添加 exec $HOME/usr/bin/zsh -l保证登陆的时候自动切换成zsh。其次, zsh搭配oh-my-zsh才完整, 只不过这里只能手动安装了。

  1. # 从github上克隆oh-my-zsh

  2. git clone git://github.com/robbyrussell/oh-my-zsh.git ~/.oh-my-zsh

  3. # 用oh-my-zsh的zsh配置文件替代

  4. cp ~/.oh-my-zsh/templates/zshrc.zsh-template ~/.zhsrc

  5. # 安装一些字体, 不然一些主题会显示异常

  6. cd src

  7. git clone https://github.com/powerline/fonts.git --depth=1

  8. cd fonts && ./install.sh

重启一下终端,后面根据需要调整配置文件里的参数。

编译tmux

tmux和screen类似,也是文本终端神器, 依赖于libevent和ncurses.

  1. export CPPFLAGS="-I$HOME/usr/include -I$HOME/usr/include/ncurses"

  2. export LDFLAGS="-L$HOME/usr/lib -L$HOME/usr/lib64"

  3. mkdir -p src && cd src

  4. git clone https://github.com/tmux/tmux.git

  5. cd tmux

  6. sh autogen.sh

  7. ./configure --prefix=$HOME/usr

  8. make && make install

编译R语言

由于我自己编译完全版的GCC套餐,很多之前的gfortran不存在的问题也就不存在了(管理员安装了Java)。此外,R还需要gnu readline, pcre > 8.2, x11。当然这些函数包都在之前安装好了。

  1. wget https://cran.r-project.org/src/base/R-3/R-3.4.2.tar.gz

  2. tar -zxvf R-3.4.2.tar.gz  && cd R-3.4.2/

  3. ./configure --prefix=$HOME/R

  4. make && make install


R configure

到此,我可以说Linux平台下即便我没有root权限,也没有多少软件包是我所不能手工编译。

如果你用过conda,你可能会好奇为啥我不用conda安装这些软件?

子曰:闻之我也野,视之我也饶,行之我也明

赞(0) 打赏
未经允许不得转载:医学SCI科研之家 » 无root权限编译R语言,或许只是一个体力活
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

meta分析、生信分析

meta、生信交流群综合科研交流群