前言

本文介绍一个较良心的算力平台：Google Colab，记录一些使用技巧和感受，防止后来人踩坑。

1 初次使用Colab的配置

一般每天第一次打开Colab，或打开新的Notebook都需要重复如下操作：

1 选择gpu： 菜单栏 - 代码执行程序 - 更改运行时类型 - 硬件加速器 - GPU 选择GPU之后便可以用!nvidia-smi命令查看当前正使用的GPU。一般现在都是Tesla T4，很不错

2 挂载Google云端硬盘： 既可以直接鼠标点击挂载图标，也可以按照如下方式挂载：
在cell中输入：

from google.colab import drive
drive.mount('/content/drive')

运行后按提示操作即可

3 选择相应库的版本： 例： Colab默认的tensorflow版本是2.x的，如果需要使用1.x版本就需要手动切换，即在cell中输入以下代码：

%tensorflow_version 1.x

运行后重启Colab即可。
遇到没有的库，直接!pip install即可

4 切换到当前工作路径： 右键一个文件或目录，即可看到复制路径的选项，有两种方法切换到该目录：
法1： 使用%cd命令
法2： 使用os.chdir()方法

2 使用技巧

2.1 尤其要注意

在cell中，其他linux命令都可以通过在前面加!使用(如!ls)，但cd命令需要用%cd才可以
目录名中最好不要有空格。如果有空格，用到此目录名时需要在空格前加\进行转义
某些库在安装时，通常会加载到这个库的文件夹内(setup.py)，所以后续操作中要记得重新加载到自己的工作目录如%cd /content/

2.2 linux命令中使用笔记本中的变量

其中dir_path是笔记本中直接定义的变量(python str)，有以下几种方式可以在linux命令中使用他们

dir_path = "/home/foo/bar"
!cp file1 $dir_path

dir_path = "/home/foo/bar"
!cp file1 {dir_path}

#sub_dir可以是字符串，总之和dir_path连接起来应该是一个完整的路径
!cp file1 {dir_path + sub_dir} 

2.3 其他使用技巧

可以通过按 Ctrl 键，然后单击一个类名来跳转到类定义
可以使用 !bash 命令使用交互式 shell
可以同linux一样，使用 !nohup 命令，然后使用常规的 shell 命令，并在末尾添加 & 使其在后台运行。使用 !ps -ef 命令查看任务号，并用 !kill 任务号 的方式手动结束任务

3 深度学习/NLP库相关

3.1 PyTorch 1.6.0

运行安装命令，并点击“RESTART RUNTIME”按钮

!pip install torch==1.6.0+cu92 torchvision==0.7.0+cu92 -f https://download.pytorch.org/whl/torch_stable.html

import torch; print(torch.__version__); print(torch.cuda.is_available())

3.2 fairseq

# 安装
!git clone https://github.com/pytorch/fairseq
%cd fairseq
!pip install --editable ./

3.3 sentencepiece

# 安装
!sudo apt-get install cmake build-essential pkg-config libgoogle-perftools-dev
!git clone https://github.com/google/sentencepiece.git 
%cd sentencepiece
!mkdir build
%cd build
!cmake ..
!make -j $(nproc)
!sudo make install
!sudo ldconfig -v

# 使用
!/usr/local/bin/spm_encode --model=MODEL_PATH < input > output

4 Colab Pro购买感受

72元购买一个月Pro会员后，一开始的两天用的比较狠，结果直接给我禁了一天，之后就是稍微用久一点就会被禁一天。

显卡基本就是P100，多换几次可能会换到V100，但是自从Pro+出来之后，感觉根本不可能换到V100了。

总的来说，没有服务器的话稍微跑一下小实验还是可以的，大实验就算了，训半天歇一天，费心费力。有条件买Pro+的当我没说。

Google Colab使用记录

前言