使用fairseq从头训练一个中英神经机器翻译模型 Posted on January 16, 2021 前言 本文在news-commentary-v15语料上训练了中英NMT模型,并将整个流程,包括工具和数据的准备、数据的预处理、训练及解码,以及中途遇到的问题和解决方案记录在此,希望能够给予别人一些帮助。 [Read More] Tags: 机器翻译
Linux 使用记录 Posted on January 15, 2021 前言 目前我采用了轻薄本+服务器的科研模式,笔记本系统是windows10,使用的一套软件是Xshell6(连接服务器) + WinSCP(文件传输) + Notepad++(文件编辑),将常用技巧记录如下。 [Read More] Tags: 系统与环境
A index - From word2vec, Transformer to NLP SOTA Posted on December 15, 2020 前言 之前看论文总想留下点什么痕迹(比如写个笔记),但是发现有时候这也算是一种造轮子的行为,因为每个划时代的研究早就有无数人(包括大牛)写过总结,且已经总结的很好了。所以我反思了一下,这篇博客便诞生了,主旨是不为每篇经典单独造一个轮子,而是做一个索引,指向那些漂亮优秀的轮子(包括源码、总结等)。而我自己,只附上我对每一个模型的一段话总结(我希望每段话都是经过深思熟虑,总结到位的)。 [Read More] Tags: 自然语言处理
Backward Propogation Through Time (BPTT) in RNN Posted on December 14, 2020 前言 RNN及其变种是一代经典,有必要认真学习。在推导了RNN的反向传播算法(BPTT)后,我发现一切反向传播算法都有普遍的规律:误差项都是有从后到前的递推关系的。RNN按时间步递推,其实与DNN中按层递推非常相似。在这里将推导过程记录下来,方便回忆,也希望能给别人一点启发。 [Read More] Tags: 深度学习
Google Colab使用记录 Posted on December 12, 2020 前言 本文介绍一个较良心的算力平台:Google Colab,记录一些使用技巧和感受,防止后来人踩坑。 [Read More] Tags: 系统与环境