Yuchen Han

使用fairseq从头训练一个中英神经机器翻译模型

Posted on January 16, 2021

前言本文在news-commentary-v15语料上训练了中英NMT模型，并将整个流程，包括工具和数据的准备、数据的预处理、训练及解码，以及中途遇到的问题和解决方案记录在此，希望能够给予别人一些帮助。 [Read More]

Tags: 机器翻译

Linux 使用记录

Posted on January 15, 2021

前言目前我采用了轻薄本+服务器的科研模式，笔记本系统是windows10，使用的一套软件是Xshell6(连接服务器) + WinSCP(文件传输) + Notepad++(文件编辑)，将常用技巧记录如下。 [Read More]

Tags: 系统与环境

A index - From word2vec, Transformer to NLP SOTA

Posted on December 15, 2020

前言之前看论文总想留下点什么痕迹(比如写个笔记)，但是发现有时候这也算是一种造轮子的行为，因为每个划时代的研究早就有无数人(包括大牛)写过总结，且已经总结的很好了。所以我反思了一下，这篇博客便诞生了，主旨是不为每篇经典单独造一个轮子，而是做一个索引，指向那些漂亮优秀的轮子(包括源码、总结等)。而我自己，只附上我对每一个模型的一段话总结(我希望每段话都是经过深思熟虑，总结到位的)。 [Read More]

Tags: 自然语言处理

Backward Propogation Through Time (BPTT) in RNN

Posted on December 14, 2020

前言 RNN及其变种是一代经典，有必要认真学习。在推导了RNN的反向传播算法(BPTT)后，我发现一切反向传播算法都有普遍的规律：误差项都是有从后到前的递推关系的。RNN按时间步递推，其实与DNN中按层递推非常相似。在这里将推导过程记录下来，方便回忆，也希望能给别人一点启发。 [Read More]

Tags: 深度学习

Google Colab使用记录

Posted on December 12, 2020

前言本文介绍一个较良心的算力平台：Google Colab，记录一些使用技巧和感受，防止后来人踩坑。 [Read More]

Tags: 系统与环境