Linux 使用记录

前言 目前我采用了轻薄本+服务器的科研模式,笔记本系统是windows10,使用的一套软件是Xshell6(连接服务器) + WinSCP(文件传输) + Notepad++(文件编辑),将常用技巧记录如下。 [Read More]

A index - From word2vec, Transformer to NLP SOTA

前言 之前看论文总想留下点什么痕迹(比如写个笔记),但是发现有时候这也算是一种造轮子的行为,因为每个划时代的研究早就有无数人(包括大牛)写过总结,且已经总结的很好了。所以我反思了一下,这篇博客便诞生了,主旨是不为每篇经典单独造一个轮子,而是做一个索引,指向那些漂亮优秀的轮子(包括源码、总结等)。而我自己,只附上我对每一个模型的一段话总结(我希望每段话都是经过深思熟虑,总结到位的)。 [Read More]

Backward Propogation Through Time (BPTT) in RNN

前言 RNN及其变种是一代经典,有必要认真学习。在推导了RNN的反向传播算法(BPTT)后,我发现一切反向传播算法都有普遍的规律:误差项都是有从后到前的递推关系的。RNN按时间步递推,其实与DNN中按层递推非常相似。在这里将推导过程记录下来,方便回忆,也希望能给别人一点启发。 [Read More]
Tags: 深度学习