- 全面解析RNN,LSTM,Seq2Seq,Attention注意力机制 - CristianoC的文章 - 知乎 https://zhuanlan.zhihu.com/p/135970560
- Attention用于NLP的一些小结 - susht的文章 - 知乎 https://zhuanlan.zhihu.com/p/35739040
- 简单的交叉熵损失函数,你真的懂了吗? - 红色石头的文章 - 知乎 https://zhuanlan.zhihu.com/p/38241764
- https://arxiv.org/pdf/1606.07792.pdf Wide & Deep Learning for Recommender Systems, Google App store 2016
- https://arxiv.org/pdf/1703.04247.pdf DeepFM: A Factorization-Machine based Neural Network for CTR Prediction, Huawei&Huagongda 2017