使用Multi-head Self-Attention进行自动特征学习的CTR模型https://blog.csdn.net/u012151283/article/details/85310370nlp中的Attention注意力机制+Transformer详解https://zhuanlan.zhihu.com/p/53682800