时间规定:

  • 2018.12.07-2018.02.15
  • 能力养成:

  • linux, shell
  • python, c++(会多少算多少)
  • tensorflow, keras, pytorch(tf优先)
  • CNN, RNN(LSTM), BRNN, Seq2Seq, RL, Attention, fastText, TextCNN, TextRNN, TextRNN+Attention, TextRCNN(CNN+RNN)
  • LR, SVM, RF, NB, CRF, LDA, XGB等
  • 分词,新词发现,词性标注,短语识别,句法分析,语义角色标注,词向量理解,图embedding,NER,tcp-ip协议
  • 文本分类+聚类,主题模型,命名实体识别,情感分析,意图发现,知识推理,语音识别,机器翻译,自动问答
  • Hadoop / Spark
  • Hive / Mysql
  • 数据结构算法
  • kaggle(文本分类):0.9872那个
  • 可行性项目:评论文本分类(黑词参考:https://github.com/fighting41love/funNLP),机器问答(体育),
05-11 08:05