自然语言处理是研究如何让计算机处理、理解及运用人类语言(中文、英文等),实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言理解的本质是结构预测。自然语言处理属于人工智能的一个重要分支,是计算机科学、语言学、统计学和数学的交叉学科。
搜索引擎、个人助理、机器翻译、机器阅读、智能问答、聊天机器人、知识图谱、语义搜索、机器阅读、舆情监控与分析、推荐系统、文本关键词抽取、文本自动摘要这些都需要自然语言处理技术。
反正就是现在NLP特别火,对于学习建议,首先需要学一下ML(机器学习)、DL(深度学习)、RL(强化学习);可以去研究一两个优秀开源项目,这些开源项目可以去github上找,GitHub上面牛人很多,有很多很好的开源项目。比如:
考虑字的词表示学习算法
GitHub - Leonard-Xu/CWE
网络表示学习
文本增强的网络表示学习算法
GitHub - albertyang33/TADW: code for IJCAI2015 paper"Network Representation Learning with Rich Text Information"
跨语言词表示学习算法
Learning Cross-lingual Word Embeddings via MatrixCo-factorization
主题增强的词表示学习算法
GitHub - largelymfs/topical_word_embeddings: A demo code fortopical word embedding
可解释的词表示学习算法
GitHub - SkTim/OIWE: Online Interpretable Word Embeddings
国内一个NLP工具:哈工大LTP:/
建议去研读一些最新的经典的论文比如ACL、EMNLP、COLING、CCL等,
推荐几本书关于学习自然语言处理的,首先是李航老师的《统计学方法》,还有《机器学习实战》、《Python自然语言处理》