电子书《Speech and Language Processing》语音与语言处理,第三版(草稿)。
web.stanford.edu/~jurafsky/slp3/
斯坦福教授Dan Jurafsky 和 James H. Martin的著作。书籍主页可以直接下载pdf文件,还有讲座ppt可以下载。内容大概分为三部分:
🌟基础算法:包括正则表达式、分词、编辑距离、N元语言模型、朴素贝叶斯、逻辑回归、向量语义与嵌入、神经网络、RNNs和LSTMs、Transformer、大型语言模型等内容。
🌟自然语言处理应用:涵盖机器翻译、问答系统、信息检索、聊天机器人与对话系统、自动语音识别与文本转语音等应用。
🌟语言结构的标注:包括词性和命名实体的序列标注、上下文无关文法与成分句法分析、依存句法分析、信息抽取、语义角色标注、情感词典、指代消解与实体链接、话语连贯性等内容。