AI课程培训-NLP项目实战课程介绍

NLP技术背景介绍

当今世界正在发生前所未有的深刻变化。科技进入快速发展轨道,世界经济进入新动能转换关键时期,中国经济进入高质量发展阶段。在此背景下,人工智能(AI)成为新一轮科技革命和产业变革的重要推动力,人工智能与各行各业深度融合,推动产业智能化转型升级。因此,人工智能技术的创新和应用场景在广度和深度上的进一步拓展具有重要意义。

NLP技术背景介绍

2017年7月,国务院印发《新一代人工智能发展规划》(国发[2017]35号),明确建立涵盖“知识计算引擎和知识服务”的下一代人工智能关键共性技术体系, “自然语言处理”,特别是“着眼于知识处理、深度搜索、视觉交互等方面的突破,实现对不断增长的知识的自动获取;具备概念识别、实体发现、属性预测、知识演化建模、关系挖掘能力;最终形成一个多源、多学科、多数据类型、数十亿实体规模的跨媒体知识图谱。”此外,国发(2017)35号着眼于“突破自然语言的语法逻辑、字符概念表示、深度语义分析,促进人机有效沟通和自由交互,实现智能理解”。自动生成多风格、多语言、多领域的自然语言。”

语言是区分人类与其他生物的最基本特征之一。它是人类思想的载体,是交流的工具。知识是人类在实践中认识世界的结果,是人类智慧的结晶。语言是保存和传递知识的工具。从7000多年前的甲湖符号到今天的互联网文字,语言和知识一直在人类进步中发挥着重要作用。

自然语言表达方式灵活多义,难以分析语言结构和理解语义。由于数据复杂、异构,知识形式多样,机器获取和应用大规模知识面临巨大挑战。因此,研究如何使计算机掌握知识,理解和运用语言,对人工智能的进一步发展至关重要。

自然语言处理的研究对象从词、短语、句子发展到文本,研究方向从语言分析、语言理解、语言生成、知识图谱、机器翻译,到深度语义理解等。这符合应用的发展趋势。以搜索为例,早期进行了基于关键字的搜索。后来随着移动智能终端的普及,人们开始直接用手机说话进行搜索。新出现的动态消息需要机器理解用户和文本内容,从而向用户推荐合适的信息。而对于另一个典型的 NLP 应用机器翻译,从文本翻译,到语音和图像翻译,现在同声传译,技术的进步使得机器翻译的应用更深入、更广泛地渗透到各个行业。

时间

内容

学时

考评

第一部分:

1.1 Text data collection using APIs

8个学时

数据获取

1.2 Reading a PDF file in Python

1.3 Reading a Word document

1.4 Reading a JSON object

1.5 Reading an HTML page and HTML parsing

1.6 Regular expressions

1.7 String handling

1.8 Web scraping

第二部分:

2.1 将文本数据转换为小写

11个学时

文本数据处理

2.2 删除标点符号

2.3 删除停止词

2.4 标准化文本

2.5 更正拼写

2.6 标记文本

2.7 词干分析

2.8 lemmatization,即通过考虑词汇提取词根的过程。例如,good、better或best被柠檬化为good。

2.9 探索文本数据

2.10 处理表情符号和表情符号

2.11 构建文本预处理管道

第三部分:

3.1 特征工程方法之独热编码

10个学时

文本特征工程

3.2 使用计数矢量器将文本转换为要素

3.3 生成n-gram

3.4 生成共现矩阵

3.5 Hash Vectorizing

3.6 使用TF-IDF将文本转换为要素

3.7 实现单词嵌入Word Embeddings

3.8 fastText(word2vec提升版本)

3.9 State-of-the-Art Embedding 最先进词嵌入技术

• GloVe Embedding

• ELMo

• Sentence encoders

AI课程培训-NLP项目实战课程介绍

• doc2vec

• Sentence-BERT

• Universal Encoder

• InferSent

• Open-AI GPT

第四部分

4.1. Noun phrase extraction 名词短语抽取

11个学时

自然语言处理技术

4.2. Text similarity 文本相似度分析

4.3 Parts of speech tagging 词性标注

4.4 Information extraction – NER – entity recognition 信息收取,命名实体识别

4.5 Topic modeling 主题模型

4.6 Text classification 文本分类

4.7 Sentiment analysis 情感分析

4.8 Word sense disambiguation 词义消歧

4.9 Speech recognition and speech to text 语音识别和语音转文本

4.10 Text to speech 文本转语音

4.11 Language detection and translation 语言检测和翻译

第五部分:项目实战案例

4.1 Consumer complaint classification 多类分类

16个学时

5.2 Customer reviews sentiment prediction 客户评论情绪预测

5.3 Data stitching using record linkage 数据拼接

5.4 Text summarization for subject notes 文本摘要

5.5 Document clustering 文档聚类/文本聚类

5.6 Search engines and learning to rank 搜索排名

5.7 Fake news detection 虚假新闻检测

5.8 Movie genre tagging电影类型标记,多标签分类

第六部分:

6.1 Information retrieval using deep learning 基于深度学习的信息抽取

12个学时

NLP深度学习

6.2 Text classification using CNN, RNN, LSTM 利用CNN。RNN,LSTM的文本分类

6.3 Predicting the next word/sequence of words using LSTM for email 基于LSTM的邮件预测

6.4 Stack Overflow question recommendation 堆栈溢出问题建议

第七部分:

7.1 Recent advancements in text to features or distributed representations文本到特征或分布式表示的最新进展

2个学时

总结及NLP最新技术发展介绍

7.2 Advanced deep learning for NLP NLP高级深度学习技术

7.3 Reinforcement learning applications in NLP 强化学习在NLP的应用

7.4 Transfer learning and pre-trained models迁移学习和预训练模型

7.5 Meta-learning in NLP自然语言处理中的元学习

7.6 Capsule networks for NLP用于NLP的胶囊网络

7.7 summary课程总结回顾

本课程为线上培训课程,通过腾讯视频会议授课,可回看;

课程结束可以发放人工智能行业认证证书;

授课老师为行业资深代码工程师,授课专业认真,答疑详尽;

完成学习学员可推荐实习及工作;

其他疑问欢迎咨询Johnson老师,微信:18101625823,