- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《自然语言处理技术与应用》课程标准
课程概述
课程性质
本课程是高等职业院校人工智能专业的专业核心课之一,是该专业的一门必修课,是一门理论和实践相结合的课程。
课程任务
本课程主要针对人工智能算法工程师、人工智能系统运维工程师、人工智能技术支持工程师、人工智能训练师、数据标注工程师等岗位开设,主要任务是培养学生在自然语言处理的需求分析、方案制定、文本数据处理、文本分类聚类算法选型、应用的能力。
课程设计思路
本课程以高等职业院校“人工智能技术应用”专业的学生就业为导向,将教学内容与工作岗位对专业人才的知识要求与技能要求结合起来,将项目实践提升到一个较重要的位置,按照“理论—项目构建—项目实施”的组织结构进行课程设计。
本课程共分5个项目,分别是基础NLP、文本分类与聚类、情感分析、中文命名实体识别、机器翻译,通过5个项目系统介绍了自然语言处理的实践技术。
课程在介绍自然语言处理技术应用后,重点阐述自然语言处理技术的项目开发,突出了自然语言处理技术在实际项目中的应用。在内容的编排上淡化了学科性,避免介绍过多偏深的理论,而注重自然语言处理技术在具体运用中的要点、方法和技术操作,逐层分析和自然语言处理技术进行实际项目的开发。
前后续课程
序号
前续课程名称
前续课程为本课程支撑的主要能力
1
机器学习技术应用
机器学习应用能力
2
深度学习技术应用
深度学习技术应用能力
序号
后续课程名称
本课程为后续课程支撑的主要能力
1
智能语音与对话机器人
智能语音对话机器人开发能力
课程目标
(一)总体目标
本课程要求学习了解自然语言处理技术,培养学生具备高职人工智能技术专业所需要的自然语言处理的基本知识和技能,熟悉并能使用人工智能相关技术进行自然语言处理的相关操作,具备对人工智能技术领域出现的新技术、新思想进一步学习的能力。
希望通过本课程的学习,加深对自然语言处理技术的理解,为进一步研究和从事人工智能技术实践提供良好的基础和参考。
(二)具体目标
知识目标
了解常见的中文分词方法
了解TF-IDF算法思想
了解独热编码、Distributed representation、word2Vec、doc2vec的原理
了解分类、聚类的方法
了解情感分析方法
了解命名实体识别的定义及过程
了解机器翻译方法
能力目标
具备文本处理、解析、向量化的能力
具备划文本分类与聚类的能力
具备情感分析的能力
具备中文命名实体识别模型构建和训练的能力
具备中英翻译模型构建和训练的能力
具备使用yolov3定位图片中文字区域的能力
具备使用mediapie手势检测功能的能力
素质目标
培养谦虚、好学、勤于思考、认真做事的良好习惯严谨的开发流程和正确编程思路;
培养团队协作能力相互沟通、互相帮助、共同学习、共同达到目标;
提升自我展示能力讲述、说明、表述和回答问题;
培养自我学习能力利用书籍或网络上的资料帮助解决实际问题。
课程内容及情境设计
本课程以基础NLP、文本分类与聚类、情感分析、中文命名实体识别、机器翻译5个小项目为载体,与企业合作设计选取16个典型工作任务,根据岗位工作任务要求,确定学习任务内容;本课程采取项目驱动教学模式,以学生为主体,以任务为导向组织教学考核。
项目一 基础NLP
单元序号
第1单元
项目名称
基础NLP
培养能力
1. 具备文本预处理的能力
2. 具备中文分词的能力
3. 具备关键词提取的能力
4. 具备文本向量化的能力
项目任务
知识要求
技能要求
学时
文本预处理
了解自然语言处理的基本概念,包括应用领域和基本技术
了解NLTK的使用方法
能够正确使用python函数进行字符串处理
能够使用正则表达式进行字符串匹配
能够完成利用NLTK库做英文文本处理
2
中文文本处理与解析
了解词性标注的基本概念
了解常用的分词工具
了解常见的中文分词方法
能够根据样例编写基于规则方法的分词代码
能够使用jieba库进行默认分词和自定义分词
能够掌握去除停用词的方法
能够掌握jieba库进行词性标注的方法
2
关键词提取
了解TF-IDF算法思想
了解PageRank算法思想
了解常见的关键词提取算法,包括有监督和无监督算法
能够掌握关键词提取技术;
掌握TF-IDF算法和抽取流程
掌握TextRank算法和抽取流程
2
文本向量化
了解文本向量化的概念与意义
了解独热编码、Distributed representation、word2Vec、doc2vec的原理
了解常见语料库
能够查找并下载相应的语料资源
能够使用jieba、genism等工具进行数据预处理
能够使用gensim的函数进行文本向量化模型训练
能够利用已训练的模型进行测试
2
教学情境
项目驱动、演示、边讲边做、自学探究
项目总学时
16
项目二 文本分类与聚类
文档评论(0)