- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《自然语言处理技术及应用》课程标准
【课程名称】自然语言处理技术及应用 【课程编码】
【课程类别】专业基础课
【适用专业】人工智能、大数据技术、计算机等相关专业
【授课单位】 【总学时】64
【编写执笔人】 【编写日期】
一、课程定位和课程设计
1.1课程性质与作用
本课程是高等职业院校人工智能、大数据技术、计算机等相关专业的核心课程之一,是一门理论与实践结合的课程。通过学习本课程,学生能够掌握自然语言处理的基本流程、基本知识和基本性质,认识自然语言处理的建模和算法过程,并学会运用现代信息技术获取相关信息以及解决自然语言处理问题的方法等,为今后的学习和将来就业奠定坚实的基础。
1.2课程设计思路
本课程以学生就业为导向,将教学内容与工作岗位对专业人才的知识要求与技能要求结合起来,将项目实践提升到一个较重要的位置,按照“理论—项目构建—项目实施”的组织结构进行课程设计。
课程在介绍自然语言处理技术应用后,重点阐述自然语言处理技术的项目开发,突出了自然语言处理技术在实际项目中的应用。在内容的编排上淡化了学科性,避免介绍过多偏深的理论,而注重自然语言处理技术在具体运用中的要点方法和技术操作,逐层分析和自然语言处理技术进行实际项目的开发。
二、课程目标
2.1知识目标
理解自然语言处理的概念。
了解自然语言处理的应用领域和自然语言处理的3个层面。
了解机器学习、深度学习与自然语言处理之间的关系。
掌握用于自然语言处理的机器学习常用算法。
掌握自然语言处理的一般流程。
了解自然语言工具包NLTK。
了解语料库及语料库的特点。
了解语料库的类型及其构建原则。
掌握获取NLTK中的语料库与网络在线语料库的基本方法。
掌握正则表达式中常用的函数和元字符。
理解中文分词的基本概念。
掌握常用的基于规则的分词方法。
掌握常用的基于统计的分词方法。
理解词性标注的基本概念。
了解词性标注的规范。
理解命名实体识别的基本概念。
理解CRF模型的基本原理。
理解关键词提取的基本概念。
掌握关键词提取算法TF-IDF和TextRank。
掌握常见的主题模型算法LSA和LDA。
了解词云的基本概念与生成方法。
理解文本向量化的基本概念。
了解文本离散化表示的基本方法。
掌握Word2Vec和Doc2Vec模型的基本原理。
掌握CBOW模型的训练过程。
了解Word2Vec和Doc2Vec模型的区别。
理解句法分析的基本概念。
掌握句法分析任务的基本类型。
了解句法分析常用的数据集和评测方法。
掌握PCFG算法的基本原理。
掌握使用移进-归约算法进行句法分析的方法。
理解语义分析的基本概念。
掌握词义消歧的方法。
理解格语法的基本概念。
掌握基于统计机器学习技术的语义角色标注的过程。
掌握语义网络的基本概念和推理过程。
了解概念依存的基本概念。
了解情感分析的基本概念和主要内容。
掌握基于情感词典的情感分析流程。
掌握基于机器学习的情感分析流程。
掌握长短期记忆神经网络、Seq2Seq模型和Attention机制的基本原理。
掌握语料库数据预处理的方法。
掌握自然语言处理项目的实施流程。
进一步掌握循环神经网络、Seq2Seq模型和Attention机制的基本原理。
2.2技能目标
能够成功搭建自然语言处理的开发环境。
能够使用JupyterNotebook编写简单程序。
能够编写程序,构建本地语料库。
能够使用正则表达式进行字符过滤。
能够使用jieba进行分词和词性标注。
能够使用CRF模型进行中文命名实体识别。
能够使用TF-IDF、TextRank和LDA算法进行关键词提取。
能够使用WordCloud库生成词云。
能够使用基于统计的方法实现自动文摘。
能够使用Word2Vec和Doc2Vec模型实现文本向量化。
能够基于Word2Vec和Doc2Vec模型计算新闻文本的相似度。
能够使用PCFG算法进行中文句法分析。
能够使用LTP模型进行中文依存句法分析。
能够使用LTP模型进行语义角色标注。
能够构建语义网络并使用语义网络进行语义分析。
能够使用基于情感词典的分析方法进行文本情感分析。
能够使用基于机器学习的分析方法进行文本情感分析。
能够使用基于长短期记忆神经网络进行文本情感分析。
能够构建Seq2SeqAttention机制的模型。
能够保存训练好的模型,并能将保存好的模型恢复。
能够配置训练模型过程中的各种参数。
2.3素养目标
学习自然语言处理基础知识,加强对新技术的了解,培养勇于尝试的精神。
了解时代新科技,激发学习兴趣和创新思维,增强民族自信心。
夯实基础,培养一丝不苟的工作态度,增强积极主动寻求解决方法的意识。
增强创新意识,提高选择合适方法解决不同问题的能力。
掌握专业领域的知识和技能
文档评论(0)