基于深度学习的学生异常行为智能预测系统.pdfVIP

下载本文档

3
0
约2.94千字
约 6页
2023-03-27 发布于河南
举报
版权申诉

基于深度学习的学生异常行为智能预测系统.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于深度学习的学生异常行为智能预测系统研究一、项目的研究目标与研究内容 1.1 项目的研究目标和主要内容研究目标：设计并实现以学生 “画像”特征库为核心，基于深度学习的学生异常行为智能预测系统。通过特征库的多维行为特征，建立分层模型，使用深度学习算法建立学生行为预测模型，并开发完整的具有并行化能力的学生异常行为预测系统。近年来，校园安全事故的频繁发生，引起了社会各界的高度重视，在智慧校园的建设中，校园安全中学生异常行为预测扮演着十分重要的角色，因此，本次课题具有较高的普适性和应用推广性。主要研究内容：（1）数字化校园建设积累了丰富的学生行为数据，以这些数据为基础分析系统业务流程，设计智能预测系统结构，构建学生“画像”特征库。（2）设计基于深度学习的学生行为细分模型，并对传统的 K-means 聚类算法从初始聚类中心的选择和聚类数量的确定两个方面进行改进。（3）构建Spark 大数据生态环境，并在上述理论研究基础上开发基于Spark 的学生异常行为智能预测系统。功能指标：数据融合：提供学生数据融合功能，能够将学生成绩、教务考勤、宿舍门禁、图书馆借阅、网络日志等多种数据进行统一数据抽取、数据转换与清洗，便于数据共享。学生画像：从海量学生行为数据中抽取标签形成多维度认知,形成学生信息一张图，便于老师全方面地了解学生信息。异常行为预测：能够对学生生活或学习因素导致的心理异常进行预测，便于老师加强心理辅导，防患学生产生过激行为。智能检索：提供学生信息的智能检索服务，可进行模糊与关联搜索，同时可对搜索词进行语义理解和意图识别，并能进行自动纠错。性能指标：系统扩展性：能够实现与最新版本的主流数据库产品（如IBM DB2、 Oracle、MySQL 等）的数据互通；满足云平台架构要求，支持虚拟化资源的横向扩展。数据可靠性：数据采集清洗后有效信息不低于 90%；系统间、设备间的信息交互准确率不低于90%；学生异常行为预测准确率不低于 80% 数据处理能力：支持实时存储、检索，数据延时误差小于1 秒；终端支撑能力：支持多种终端软件的通信连接及信息交互；系统支持同时在线用户数不少于3 人。 1.2 项目的研究方法和技术路线 1. 构建学生 “画像”特征库目前，随着各高校数字化校园建设的不断深入，积累了丰富的学生行为数据，包括学生成绩、教务考勤、宿舍门禁、图书馆借阅、网络日志等多种数据。通过对学生大数据进行挖掘和关联分析，分别从学生消费规律、生活习惯指标、学生成绩、日常行为轨迹等多方面挖掘分析出学生的学习生活行为信息，构建学生 “画像”特征库。 2. 构建基于深度学习的学生行为预测模型深度学习是机器学习的一个分支，许多传统机器学习算法学习能力有限，数据量的增加并不能持续增加学到的知识总量，而深度学习系统可以通过访问更多数据来提升性能，通过发现经验数据中错综复杂的结构进行学习。本次研究通过提取学生多维行为特征，建立分层模型，利用回归等方法建立学生行为预测模型，预测学生的行为。在对学生行为进行分类时，传统的K-means 聚类算法通过计算类内样本点到类簇中心点的距离的平方和来评估聚类的效果，它只关心了类簇内各样本的相似性，而缺乏考量聚类结果类簇之间的相异性，本系统在K-means 的基础上进行优化，提出一种基于密度优化的聚类算法，能有效提高分类的准确度。 3. 实现算法并行化 Spark 是由UC Berkeley AMP lab 所开源的类hadoop MapReduce 的通用分布式并行计算框架。不同于MapReduce，优化了MapReducer 的中间结果全部持久化到磁盘的过程，减少了少量数据迭代式处理过程中的IO 瓶颈，很大程序上提高了Spark 对大数据处理的实时性，是基于内存的大数据并行计算框架。由于本文针对学生进行聚类细分数据量较大，同时为了以后的更大规模数据的处理能力，保证系统的可扩展性，本系统设计并实现模型算法在Spark 上的并行化，提高算法的运行效率。 1.3 项目拟解决的关键问题和可能的创新点 1、在构建学生“画像”过程中，针对文本的挖掘目标对数据进行转换，采用统计学、聚类和分类方法将数据进行压缩、泛化和规范化，从而能提高挖掘质量。 2、基于深度学习算法，融合学生多维行为特征，建立分层学生行为预测模型，同时，结合数据自身特点，提出一