3D CNNs与LSTMs在行为识别中的组合及其应用.pdfVIP

下载本文档

0
0
约1.82万字
约 5页
2025-12-03 发布于山东
举报
版权申诉

3D CNNs与LSTMs在行为识别中的组合及其应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

·28·《测控技术12017年第36卷第2期

3DCNNs与LSTMs在行为识别中的组合及其应用

秦阳，莫凌飞，郭文科，李钒

(东南大学仪器科学与工程学院，江苏南京210096)

摘要：基于机器视觉的人体运动识别在视频监控、虚拟现实、医疗护理等诸多领域发挥着重要的作用。

结合深度学习中的三维卷积神经网络和长短期记忆神经网络，提出一种融合模型，并与另外两种行为识

别模型——长效递归卷积网络和时空域卷积网络，进行了对比，利用公开的KTH数据集，进行了实验测

试。实验表明，提出的融合模型与长效递归卷积网络和时空域卷积网络相比，对于人体行为图像或视频

数据集的学习效果明显，论证了模型的泛化性能和鲁棒性。

关键词：行为识别；深度学习；神经网络；模式识别

中图分类号：TP183文献标识码：A文章编号：1000—8829(2017)02—0028—05

Combinationof3DCNNsandLSTMsandItsApplication

InActivityRecognition

QINYang，MOLing—fei，GUOWen—ke，LIFan

(SchoolofInstrumentScienceandEngineering，SoutheastUniversity，Naming210096，China)

Abstract：Humanactivityrecognitionbasedonmachinevisionplaysanimportantroleinmanyfieldssuchas

videomonitoring，virtualreality，medicalcareandSOon．Anewfusionmodelisproposedbycombiningthe3D

convolutionalneuralnetworksandlongshorttermmemoryneuralnetworkindeeplearning，andcomparedwith

theothertwoactivityrecognitionmodels，long—termrecurrentconvolutionnetworkandspatiotemporalconvolu—

tionalneuralnetwork．TestexperimentsusingpublicKTHdatahavebeendonetoprovethatthecombination

modelhasabetterlearningeffectbasedonhumanactivityimageorvideodataset，whichdemonstratesthegen—

eralizationperformanceandrobustnessofthemode1．

Keywords：activityrecognition；deeplearning；neuralnetworks；patternrecognition

人体行为识别在医疗、教育、安全等方面有着重要逐渐抽象出上层特征，在静态图像识别领域中取得惊

的研究意义。随着视频记录的推广，基于机器视觉的人的识别效果。

人类行为识别方法更具有普适性。Davis等人认为只凭借单帧的静态图像无法识别

传统的行为识别方式集中于选择人体行为的特征人类行为，应将各帧的图像连接成运动图像序列，才能

量。但是，不同的任务环境下人工选择的特征量具有充分提取视频中的行为信息¨。ElbassuoniS等人将

差异，模型参数不具备泛化性能。近几年，随着深度学CNN模型拓展到三维，即空间域的二维和时间域的一

习模型的发展，分层抽象的特征提取方式替代了人工维，利用三维卷积神经网络，分析帧图像之间时空域关

您可能关注的文档

文档评论（0）

与您共享 + 关注: 实名认证

服务提供商

我的文档主要集中的行业是石油化工和安全生产，从事石油化工行业并且取得了中级注册安全工程资格。精通炼油工艺方面的工艺、安全、设备。希望通过平台共享自己的知识和经验。

咨询作者（12人已咨询）已休息

1亿VIP精品文档

更多 >

3D CNNs与LSTMs在行为识别中的组合及其应用.pdfVIP