语音作为多模态数字表型用于基于多任务大语言模型的精神健康预测-计算机科学-多模态语音分析-多任务学习-大语言模型-心理健康预测.pdfVIP

语音作为多模态数字表型用于基于多任务大语言模型的精神健康预测-计算机科学-多模态语音分析-多任务学习-大语言模型-心理健康预测.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

语音作为多模态数字表型用于基于多任务大

语言模型的精神健康预测

1*1*23,45,63,5,6

MaiAli,ChristopherLucasius,TanmayP.Patel,MadisonAitken,JacobVorstman,PeterSzatmari,

61

MarcoBattaglia,DeepaKundur

1

2DivisionofEngineeringScience,UniversityofToronto,Toronto,Canada

3CundillCentreforChildandYouthDepression,CentreforAddictionandMentalHealth,Toronto,Canada

4DepartmentofPsychology,YorkUniversity,Toronto,Canada

本5TheHospitalforSickChildren,Toronto,ON,Canada

译6DepartmentofPsychiatry,UniversityofToronto,Toronto,Canada

中Emails:{maia.ali,christopher.lucasius,tanmay.patel}@mail.utoronto.ca

2aitken@yorku.ca,jacob.vorstman@sickkids.ca,{peter.szatmari,marco.battaglia}@utoronto.ca,dkundur@ece.utoronto.ca

v

2

2

8摘要—语音是一种非侵入性的数字表型,可以为心理健康抑郁通常在12至18岁之间出现,有20%的青少

3状况提供有价值的洞察,但通常被视为单一模态。相比之下,我年到18岁时经历过一次重性抑郁发作[3]。由生物和生

2

5.们提议将患者语音数据视为一种用于抑郁检测的三模态多媒体活方式因素驱动的睡眠障碍与抑郁症及自杀意念密切

0数据源。本研究探索了基于大型语言模型架构在多模态环境中相关。值得注意的是,睡眠剥夺独立增加了自杀倾向的

5进行语音为基础的抑郁预测潜力,该环境整合了从语音衍生出

2的文本、声学地标和声音生物标志物。青少年抑郁症是一个重风险,每少睡一小时就会使自杀念头增加11%[3]。鉴

:

v大的挑战,并且经常与其他多种疾病共病,如自杀意念和睡眠于这些状况之间的双向关系,在抑郁筛查中整合睡眠

i

x障碍。这为我们通过同时预测抑郁、自杀意念和睡眠障碍使用和自杀倾向评估可能会提高早期检测和干预的效果。

r

a多模态公式提供了将多任务学习(MTL)整合到研究中的额外

机会。我们还提出了一种纵向分析策略,该策略建模多个临床A.多模态人工智能驱动的心理健康护理的必要性

互动的时间变化,使得能够全面理解状况的发展进程。我们的

建议方法,具有三模态、纵向的多任务学习特性,在抑郁症早语音提供了一种非侵入性且令人惊讶的多模态来

期预警数据集上进行了评估。它实现了70.8%的平衡准确率,源,用于评估心理健康,允许提取语言(词汇选择、句

这高于每个单模态、单一任务和非纵向的方法。法)和副语言(语调、音高、节奏)特征[4]。研究表

IndexTerms—多模态语音分析,多任务学习,大型语言明,患有抑郁症和自杀倾向的个体表现出独特的语音

模型,心理健康预测特征,包括较慢的说话速度、较长的停顿以及增加的单

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档