- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于稀疏主成分分析的非正式语词的心理-人格特征研究Judging
文章编号:1003-0077 (2011)00-0000-00
基于稀疏主成分分析的非正式语词的心理-人格特征研究
钟毓,费定舟
(武汉大学哲学学院心理系,湖北武汉 430072 )
摘要:目的:针对社会媒体中非正式文本的数据分析经常出现的稀疏数据矩阵,在应用文本分析工具的基
础上使用稀疏主成分分析这一特征降维分析方法分析现实情况下聊天文本中非正式语词表现的认知语用特
征、描述非正式语词与人格的关系。方法:使用短文本主题模型、心理距离问卷、大五人格问卷测量人格
和背景变量,使用计算机文本分析工具对被试提供的即时聊天文本内的语词计频,使用简体中文版语词查
询与字词计数字典和认知语用学对稀疏主成分分析后非正式语词维度进行特征表征。结果:在非正式语词
降维上,稀疏主成分分析比主成分分析在因子载荷数上更稳定,在累积方差解释率上也相对更优
(24.54% 23.40% );降维所得的6 因子中“主观评价”与宜人性正相关 (r0.05=.16, p =.03 0.05 ),“随
意社交”与宜人性负相关(r0.05=-.16,p =.03 0.05 ),“认知愉悦”与性别显著正相关(r0.05=.43, p =.00 0.001 )。
结论:使用稀疏主成分分析对非正式语词的降维效果较好,并且比较简体中文版语词查询与字词计数字典
的非正式语词维度和降维后所得非正式语词维度,两者在和人格的相关上是相符的,且后者能探索出更多
信息。
关键词:文本分析;稀疏主成分分析;非正式语词
中图分类号:TP391 文献标识码:A
Judging personality by informal words: a novel meaning extraction
procedure in instant messages
Yu Zhong, Dingzhou Fei
(Psychology Department, Philosophy School, Wuhan University, Wuhan, Hubei, 430072, China)
Abstract: In this paper, a new method is presented to identify personality with dimension reduction
by sparse principal component analysis (SPCA) and meaning extraction procedure from informal
texts. Methods: Based on categories of linguistic inquiry and word count dictionary (LIWC),
informal words usage and psychological trait in instant chat is analyzed, and the relation between
informal words and personality is described. Biterm Text Model (BTM), psychological distance
questionnaire and Big Five personality questionnaire are used to measure personality and related
variables. The informal words dimensions are explained based on simplified Chinese version of
linguistic inquiry and word count dictionary and cognitive linguistic usage. Results: The results
using the SPCA have shown that the numbers of load factors gotten by the SPCA more stable than
the numbers of traditional principal component analysis(PCA), and the cumulativ
您可能关注的文档
- 合唱表演与指挥.PPT
- 同济大学传播与艺术学院2008-2009学年第一学期本科主要课程名称.PDF
- 同步造型技术在工程图学教学中的应用研究-图学学报.PDF
- 后QBQ的心态与作为-明道中学.PDF
- 向量变频器CASeries.PDF
- 含拉杆裂纹的组合转子性能退化机理-中南大学学报.PDF
- 吸力面附面层抽吸在三维高负荷扩压叶栅中的作用机制.PDF
- 呈现方式边端量化.PPT
- 呕吐与止吐药.PPT
- 员工-平安保险.PDF
- 城市更新老旧小区改造项目安全管理方案(参考范文).docx
- 第9讲:一般现在时-2025年四升五英语暑假预习练习(含答案)(译林版三起).docx
- 医疗技术规范与质量控制.pptx
- 第12讲:5AU1 Goldilocks and the three bears(上)-2025年四升五英语暑假预习练习(含答案)(译林版三起).docx
- 2025年二次元性格测试题及答案.doc
- 第13讲:5AU1 Goldilocks and the three bears(下)-2025年四升五英语暑假预习练习(含答案)(译林版三起).docx
- 城市更新老旧小区改造项目安全管理方案(范文模板).docx
- 物流中心业务介绍.pptx
- 2025年九种人格测试题及答案.doc
- 2025年九种动物测试题及答案.doc
文档评论(0)