网站大量收购独家精品文档,联系QQ:2885784924

基于大语言模型的网络健康信息文本可读性模型研究.pdf

基于大语言模型的网络健康信息文本可读性模型研究.pdf

  1. 1、本文档共87页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

目前中国面临日益加剧的人口老龄化问题,老年人群体的健康信息阅读成为

一个重要议题。随着互联网的普及,老年人越来越多地依赖网络资源来获取健康

相关信息,然而,老年人群体普遍面临视力衰退、认知能力下降等生理挑战,加

之网络健康信息普遍采用复杂的医疗术语和密集的信息呈现方式,导致他们在理

解和应用这些信息时效率低下,甚至误解信息。

在前人使用的可读性度量方法中,传统的公式法只关注文本表面特征,忽视

了深层次的影响因素,并且文本处理过程复杂繁琐,导致其实用性受限;而机器

学习方法虽然性能较好,但高度依赖于人工特征提取,极易引入无关或冗余特征。

深度学习方法则面临着结果解释性差,且仅能应用在有明确标签的领域。因此,

这一研究领域缺乏一种综合性评估框架,能够同时考虑文本结构、语义复杂性及

用户的认知特征,并实现自动化评估。

近年,以GPT系列为代表的大语言模型引起了广泛关注,并迅速成为各领

域的研究焦点。在此背景下,本研究利用大语言模型强大的生成、推理和解释能

力,探索一个新的文本可读性评估范式,以解决现有方法的局限,并提供适应老

年人特定需求的一套度量网络健康信息可读性的方案。

本研究首次探讨了应用大语言模型于评估老年群体网络健康信息可读性的

可行性和挑战。研究面临的主要挑战包括缺少针对性的可读性评价标准、现有模

型缺乏足够的可解释性且没有可用的数据集。

为此,本研究提出了一套综合性解决方案:(1)首先,通过构建一个全面的

指标体系,将可读性评价这一单指标回归任务转化为多指标的分类任务,以规范

化定义可读性;随后,创新性地将多指标的分类任务转化为生成任务,以利用生

成类大模型的先验知识,增强预测准确率;(2)利用大模型生成结果的可引导

性,本研究采用提示学习技术,以生成包含评分和理由的输出,从而提高模型的

效果及其分数的可解释性。同时针对基础框架存在的“错误累积”的现象,本研

究进一步提出了一种两阶段训练的进阶方法,进一步优化了模型的生成能力、推

理能力和解释能力(3)为了确保模型的有效训练,本研究构建了一个新的数据

集,该数据集基于对话式大语言模型调整优化,包含了指标评分和评价理由。

综上,本研究的提出了一种新的可读性评估范式,为老年人群体量身定做,

并通过实证研究验证了其有效性。该研究不仅推动了可读性研究的理论发展,也

为实际应用提供了科学依据和技术支持。

关键词:网络健康信息:老年人;大语言模型;可读性

ll

ABSTRACT

Chinaisahealth

currentlyfacinggrowingpopulationagingproblem,andreading

informationforthehasbecomeallissue.Withthe

elderlypopulationimportant

areononline

oftheresources

Interact,theincreasingly

popularizationelderlyrelying

toaCCeSShealth—relatedfaces

information;however,theelderlypopulationgenerally

suchasvisionlossandwith

cognitive

physiologicalchallengesdecline,which,coupled

thefactthatonlineh

文档评论(0)

dongbuzhihui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档