- 1、本文档共73页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
18AI防疫
1
帝国理工郭毅可:抗疫政策的评估,数据科学的应用
整理:智源社区蒋宝尚
在第二届北京智源大会的“AI防疫”专题论坛上,英国皇家工程学会院士、英国帝国理工计算机系教授郭毅可做了题为《抗疫政策的评估:数据科学的应用》的报告。
在报告中,郭毅可详细介绍了如何根据数据建立数学模型预测疫情。郭教授表示:传染病学、流行病学是一门标准的数据科学,同时数据科学并不一定非常复杂,换句话说,针对传染病的数据科学研究都是比较直观的。
在报告中,郭教授还具体介绍了动态和静态两种传染病模型的细节,也对之前的建模预测效果进行了展示,同时对中国和欧洲的两种抗疫政策进行了简单评价。
以下是文字整理:
图1:什么叫流行性传染病?
今天演讲的题目是《抗疫政策的评估:数据科学的应用》,我先从流行传染病开始谈起。传染病与普通疾病的最大区别在于:普通疾病的患者影响自己,传染病由于其传染性在,会进一步影响患病率,而患病率影响发病率,一个病例就可能是一个危险因素。另外,患病率不仅是衡量人口疾病负担的指标,而且也是遇到感染者的概率,其和人与人之间的接触模式高度相关。
2
图2:流行病学是一门关于数据的科学
因此,传染病一旦出现,没有患病的人们关心自己会不会受到传染,政府则关心如何让更少的人被传染。这时,首先需要进行的是数据科学研究,即通过观察有多少人患病(例如进行关于病毒的核酸检测),判断病毒的潜伏期、传染性和传播模式。政府也应出台相应的防疫政策,虽然政策能在一定程度上限制传染病的流行,但却给经济发展带来了风险,这时则需要对政策进行全面的分析和评估。因此,传染病学、流行病学是一个标准的数据科学。
一、静态传染病模型:求解概率方程
图3:帝国理工对武汉疫情的早期预测
数据科学并不一定复杂,换句话说,针对传染病的数据科学研究都是比较直观的。例如帝国理工对武汉疫情最早的预测:我们不知道武汉有多少人感染,但我们知道从武汉出国的人每天有3300人;到1月18日有7个出国的人确诊感染了;另外,一个感染者从感染到发现的平均时间是10天,那么我们就可以简单地估算出武汉大
致感染的人数。因为我们可以把武汉出国的人作为样本,通过求解概率方程式就能得出感染人数。
具体而言,如果考虑武汉机场覆盖人口为武汉周边地区1千9百万,那么感染人数就是4030人,如果考虑武汉机场覆盖人口为武汉地区成年居民900万人,那么感染人数就是1909人。
图4:2020年1月28日湖北省新冠肺炎疫情情况
这个简单的预测非常有价值,因为当时抗疫政策的制定必须要知道感染的规模。该预测结果也在1月29日得到了验证,根据当时卫健委的报告,湖北省有3500人感染,武汉有1900人感染,由此可见当时的预估是较为准确的。
二、动态传播模型:用流动数据讲述生命
图5:传播动态系统数学模型的发明者
上面是简单的数据科学,下面介绍复杂一些的动态变化。关于动态变化,传染病学最重要的一个工作,是所谓的SIR,即传播动态系统的数学模型,由两个物理学家发明。此传染模型带有普遍性,是一个GeneralModel,其概括了传染过程中的三个人群:易感者、感染者,恢复者。
4
先来看一个简单的动态模型,即假设治愈的患者能获得“终身免疫力”,不再传染其他人;再者,还要去除干扰
因素。这时所研究的对象是两个部分,一是从易感者到感染者的传播速率,二是从感染者到免疫/死亡者的周期。针对这两部分,动态模型会描述三个状态:易感状态、感染状态、治愈状态。
图6:传染病动态系统模型
另外,此动态模型对人群也有三个假设:1.每个人都在四处游走,没人会在同一地方待很长时间;2.每人与感染者接触的概率相同;3.所有人不断地混杂在一起。
图7:三个动态变化的人群:三种状态变量
三个动态变化的人群对应三种状态变量,其中易感人群:在某时刻可能会被感染的人群;传染人群:在某时刻已被感染并会传染的人数;免疫、死亡人群:在某时刻已免疫(或死亡)的人数,不会被传染,也不会传染别人。
有了假设、变量之后,然后根据SIR模型找出动态变化规律,即需要确定个体状态如何转换、两个转化速率:
不感染到被感染、感染到治愈。
图8:感染速度:S→Irate
以上就是基本模型的基本思想,虽然会涉及一些数学,但非常简单。例如从易感到被感染取决于什么?当然取决于被感染人数,如果感染人数很多,或者很多人被感染,感染速度就会加快;或者被易感暴露的人群很多,那么感染速度也会加快。
此外,还会涉及到一个参数,即针对速度的参数,其受两方面的影响,一是,有效接触的可
文档评论(0)