- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
PAGE2
Excel害英国漏报近1.6万新冠病例
Excel害英国漏报近1.6万新冠病例继遗传学家被Excel逼到给基因改名之后,又一个项目被Excel“坑”惨了。近日,英国卫生部发现因为Excel行数限制,大约16000个新冠肺炎病例未能及时纳入统计。但数据专家吐槽:为什么要用Excel?
近日,英国新冠肺炎确诊病例数量暴增16000例。这并非是因为哪里出现了疫情暴发,而是因为一个失误:Excel行数爆表了。
由于英国卫生部使用了过时的Excel文件格式,统计数量很快超过了行数上限,当地时间9月28日到10月5日的新增
病例没有被列入统计。公共卫生专家担心,统计延迟会影响接触者追踪,对疫情防控造成不利影响。而数据统计专家们纷纷表示,对于这样的项目根本不该使用Excel。
这个统计错误已经被手动修复。英国卫生部新的统计系统已经在开发中,不过目前的解决办法是:把统计表拆分成更多的Excel表格,以扩大总的数据统计上限。
来自80年代的工具据BBC、《卫报》报道,英国新冠病毒检测的流程是由商业公司雇用实验室进行检测,检测结果以csv格式发送给卫生部,卫生部用程序将数据输入Excel表格,随后这些表格被发送到多个政府部门共享的系统。并且,他们使用的还是一种古早文件格式:xls。
实验室提交的csv格式是文本形式的表格,数字之间用逗号分割,理论上可以有无限行。
而在xls文件中,一个模板(template)
)最多有65,536行行。在进行文件格式转换的时候,超出行数的部分会被系统直接删除。每个病例的检测结果要占好几行,那么一个模板大约能容纳1400个病例的数据。
事件曝光后,许多人批评英国卫生部居然使用了如此过时的文件:xls诞生于1987年。2021年发布的xlsx文件格式能够容纳1,048,576行,是xls格式的16倍。所以,如果使用更新版本的文件,冲破行数上限的问题就能来得晚一些,但那也只是时间问题。
“高中生都知道有更好的选择”不过,一个更关键的问题是:
对于这样的项目,为什么要用Excel?谢菲尔德大学搜索和分析教授PaulClough也在theConversation发文评论了这一事件。他指出,虽然Excel很受欢迎,经常被用于数据分析,但它并不适合处理数据量太大的情况,或比较复杂的分析任务。
Clough肯定了英国政府和公共卫生工作者这段时间的辛勤工作,但是,“这样的错误是可以避免的。我们生活在一个大数据的世界,人工智能和机器学习正在影响我们生活的方方面面。我们有智能工厂、智能城市,我们有自动驾驶汽车和自动机器,它们展现了人的智能。然而,英国卫生部还在用MicrosoftExcel作作为处理大量敏感信息的媒介。这就是问题。”他写道。
剑桥大学计算机实验室通信系统教授JonCrowcroft则更加直白地指出,连一个修过计算机课的高中生都知道,有更好的替代选择。他在接受BBC采访时评论:“Excel的作用是让小公司的人糊弄少量的数据,看看大致情况……如果你要完成一个更加严肃的任务,就该去找一个专用工具,有十几个这样的专用工具。但你不会用xls。没人用xls。”补救措施:建更多的表格英国卫生大臣MattHancock说,这个问题在于卫生部使用了一个“遗留系统”,他们两个月前已经决定替换掉这个系统。但BBC报道指出,卫生部应该没有预见这个问题,否则他们就该意识到,在新系统升级完成之前他们就会撞上Excel的统计极限。还有人要求Hancock公布其他的数据处理图表,以便发现其中潜在的缺陷。
据BBC报道,目前新的系统还未就位。
英国卫生部的解决办法是将统计数据拆分,列入多个Excel表格,确保每个表格不会再出现行数溢出的情况。知情者承认,目前的老古董系统需要尽快被替换成Excel之外的专业工具。
谢菲尔德大学的Clough教授评论:“这是个很糟糕的补救工作,没有根本上解决问题——问题是缺乏一个稳固的数据管理系统。”那些年被Excel“坑”过的人由于Excel的广泛流行,被它“坑”过的项目实在数不胜数。就在两个月前,国际人类基因命名委员会(HumanGeneNomenclatureCommittee,HGNC)
修改了27个人类基因的命名,因为Excel会将一些基因名称误读为日期格式,并直接修改成默认格式。
图|微软Excel将基因名称误读作日期
一个更惨烈的案例发生在2021年:
摩根大通交易员Excel操操作失误,公司直接损失20亿美元,累计损失达60亿美元。一名绰号“伦敦鲸”(LondonWhale)的交易员在计算风险价
原创力文档


文档评论(0)