- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据在餐饮业务信息系统研究分析与开发
大数据在餐饮业务信息系统研究分析与开发
摘 要:本文利用已有的开放平台研究现今的餐饮行业地区分布,并利用这种方法分析各地餐饮行业发展情况和预测可能的其他可以进行商业活动的地点。以北京作为一个典型案例,本文中演示了分析结构化与非结构化数据的方法,以增强应用性。
关键词:大数据 餐饮行业 信息系统
中图分类号:F724.6 文献标识码:A 文章编号:1672-3791(2018)01(b)-0046-02
现如今大数据在人类社会中起到了关键作用,社交媒体网站、新闻门户网站、数字地图导航提供商等?件上产生的大数据为决策者提供了更多的资讯。我们希望大数据能帮助我们做出更加合理的决策,然而,很少有关于大数据分析的研究表明对战略决策的支持。此外,分析数字地图导航提供商的大数据用于决策支持的方法方法多种多样,特别是在餐饮行业。本研究采用科学研究方法,设计并评估“大数据分析”的方法,来辅助餐饮企业制定营业地点的决策。利用开放平台上评估分析现今已有的餐饮行业地区分布,并利用这种方法分析各地餐饮行业发展情况和预测可能的其他可以进行商业活动的地点。以北京作为一个典型案例,本文中演示了分析结构化与非结构化数据的方法,以增强在实际问题中的应用,该方法是通用的,它对其他大数据流也同样有适用性。
1 定位数据在现代网路服务中的重要意义
如今的信息化社会中,来源于个人的自愿分享和各种在线服务软件获得的内容,为大数据分析创造了很多机会。而移动互联时代,定位无处不在,任何一个应用只要想了解用户的位置,不管是为用户提供服务还是用于用户分析,就一定会用到定位,但仅仅是原始数据的获取,并不能帮助我们得到切实有用的信息,所以,我们需要使用科学系统的方法,对原始数据进行数据预处理,包括但不限于聚集、抽样、维归约离散化、二元化、变量变换等。之后可以进行形似化和相异性的度量,但是在对于数据的探索之中,数据的可视化可以格外清晰地展现数据的特征和属性之间的关系。在导航服务网站(如高德、百度地图等)中,多种类型的数据不断增长,在任何真实分析项目中,我们都必须处理大量的数据。然而,传统的数据管理方法既不能管理如此庞大的数据量,也不能处理其有效增长和维护,因为相关数据的数量和速度会迅速增加。
如今的开放平台能够提供2D、3D、卫星多种地图形式供开发者选择,开放平台提供的API和SDK可以适应各种平台的地图构建工作,同时还提供强大的地图再开发能力和地图数据支持。
2 数据的预处理
数据的预处理是一个非常广泛的概念,我们为了分析处理北京餐厅地理信息数据,需要用到以各种方式关联起来的策略和算法,大体上,这一技术分为两类,就是选择分析所需要的数据对象和属性,以及创建改变属性。借此,我们可以改善数据挖掘过程中的各种冗杂工作,减少工作时间,增加效率。
聚集可以将两个或多个对象合并成单个对象,比如:收集到的餐饮地理数据,可以将其一个餐馆所有的事务合并成一个餐馆事务,那么数据的数量可以减少为餐馆的数量。这里的问题就是在创建这个聚集的事务时,我们需要考虑到每个属性的不同,使用不同的方法对数据进行合并操作,如果是定量属性,如访问次数、餐厅各项价格等,可以通过求和求平均值进行处理,而定性属性可以视其重要程度进行化简和聚集,成为一个集合。这可以帮助我们使用更少的精力时间对庞大数据进行预处理,以便于后文中的可视化操作。
3 大数据与传统的关系型数据库
大数据与NoSQL数据库近来被认为是完美搭配,但传统的关系型数据库也并不能被轻易取代,依旧有着难易度带的地位。如今的数据量时常能够达到难以用传统关系型数据库处理程度,而且有着越来越多的数据不再简单建立在传统关系之上,有了更高的可扩展性。正如MySQL凯源数据库最初版本开发者Monty Widenius所言,NoSQL需要着更多的优化持续开发成本,而很多公司无法负担也无需负担这一成本。大多数人依旧需要传统的关系型数据库来对数据进行管理,而在单机的环境之上SQL具有更强劲的性能表现,如本文涉及到的更具体分析部分。只有在集群环境中,NoSQL在键值查找上会比SQL快。
所以,在进行限定地区的具体数据和具体数据关系分析中,我们可以进一步筛选并找出自己所需的数据,展示传统的关系型数据库进行的具体分析。可以从庞大的数据之中只选择我们需要的数据,通过分析在开放应用API获取的数据,得到北京市的餐饮服务信息,分析各个区餐饮行业的情况,简略代码如下:
for url in urlList:
html = url_open(url)
target = json.loads(html)
gsNo = int(target[count])
pageNo = divmod(gsNo
您可能关注的文档
最近下载
- 2021届上海市杨浦区市东中学高三(上)期中物理试题(学生版).doc VIP
- 2021届上海市杨浦区市东中学高三(上)期中物理试题(教师版).doc VIP
- 上海市2020年上学期杨浦区市东中学高三物理期中试题.docx VIP
- 2022-2023学年上海市实验学校高二(上)期末地理试卷.doc VIP
- 教育科研工作总结(范文)与教育科研案例·批评中的教育艺术合集.doc VIP
- 6三维建模.6三维建模.ppt VIP
- 上海市市东实验学校2024-2025学年高二下学期3月月考 数学试卷(含解析).docx VIP
- 2024年度-幼儿园《小手不是用来打人的》PPT课件.ppt VIP
- 大职赛生涯闯关参考答案.docx VIP
- 2022-2023学年上海市市东中学高二(上)期末物理试卷(合格考)_20230202233847.doc VIP
原创力文档


文档评论(0)