- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向众包系统的拍卖算法对比研究
摘 要:众包是一种新兴的解决问题的方式,通常用于解决一些对于人类来说十分简单但是对于机器来说求解起来较为困难甚至不可能的问题。近年来,随着机器学习以及大数据产业的兴起,很多科技公司和学者都采用众包进行机器学习训练数据的收集以及整理,进而导致与众包相关的理论研究得到迅速发展。 在众包系统中,任务分配机制有着举足轻重的地位,任务分配机制的优劣极大的影响众包系统的性能,因此在学术界提出了各种任务分配机制。拍卖算法作为任务分配机制中的核心算法,广泛地使用在众包系统中的任务分配机制中,这篇论文主要研究了众包系统中的任务拍卖算法,首先从理论上对比了多种基于报价机制的任务拍卖算法和基于定价机制的任务拍卖算法,然后实现并设计实验根据算法的遗憾评估不同算法性能。结果表明,虽然基于定价机制的算法需要更少的用户信息,但是其效益仍然能够达到和报价机制的任务拍卖算法相同的效果。此外,本文还提出了一种含有质量控制策略的任务拍卖算法,并且通过实验验证其获得了不错的性能。 关键词:众包;任务分配;拍卖算法;定价机制;报价机制; 前 言 虽然计算机技术在高速的发展,但是目前仍然有很多对于计算机来说难以解决甚至不能解决但是对于个人来说很容易解决的问题,因此众包这一种利用人类的集体智慧解决问题的方案应运而生,并且很快成为一个解决一些简单问题高效而又便利的方法。 在众包系统中,一个请求者(Requester)通常需要在给定的预算范围内完成成百上千的任务,请求者把这些任务和他们的价格提交到众包平台中,工人(Worker)提交他们的答案并且获取指定的报酬。在众包系统中,一个核心的挑战就是如何决定每一个任务的价格。过高的定价导致预算很快耗尽,而过低的定价导致没有足够多的工人愿意参与到工作中,也会导致请求这的效益过低。因此设计一个高效的任务分配机制对于众包系统来说至关重要。在学术研究中,拍卖算法被广泛的应用在任务分配机制的设计中,因此任务拍卖算法有着重要的研究意义。 本文主要以众包系统为研究对象,研究众包系统中的任务拍卖算法,对比分析了多种任务拍卖算法,并且设计和实现了相应的任务拍卖算法,然后设计实验分析对比算法的性能差异,并且对现有的算法进行了一些改进,然后提出了一种考虑任务质量的任务拍卖算法。本文的主要工作在于: (1). 研究BP-MaxTasks算法、BP-DGreedy算法、BP-UCB算法和OPPM算法的原理,并从理论上对比各个算法的关系和差异。 (2). 实现上述的众包系统中的拍卖算法,并且设计实验根据实验结果分析算法的效益和遗憾,对比不同算法的性能差异。 (3). 改进BP-UCB算法和OPPM算法,通过研究BP-UCB算法和OPPM算法的效益函数的特征,设计三分搜索算法快速检索最优价格,从而提高BP-UCB算法和OPPM算法的运行效率,这是本文对于算法实现方式上的创新。 (4). 从理论上提出带有质量控制策略的OPPMQuality算法,并且实现该算法,设计实验验证其具有良好的性能,这是本文在理论上的创新。 第1章 绪 论 本章首先介绍众包系统中的研究背景和理论意义,然后简单介绍众包中的任务拍卖算法,其次简要介绍本文所做的主要工作和贡献,最后介绍本篇论文的结构。 1.1 研究背景及意义 互联网的迅速发展也给众包的发展带来了大量的机遇,互联网上如亚马逊Mturk和Click Worker一般的微任务众包平台比比皆是。这些众包系统作为联系请求者和工人的桥梁而存在,在这些众包平台中,请求者发布各式各样的被称为HITs(Human Intelligence Tasks,人类智能任务)的任务给在线的工人,这些任务被在线的众包平台中的工人执行,然后把结果返回给众包平台并获取他们应得的报酬。一般来说,提交到微任务众包平台中的任务通常都是一些图片识别[1],问卷调查填写[2],自然语言文本理解[3]等微型的任务,完成这些任务通常不需要花费工人太多的时间,但是请求者需要完成很多类似的任务,请求者通过完成的任务能够获取一定的效益。此外,请求者一般还有一定的预算限制了其能够在该任务上付出的报酬,因此请求者需要在预算受限的情况下最大化完成任务所获得的效益。 在这些众包平台中,请求者可以选择哪些工人可以做他们的任务,并且决定每一个任务他们能够给出的价格,而工人则根据自己完成任务的花费以及请求者提供的价格决定是否接受相应的任务。因此一个合适的任务分配机制在众包系统的设计中不可或缺。确定合适的任务定价是任务分配机制的核心问题。对于请求者来说,过低的定价导致愿意接受任务的工人寥寥无几,从而获取的效益过少,过高的定价会导致请求者的预
原创力文档


文档评论(0)