百度之星复赛试题.docVIP

百度之星复赛试题.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
百度之星复赛试题

2009年6月14日10:00-18:00,2009百度之星大赛在线晋级赛(复赛)展开。百度爱好者给大家带了复赛题目,供有兴趣的朋友研究。复赛共四题,分别是高频Query的识别 (100分)、图形检索 (100分)、网页的相似度计算 (100分)、拼车 (100分),总计400分。 1. 高频Query的识别 (100分) 内存限制:1MB 题目描述 百度每天都会接受数亿的查询请求, 如何在这么多的查询(Query)中找出高频的Query是一个不小的挑战. 而你的任务则更加艰巨, 你需要在极其有限的资源下来找出这些高频的Query.(使用内存不得多于1MB, 本题的规定覆盖其它地方的规定) 关于内存限制: 我们评测程序计算内存使用量的方法是将选手程序实际使用的内存减去以下空程序实际使用的内存. #include cstdio #include iostream #include string int main() { } 注意,测试的机器是64位的.在测试机上下面代码输出: 8 8 4 2 #include stdio.h int main() { printf(”%d %d %d %d\n”, sizeof(long), sizeof(int*), sizeof(int), sizeof(short)); } 关于时间限制: 下面是一个能得到正确输出的程序,你的程序使用的时间不能大于以下程序的运行时间(对相同的输入, g++ -O2编译). #include stdio.h #include stdlib.h #include string.h int main() { const int L = 16+1; char buf[L]; char out[100][L]; while(scanf(”%s”, buf)==1) { int p = 0; for(int i=0; i200; i++) p = rand()%100; strcpy(out[p], buf); } for(int i=0; i100; i++) if(strlen(out[i])0) printf(”%s\n”, out[i]); } 输入格式 一行一个Query, 以文件结束符结尾。每个Query字节数L(一个汉字两个字节)满足:0L=16. 输入大小不超过1GB(包括换行符)。 输出格式 你认为最高频的100个query. 每行一个, 不能有重复, 不能多输出, 但可以少输出(见样例). 样例输入 美女 帅哥 美女 百度 美女 百度 百度 美女 美女 美女 样例输出 百度 美女 评分方法 如果你的程序运行超时或使用内存峰值超过限制,那么你的得分为0. 否则得分非0.你的得分是你输出的query的实际频次的总和(在样例中为3+6=9)在所有有提交的选手中的排序而定. 具体来说, 设测试点分数为S, 得分非0的程序数为 M ,比程序 i 的方案严格更优(实际频次的总和更大)的程序数为 Y(i) ,则该测试点程序 i 的分值为 S(1-Y(i)/M) 。换句话说,输出该测试点最优解的程序将获得 S 分,而最差解惟一的情况,输出最差解(但合法)的选手将得到 S/M 分。注意:每个测试点的得分不必为整数。 提示,请使用C语言的stdio函数而不要使用iostream,否则在I/O速度上会处于明显劣势。 2. 图形检索 (100分) 时间限制:10秒(12:09更新) 题目描述 和人类一样,度度熊也喜欢上网搜美女的图片,不过和人类不同,他搜的是熊熊。 他经常发现现有的搜索功能无法满足他的要求。看到喜欢的熊熊就喜欢狂搜那个熊熊的其他图片。遗憾的是人类并没有给每个熊起个名字,他非常羡慕人类可以用“金泰熙生活照”这样精确的Query来进行图片搜索。 有一天他终于受不了了,决定开发一个“度度熊”图片检索系统。 目的就是从一张图片出发, 检索和该图片相似的图片。 这可不是一件容易的事情,度度熊心里当然很清楚。因此他要先实现一个简化版的检索系统. 具体的描述如下: 系统目标: 给定任意一张包含特定图形的位图,从一列候选集中,正确检索出与之相似的结果. 检索对象: 黑白位图(即0/1 bitmap), 尺寸统一为180*180,其中每一个点Px,y保存像素点的颜色,1表示黑色,0表示白色。 输入格式 只有一个测试点, 共X=150幅图像, 分为M=15个类别, 每个类别N=10个样本。在人眼看来,每个类别中的样本两两相似,但任意两个不同类别的图像都不相似。 每幅图像(按照输入顺序依次编号为0..X-1)包含180行, 每行180个字符(为0或1), 字符之间无空白. 不同图像间用单个空行隔开.没有多余的输入(即保证只有X幅图像) 输出格式 共X行, 其中第i行用10个整数

文档评论(0)

phl805 + 关注
实名认证
文档贡献者

建筑从业资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月12日上传了建筑从业资格证

1亿VIP精品文档

相关文档