- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
百度-2009-科大-笔试题
2008-9-24成都电子科技大学百度笔试题(第一套题)
一:编程题
现有一组共计N个固定的集合(N为万量级),每个集合有个从0开始递增的集合ID,每个集合包含1~M个TERM(M为0~100的量级),希望设计一个程序能够持续对外服务,输入是一个TERM数组,输出其中任意一个集合ID(如果该TERM数组包含该集合的所有TERM),如果找不到输出-1。要求:
时间复杂度最优,能够在短时间内对大量输入逐个输出
实现具体的代码(可以是伪代码),其中常用的数据结构可以采用标准库。
给出时间复杂度和空间复杂度。
TERM组合集合的文件格式举例:
TERM_1 空格 TERM_2
TERM_1 空格 TERM_3
TERM_1 空格 TERM_3 TERM_4
输入的为TERM数组(说明:TERM为一个词,可能是中文,固定字符串表示)
二:算法题
你现在有一个文件,文件中顺序存有N个记录,R1,R2,...,RN,这些记录不是有序的,但是你知道一个整数M,这些记录满足R1R2...RM以及RM+1RM+2...RN.
1,设计一个算法或编写一个程序,将文件中的记录排序为R1R2,…,RN,算法或程序读取文件的次数为O(N),不限内存使用,
2,设计一个算法或编写一个程序,将文件中的记录排序为R1R2...RN,算法或程序读写文件的次数为O(N),空间复杂度为O(1),(亦即,你使用的内存大小和M,N均无关。)
三:系统设计题
网络上所有的链接都可以用以下的三元素进行描述:
From_url(链接所在页面的URL)
to_url(链接所指向的URL)
anchor(链接在页面上所显示的内容)
现在假设所有的网页链接信息(from_url \ to_url \anchor)按from_url为轴都存储在M个(M:1k以内)巨型数据库中:
链接存储形式:from_url to_url anchor;
一个from_url的所有的to_url都存储在同一个数据库中;
假设每个数据库存储的数据量相同
要求设计一个获取所有链接分发程序,将这些数据均匀分发到N个远程数据库中(N:100以内)要求做到:1所有to_url相同的链接需要分到同一个远程数据库,2所有to_url的站点相同的需要分发到同一个远程数据库,3每个远程数据库获取的链接总数要尽量均匀,4每台数据库完成时间尽量保持一致5,获取网页的速度尽量快(从数据库中)
说明:对于url:/m?tn=baidump3,其中属于站点信息。
2008-9-24成都电子科技大学百度笔试题(第二套题)
一:算法题
有一段文本,由英文字母、阿拉伯数字、GB2312编码的中文字符和一些常用标点符号(假设只包含全/半角的逗号和句子)组成。请写出程序,统计这段文本中每个字的出现次数,对“字”的定义如下:1,连续的英文字母或者阿拉伯数字,例如ab3或123,但最长不超过32个字符;2,包含不超过一个半角句点的两段连续数字,例如2.34,但最长不超过32个字符3,单个汉字
二:开放性题目:ORMapping是进行快速web开发经常使用到的技术,请设计一个简单的ORMapping框架,请首先说明设计思路,然后给出设计和Mapping部分的编码,并指出实现ORMapping所用到的编程语言的关键语言特性,要求:1,实现简单对象到关系的映射2,完成一对多关系到对象的映射。
三:数据库题
设计一个游戏积分系统,能够实现以下功能:1,用户在客户端结束游戏后,能够通过相应接口将积分进行上传;2,服务端保存结果并能展示该游戏的积分排行情况,分数按照从高到低排列,相同分数下按照提交时间的先后排定顺序;3,排行榜只展现排名前200的用户;4,同一个用户多次提交的情况下,只取分数最高的一次记录;5,系统要有一定的扩展性,能够灵活的增加、删除一个游戏。
要求:1,阐述客户端和服务端如何进行交互,交互流程是怎样的,设计合理的交互过程及接口。2,设计服务端存储系统,阐述采用的存储方案,如果是使用数据库,详细说明表的结构索引等。3,系统要求有很强的防作弊功能,能够屏蔽用户自己伪造数据提交成其他的spam行为。4,在满足功能的前提下,能够尽量提高整套系统的效率,例如:降低负载、缩短响应时间等。5,同时在线游戏的用户有百万级,因此单机很可能承受不了这么大的浏览压力,在设计系统的时候要考虑多台服务器如何部署,怎样保证负载均衡
说明:1,用户的登录信息系统可以直接获取到,设计的时候不用考虑这个问题2,要求中第5条为附加功能,在满足功能的前提下再考虑多服务器的部署问题3:客户端与服务器的交互采用简单的HTTP协议即可,不用考虑其他交互方式。
四:设计题
历史操作信息分页显示设计。现有一系统,需要保存用户6个月内的操作信息以提供给用户查询,由于历史操作的
文档评论(0)