- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
百度面试题
百度电面小结2011-06-16 00:42现在确定了一个本地的面试,但是还是想尝试一下其他的,主要是为了锻炼自己,多争取写机会。但是这段时间,过多的机会让我很疲惫,我想静下来,有个实习机会就知足吧。好好做这个实习就行。百度就工作机会来说它是很好的。5 月底的时候在豆瓣网上看到有个人发布招实习生的消息,留了个邮箱,我就给这个邮箱发了个求职信,附带自己的简历,其实自己的简历很烂。但是由于这种方式,过了几天这个邮箱的主人给我打来电话,让我在百度 hr 网站里把这个部门的职位选了,然后把简历号告诉了他。他说已经帮我内推。之后百度有个 hr 打来电话安排电面,把时间定在周四下午。但是到了周四并没有打来电话,过后一个百度的人打来电话说电面安排在端午节后的第一个工作日,也就是周二。端午节期间,学校的一个校友,是百度一个部门的经理,他来学校有个座谈会,之前也发过简历,他说有内推的实习生机会。我也发了简历,但是没有通过筛选。我有些不解,就第一次霸王面,想知道简历有哪些不足。面试还算可以,和学长有所交流。周二的时候我因为家里有事就做火车回家了,下午时候百度的那个人打来电话,开始了电面,但是在火车上,不断的过隧道,手机信号特别不好。就 4 分钟,就终止了电面,只是简单的说了说我研究生做的什么,自我介绍一下。我后来打了电话,道了歉,并把电面时间再次推迟到这个周一。我从家回来后,周一并没有收到电话,之前也想着是可能不会再打来电话了。但是周二下午还是那个人打来了电话,说 4 点电面。不一会,那个学长发来消息,问我之前有没有申请百度其他部门的职位,我把这个告诉了他。他说只能一次面试一个职位。所以他部门的电面机会要排在这个部门的之后,只有这个部门的电面 fail 了,才能再次有他部门的机会。百度避免不同部门之间调换。我想学长表示了我挺喜欢他部门那个职位的。但是没办法,只能先接受之前的这个部门的电面。4 点半的时候还是那个人打来的电话,开始了电话面试。具体哪些问题我也记不清了,只能想多少说多少。一开始时问我之前在 IBM 的一个部门实习,都做了什么,干了什么工作,参与了哪些系统实施。我大概描述了一下。然后问我研究生阶段做了什么,介绍了一下研究方向,与信息检索的区别,所作的工作有哪些结果,分别说了一下,也没有太大的细问。说到信息检索,就问道搜索引擎中的网络爬虫。这方面的东西我只知道大概,具体的细节不了解。我可能都不能理解他问的问题。又问到怎样避免相同的 url。我说用哈希、失效。问 url 不同参数怎么处理?我说删除不同的参数,取前面相同的,这个我一点都不知道,他问怎么删,答可以用聚类的方式又提到 url 可以深度搜索、广度搜索后说到动态网页不同网页相同的部门与不同的部门,怎样去重。我说聚类。具体也不了解。然后说到对搜索引擎,只是了解一个大的框架,从网络爬虫、倒排索引、查询模块、结果排序、呈现。又问到倒排索引,如果一个词在很多文档中都有出现,如何办?我可能还是没有理解他说的意思,或者说我根本就不懂搜索引擎。我就说利用词表,但是词表是必须的,所以这个说法根本不成立。关于怎样优化倒排索引,具体我也不太清楚。曾经读过信息检索方面的书,但是并没有深入。这块的问题,我回答的很差劲,基本上不能通过。然后问了 C++ 的问题。说明一下虚指针和虚函数表。我就说了一下 C++ 的对象模型,多态,为什么要有多态,举例结合设计模式,虚析构函数,资源丢失。C++ 的问题基本上集中在这方面。然后又了海量数据处理的问题。他说的是有 50 亿个 32 位的整型数,如何找到重复出现的数。我一开始听成 51 个数了,就直接说用排序,让后遍历,O(NlogN)。又说可以用 hash,由于理解成 51 个数,在 hash 讨论了很久,等发现是 50 亿个数的时候,才发现刚才是多么可笑。然后想了一下,说用位图,开辟一个 2^32 bit 的空间,这样只需占用 512 MB 的内存大小即可。每个待检测的数可以用作 bit 的索引。这个方面是可行的。然后又问了个用 1 亿个数,找到最大的 1 万个数,我说最直观的方面是排序,最大的 1 万个。当然这种方面不好,造成不必要的排序。就说了可以利用快排 partition 解决。还有另一种方面利用最小堆,遍历所有的数,时间复杂度为 O(NlogM)。这个也是可行的。之后又问了个设计问题,关于数据结构的。说 vs 中的自动提示功能或者 VA 插件或者 baidu 的 suggestion 如何实现的。我先是说到用排序二叉树、平衡二叉树,但是他并不满意,后说直接一个字符串数组,然后二分查找,还是不行。他希望是更快的速度,只能是映射的方法,采用 hash。停滞了一大会。说可以针对每个函数的前缀字符串建立 hash,这样可以快速的找到相应的提示结果。但是需要做预处理,
您可能关注的文档
最近下载
- 苏教译林版九年级下册整册书单词默写表-单词表.docx VIP
- 2.2《养成亲社会行为》 课件 2025统编版道德与法治八年级上册.ppt
- 中国古代古典书籍 《钟馗全传》 全本.doc VIP
- 《差异化教学探讨》课件.ppt VIP
- 四棉医院检验科室内质控项目一览表技术指导.docx VIP
- 普通高中体育与健康新课程标准试题与答案(2025年版2025年修订).pdf VIP
- 2025年浙江高三高考英语模拟试卷及答案详解.pdf VIP
- 《马克思主义新闻观十二讲》复习备考试题及答案 .pdf VIP
- 重庆翘柏高锰酸钾及其复合盐在水处理中的应用.pdf VIP
- 家庭经济状况信息表(样表).doc VIP
文档评论(0)