现在的位置: 首页 > 综合 > 正文

百度3

2014年08月29日 ⁄ 综合 ⁄ 共 3796字 ⁄ 字号 评论关闭
1)此题10分
对任意输入的正整数N,编写C程序求N!的尾部连续0的个数,并指出计算复杂度。如:18!=6402373705728000,尾部连续0的个数是3。
(不用考虑数值超出计算机整数界限的问题)

2)此题10分
编写一个C语言函数,要求输入一个url,输出该url是首页、目录页或者其他url
如下形式叫做首页:
militia.info/
www.apcnc.com.cn/
http://www.cyjzs.comwww.greena888.com/
www.800cool.net/
http://hgh-products.my-age.net/
如下形式叫做目录页:
thursdaythree.net/greenhouses--gas-global-green-house-warming/
http://www.mw.net.tw/user/tgk5ar1r/profile/
http://www.szeasy.com/food/yszt/chunjie/
www.fuckingjapanese.com/Reality/

请注意:
a) url有可能带http头也有可能不带
b)动态url(即含有"?"的url)的一律不算目录页,如:
www.buddhismcity.net/utility/mailit.php?l=/activity/details/3135/
www.buddhismcity.net/utility/mailit.php?l=/activity/details/2449/

另:如果你会linux,请用linux下的grep命令实现第2题的功能(附加5分)。

3)此题40分
如果必须从网页中区分出一部分"重要网页"(例如在10亿中选8亿),比其他网页更值得展现给用户,请提出一种方案。

4)此题40分
假设有10亿网页已经被我们存下来,并提供如下信息:网页全文(即网页的源码)、全文长度、网页正文(即网页中提取的主体文字)、
正文长度,以及其他网页提取物等,现在希望去掉其中的重复网页,请提出可行的方案,计算出每个网页对应的重复度,你可以自己
对网页重复下定义,也可以提出需要哪些更多
的网页提取物来实现更好的去重复方案

百度面经:

我是9月份跟百度联系的,当时连简历都没写,只是写了一下自
己做过的一些东西,然后就通知我9月21日面试,第一次面试经过了3个小时,见了4位面试官,一个系统构建师,一个team
leader,一个技术部经理,还有一个hrJJ,主要问的问题就是我曾经做过的信息检索项目,基本上照着简历(如果有的话)仔细地问,还会出点题目考
你,建议大家多去看看《数据结构》,尤其是算法分析、查找、排序方面的东西。还有一些就看你的反应能力了,这里就不说了。

然后她会让你问一些问题,记得去之前到网上搜集点百度的资料看看,对百度有些认识,然后再问写关于公司发展和个人发展的问题,薪水的问题就别问题。

大约3个星期后,通知我去二面,又见了一个team leader和技术副总裁,这回还是围绕着简历提问,但自由交流的成份很多,就看你的亲和力和素质了,总之让他认为你这个人有创意,有想法,跟你一起合作会很愉快就是了。

当时那个副总裁邀请我到公司去做兼职,因为最近比较忙,就说下学期才能开始,可以说是整个面试中最大的败笔。

一个星期后打电话到HR那里问结果,被告知应届生招聘计划暂时推迟,感觉很faint,只好去找别的工作了。

百度的待遇一直不知道,工作时间大约是每天10小时以上,周六经常加班。

有股票期权,看你是不是喜欢了。

主要注意的是他让你问他问题的时候,一定问点有水平的问题,给他们点表现的机会,它表现的很爽,一高兴,对你也有好处。

 

百度
网络笔试题目


1.假设Apache产生的日志文件名为access_log,在apache正在运行时,执行命令mv
access_log access_log.bak,执行完后,请问新的apache的日志会打印到哪里,为什么?

2.在Shell环境下,如何查看远程Linux系统运行了多少时间?

3.处理以下文件内容,将域名取出并进行计数排序,如处理:
http://www.baidu.com/index.html
http://www.baidu.com/1.html
http://post.baidu.com/index.html
http://mp3.baidu.com/index.html
http://www.baidu.com/3.html
http://post.baidu.com/2.html
得到如下结果:

域名的出现的次数 域名
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
可以使用bash/perl/php/c任意一种

4.如果得到随机的字串,长度和字串中出现的字符表可定义,并将字串倒序显示,如
把0123456789作为基准的字串字符表,产生一个6位的字串642031,打印出的字串为
130246,可使用bash/perl/php/c任意一种.

5.如何查看当前Linux系统的状态,如CPU使用,内存使用,负载情况等.

6.你在大学中做的最成功
的一件事是什么(不必一定与计算机相关)

 
百度面试过程:

我的求职路程好像很是艰辛……到目前为止面试了很多家,简历更是投了几十份,只有Neusofe给了我一个offer。这个offer并不是对我能力的肯定,只是觉得我可能会留在东软。可惜东软我已经给拒了,基本上没有退路了。

说一下我的百度求职过程吧。

经过在线笔试、两轮电话面试,今天上午收到了百度的拒信,我的百度求职算是告一段落了……

从百度校园招聘开始,我就投了一份简历。在别人都有在线笔试机会的时候,我却没有任何消息。

听说师兄可以给推荐,我就又通过内部推荐的方式投递了一次,这次很快就有消息了——拒信。


时基本上就放弃了百度。可是大概20多天以后,我投递的第一份简历有消息了——通知我在线笔试。经过精心准备,笔试题答得还凑合。过了几天给我来了封邮件
告知我笔试通过,会找时间安排电话面试。又过了好几天,我正在剃头的时候接到百度电话,约了第二天下午三点电话面试。心情异常兴奋,回到寝室拼命复习数据
结构并收集百度面试题型……临阵磨枪 呵呵。

百度的面试氛围很是轻松,让你很快就觉得是在聊天而不是面试。第一轮主要是在针对我的在线笔试的题目进行提问和分析,主要讲的是做题的思路和改进的方法。面试时间大概有半个小时,觉得应该有下一轮。

果然上个星期五晚上接到了百度技术经理的电话,自称姓刘。在前一天我同学也是这个时候接到百度第二面电话,看来是同一个人,后来的面试内容证实了是同一个人。面试过程大概如下:

1、介绍一下项目。

2、提了一个问题:上千万条记录,统计出重复记录最多的前N条。

3、一个概率题:54张扑克牌,除去两张大小王剩下52张扑克牌。问红桃A和黑桃A同时被一个人拿到的概率是多少?

4、多个线程访问共享内存时因该怎么办?

5、在写程序遇到问题的时候,通常采用什么调试方法?

6、一个client/server的协议问题

7、剩下就是随便聊聊,比如有缺点、期望工作的性质、职业规划等

总结一下教训:

1、介绍项目的时候不能一味的按照事前想好的模板说,应该根据所申请的工作的性质,多说一些和自己申请的工作内内容相近的东西说。我在介绍我的项目的时候,说了很多硬件的东西,而相关的Linux下的C编程却没有提到多少,一大失败之处。

2、对于他提的第二个问题,当时因为紧张没有想出来,挂了电话以后才有了思路。

3、
这个概率题以前碰到过,而且和同学们讨论过,答案很早就知道了。但是遇到面试的时候,不能马上就说出答案,因为这样摆明了高诉人家你以前就见过这道题,这
样就失去了作为考题的意义。所以,如果事前知道答案也不要马上说出来,装作考虑中,然后慢慢说出答案。我就是很快就说出了答案,失败!

4、在问项目的时候,他问我代码行大概有多少?我说大概有5.6K行左右。在回
答第四个问题的时候,我几乎是将书上所讲过的东西背了一遍给他,虽然答案是正确的,但是我估计他一听就听出来是在背书了,所以这也会减分不少。,而且百度
强调创新,其实就算你不知道答案也可以按照自己的思路说一下的,只要逻辑清晰、合理都会比我背书强……

5、我的回答是有时候用gdb,有时候用输出日志的形式。以我之前给他讲的项目经验是不大可能会涉及这么多的知识的,所以估计他又听出我是在背书了……继续减分

6、后来我发现这个问题其实他不是在考我问题的答案,是考我解决问题的能力和考虑问题的思路。这点是我比较差的地方,没办法……减分

我前面表现那么失败,基本上已经没有什么希望了,后面的谈话已经没有意义了,只不过是礼貌性的结束这次面试了。

上面的总结是我收到拒信以后才总结出来的,可悲的是电话面试结束以后,还以为能被录取呢……

面试官太和蔼了,而且气氛及其融洽,根本没有任何不好的征兆,面试官好厉害!

至此,我的百度求职过程到此告一段落……生活还在继续,工作还得继续努力去找,加油!

 
百度电话面试题目

1.谈谈你对数据库中索引的理解2.现在普通关系数据库用得数据结构是什么类型的数据结构3.索引的优点和缺点4.session和cache的区别是什么5.如果有几千个session,怎么提高效率6.session是存储在什么地方,以什么形式存储的。
 
【上篇】
【下篇】

抱歉!评论已关闭.