2017数据挖掘面试问题
年后去了几家公司面试,攒了些面试经验,以下为一些比较关键的问题整理:
知乎
- map reduce找二度好友(笛卡尔积,一轮解决)
- LR模型推导,随机森林原理(两个随机,偏差方差),adaboost原理
- 求数组最大数,该数为数组中某两个数相加(可以有负)
- 随机器p的概率为0,1-p的概率为0,要求生成0.5的概率为0,0.5的概率为1
- 给定一个旋转数组,查找某数(二分查找)
- 之前做的好友推荐使用的特征、模型
- lucene中,多个搜索结果的倒排链表的合并(交并差等集合操作)
三轮面试的程序题分别为:
- 求数组最大数,该数为数组中某两个数相加(可以有负)
- 旋转数组二分查找某数
- 判断可能有环的两个链表是否相交?(要分三种情况:a、两个都无环。b、两个都有环。c、一个有,一个没有。)
网易
程序题,分层打印树?(使用队列)
一点资讯
写程序,读写超大文件,并返回文件中第二列字段的值。(开放题,可以上网搜,应该用BufferedReader解决)
优酷土豆
程序题,查找数组中有序数字的目标数字的开始和结束位置,例如1,2,3,3,3,5中3的位置为2,4(二分查找)
摩拜单车
上来先做笔试题:1、斐波那契数列。2、在字符串中找出连续最长的数字串。3、链表反转。4、最短摘要生成(编程之美上有)
留下评论