现在的位置: 首页 > 综合 > 正文

20131122新浪微博推荐工程师面试

2017年12月19日 ⁄ 综合 ⁄ 共 838字 ⁄ 字号 评论关闭

1、什么情况下用指数函数拟合数据?(背景是想用指数函数拟合CTR与展示次数的关系,不知道这样子合适不?)

2、选择userCF与itemCF需要考虑的因素?

答:1、数据稀疏性。使用userCF要求用户相似度矩阵较稠密,使用itemCF要求物品相似度矩阵较稠密。

2、(用户与)物品更新频率。若物品更新特别快,则itemCF维护物品相似度矩阵成本较大。

3、对个性化和实时性的要求。userCF反映的是某一兴趣相同群体的热点,实时性较好,个性化不足。itemCF根据用户历史行为进行推荐,比较个性化。

4、解释性。itemCF可以解释,userCF难以解释。

3、logistic回归的目标函数是什么。(先询问了知道哪些ML算法,然后面试官挑了LR来问)

答:写的是tagert与hypothesis的最小二乘形式。还被面试官确认了一下“最小二乘”,随后被问似然函数是什么?现在想来,应该回答最小二乘形式等价于最大似然,在样本独立同分布的情况下。将logistic回归放在GLM框架中讲时,应该将框架的三条要求写完整,用该框架介绍logistic回归,然后介绍多元logistic回归。

4、询问的问题:微博中间的“好友关注”推荐与右侧的“可能感兴趣的人”推荐有什么区别?

答:中间是属于用户的空间,所做推荐更偏重于社交关系,很有可能是已经认识的,或者同一学校、同一工程的。右边的是商业空间,所做推荐可能更偏重兴趣。

5、了解哪些优化算法?

答:梯度下降、牛顿。对regulation了解不?知道,但讲不清楚。

6、推荐系统做什么事情?

答:将用户感兴趣的、但目前不知道的物品推荐给他。后续的问题是:怎么衡量用户不知道?怎么衡量用户感兴趣? 这个问题当时回答的不好。前者可以用物品的点击次数衡量,如果被所有人点击的次数的综合较少,则用户很有有可能不知道。后者:和某用户有相似行为的其他人感兴趣,则该用户也可能感兴趣。

今天面试时的不足:

1、没有将对LDA的了解提出来。

2、第二次被问到优化算法,要准备一下。

抱歉!评论已关闭.