领英数据科学家第一轮电话面试分享。
第一轮是technical screen。一个小姐姐打来,上手先让我自我介绍,然后问我为啥想去linkedin。
然后直接给了collbaredit链接。给了一个table header:userid, timestamp, product group,问题是怎么用sql来analyze product diversity。 蛮surprised的 因为之前面的其他公司一般都是回要求一个strict output, 而这里你要自己想好怎么定义 diversity, 用什么样的output来analyze diversity。
根据我一开始写的query xx姐姐提出了很多follow up问题, 比如你为什么这么定义x,你怎么validate 你的assumption,还有什么metric 你可以想到的。
几个来回之后,xx姐姐说,现在一样的题目用python 写一遍 (R也可以的 只不过我比较熟python)。 然后我又开始把刚才的逻辑用pandas一顿写。然后她开始问怎么样用data driven的方法来increase product diversity。然后问我具体怎么实现。 然后就是我问问题时间了。