自我介绍

讲讲比较擅长的项目

讲讲LSTM

TFIDF, LDA, 是否有动手复现

XGB LGB及其优势和原因

文本聚类,KMeans,如何选取初始中心点,如何确定K值。

算法题:

1 两个有序序列的中位数,算法复杂度 O(log(m+n)) 没有完成

2 打印螺旋矩阵

3 严格递增数组A [1,3,4,5,6,8],循环后B [5,6,8,1,3,4],给定x ,输出在B中下标,

4 给定100亿个数,计算最大的100个数各自出现的次数

5 给定100亿篇文章,对于一篇新的文章,找出对应最相似的文章。(词的选择可以考虑使用TFIDF)