本项目试图将所有搜推算法岗可能会出现的问题囊括其中,以便复习之需。这是一个个人向的总结,未必能使人人都看懂,不过也可以作为参考。
1.深度学习基础15个子项
BatchNorm1个子项
Trick-Dropout1个子项
seq2seq+attention1个子项
优化器1个子项
基本单元 - CNN1个子项
基本单元 - LSTM, GRU1个子项
基本单元 - RNN1个子项
学习率调整策略1个子项
对抗生成网络1个子项
损失函数1个子项
权重初始化1个子项
激活函数1个子项
炼丹经验 - 超参数调优1个子项
2.统计机器学习20个子项
EM算法1个子项
PCA1个子项
分类回归模型 - GBDT1个子项
分类回归模型 - KNN1个子项
分类回归模型 - XGBoost1个子项
分类回归模型 - 决策树1个子项
分类回归模型 - 随机森林1个子项
分类模型 - SVM1个子项
分类模型1 - logistic regression1个子项
半监督学习 - 主动学习1个子项
各种熵、KL散度、互信息1个子项
回归模型1 - 线性回归_L1L2正则3个子项
无监督学习 - 聚类1个子项
特征工程 - 归一化1个子项
特征工程 - 筛选特征1个子项
特征工程 - 解决数据不平衡问题1个子项
贝叶斯1个子项
集成学习1个子项
3.NLP9个子项
命名实体识别2个子项
文本摘要2个子项
机器对话3个子项
语言模型18个子项
0. Word2vec2个子项
1.早期预训练模型:LSA, Word2vec, GLoVe, FastText, Elmo2个子项
2.Transformer2个子项
3.GPT2个子项
4.BERT2个子项
5.Transformer核心代码+细节2个子项
6.BERT细节2个子项
7.Roberta_ALBERT_XLNet2个子项
subword2个子项
4.信息检索11个子项
BM252个子项
Faiss2个子项
IR经典模型2个子项
Learning-to-Rank指标2个子项
Learning-to-Rank损失函数2个子项
pagerank&HIT2个子项
上下文迟交互-ColBERT3个子项
京东个性化搜索2个子项
句子相似度对比学习-SimCSE2个子项
5.推荐系统18个子项
1.经典CTR模型24个子项
2.表征学习2个子项
3.召回22个子项
4.position bias4个子项
5.多任务学习10个子项
6.推荐系统的可解释性6个子项
7.序列推荐8个子项
8.图网络3个子项
Deepwalk&GCN1个子项
GAT1个子项
GraphSAGE1个子项
9.知识蒸馏4个子项
a.对比学习2个子项
b.CVR预估1个子项
c.推荐生态1个子项
上机笔试14个子项
1.Leetcode题目412个子项
ACM赛制输入1个子项
DFS2个子项
Trie树1个子项
python奇技淫巧1个子项
二分查找1个子项
典型题1个子项
动态规划1个子项
堆1个子项
栈1个子项
树1个子项
分布式数据库4个子项
简历内容12个子项
编程语言基础8个子项
计算机基础课8个子项
点赞
回复