zl程序教程

您现在的位置是:首页 >  硬件

当前栏目

美团面试——机器学习/数据挖掘算法工程师

2023-09-11 14:15:32 时间

目录

一面

二面 

三面

hr面


一面

一面内容:

自我介绍 讲一下论文和项目
讨论实习的东西 怎么样提的特征 做了哪些特征工程
讲一下决策树 随机森林 随机森林的分裂节点的策略(两个随机);bagging和boosting的联系和区别; boosting中的adaboost的基本原理; boost中的gbdt的原理 和随机森林有什么区别 哪个精度更高 为什么
特征工程有哪些方法(数据处理上的) 主要是统计意义上的一些操作 这块不足 需要补充 (1.OneHotEncoding 2.标准化 3.归一化 4.连续特征离散化 5.L1正则 6.GBDT 特征组合 7.特征重要性分析方法 卡方检验 8.FM 实现离散特征embeding)
数据不平衡问题的解决办法(从数据角度 正采样和负采样 从损失函数角度 添加scale平衡数据 从评价角度 用ROC AUC而不用PRC) 解释ROC PRC 推导公司
l1正则化和l2正则化 解释 推