大家好,我是宝器!


今天邀请了一位小姐姐舒梦做了春招DA岗位面经分享,文章经授权首发于公众号「数据管道」,以下为作者自述全文,希望对正在求职数据分析或准备跨行数据分析的朋友有些许帮助。

01

个人情况


基本情况

双非渣硕,跨专业考的计算机,实验室天坑。选数据分析(偏业务)一方面是个人兴趣,另一方面是被开发和算法劝退……因为我实在是太菜了,代码能力等于0,更别提算法。

能力水平

有过数据分析的相关实习,某电商和某运营商。懂一点点大数据的东西,有一定业务知识,会一些分析工具,完全不懂算法(捂脸……所以走的基本是业务方向的数据分析,经历参考度对偏技术的非常非常有限)

春招情况

各种原因只投了5家,如下:

公司
               进度
虎牙简历挂
酷狗简历挂
网易互娱笔试挂
京东初试挂
BigoOffer


02

面经整理


Bigo(数据分析实习生)
一面1、简单介绍自己
2、hive的问题:

  • union和union all有何不同?

  • 使用union要满足什么条件?

  • 有两个表,join的时候哪个表放在前面更好【小表,让小表先进内存,可以提高效率】

  • 数据倾斜解释一下原理和解决方案【简单解释mapreduce原理,解决方案按参数设置和改写sql代码两方面讲,其中详细举例了我在实习时候遇到的问题】


3、excel很熟?讲一下vlookup怎么用?
4、python爬虫是什么情况,用到了什么库【说了爬虫使用的背景,以及这个小爬虫相应的技术】
衍生问题:有做过文本分析吗?貌似想问L1L2正则化的东西。【没有,爬下来的数据相当规整。至于正则化,我记得是机器学习领域的,没学过不好意思……】
5、python pandas相关问题,dataframe,怎么看数据的大致情况分布等,如最大最小平均四分位置
6、购物车关联分析怎么回事【说了当时的思路,SQL打标签,下载数据Python处理。关联分析算法是Apriori,但抱歉关联分析代码不是我实现……我搬人家的……在前面加了数据处理的代码】
7、实习有做过专题分析吗【说大的完整专题分析暂时没有,都是比较细分的点。然后有提及到主要的分析思路,电商业务a. 人货场,b. 转化漏斗】又看笔试试卷,你没学过概率和机器学习吗,空了这么多?概率是这题公式对,但是算错了。【尴尬……承认不足,的确是没学过算法和没复习好概率】
8、有做过abtest吗
9、为什么要跨专业
10、以后发展方向是什么
11、对数据分析的理解【主要提到两个点:数据质量,洞察业务】
12、有什么想问我的吗?【a. 职位属于哪个部门,部门的架构是怎么样的?b. 工作必须用到机器学习方法吗?想了解一下机器学习的落地。c. 业务部门有非常多提数需求,请问如何提高提数效率?】

二面

1、简单介绍自己(面试官:你说话好快啊)
2、uv和pv解释?
3、实习做了什么,有做过专题分析吗
4、购物篮关联分析
5、知道怎么用hive抽样吗?比如我想10000条数据的1%【讲了两种方法,order by rand() limit 100,或者用hive的抽样函数tablesample,按分桶和按百分比都有,针对这个可以用百分比方法。】
6、介绍一下窗口函数,哪种场景用到(笔试的SQL题我写了两种方法,不支持/支持窗口函数的方法)【说到常用的row_number() over()和dense_rank(),也知道sum over()那些但很少用。举了一个实习时提取品类新客的例子,解释了品类新客是什么】
7、为什么自己要搭hive【认为虽然意向是业务方向,但是由于有非常多的业务需求需要提数,如何写出好的SQL和了解Hive原理使得效率更高非常必要。实习时也有些问题没有解决,想再另外看书学习】
8、数据分析报告流程?是要怎么出沟通好需求后就开始提数吗?【先沟通好需求,然后拆分需求。在做数据的时候,首先了解数据质量问题,确认数据口径,然后是sql的逻辑,也要知道数据库的坑(举了之前实习中一个例子)。过程中又提到做一次用户画像的统计数据质量造成极大困扰
9、(接上了我的回答)如果给到你一份数据,发现很多异常值如何处理?
10、觉得两段实习哪段对自己提升更大
11、还面试了哪些公司
12、有什么要问我的吗


三面

问到自闭,非常怀疑人生……

1、简单介绍自己


2、开问概率统计

    x^x如何求导    方差如何计算    提示E(X),方差公式如何写
3、笔试概率和机器学习空了很多啊,是没学过吗【回答同上,哎】

4、详细问简历上python爬虫【介绍用到的库和思路等,以及具体的背景】
5、实习期间,做过业务分析吗,有没有做过什么发现能驱动业务的【我说了一个没写在简历上的分析,解释了业务背景,和大致的结果】
6、实习期间,看指标觉得什么对用户影响大【我觉得我答偏了,都说到品类对客单价的影响了……
7、做过abtest吗?【没有,解释实习所在部门对接的业务,不涉及abtest。另外说了对abtest的理解】
8、有什么想问吗?【数据分析师的发展路径】


京东

(数据分析工程师)


没法现场面,申请了远程。电话面试20min+,已挂。面经没及时整理,不全。

一面

1、简单介绍自己


2、问几个Hive的问题

(1) 简要解释MR
(2) 数据倾斜的发生原因
(3) Hive文件类型及其不同点,平时用的哪种文件
(4) Hive的常用参数
3、学过算法吗?(得到否定的回答后)什么?学计算机的没学过算法?(++尴尬)
4、估算京东每日订单量【转化漏斗】
5、职业规划
6、有什么想问我的吗【a. 所在部门和对接业务,b. 对我面试的评价】


欢聚时代

(数据分析实习生,日常实习非暑期)


加一个日常实习的面经,感觉有点借鉴意义。面试官是产品经理。由于是日常实习流程快,一面主管+二面HR,已通过。
1、你在某电商实习做了什么
2、你打算毕业做什么
3、ctr、cvr解释
4、次日留存、7日留存解释
5、埋点知道吗?解释一下
6、(拿出手机打开淘宝)如果你要给淘宝设计埋点,记录看了某个banner的用户,怎么做?【解释以前实习不做产品分析,没做过埋点设计。也讲了自己的理解,对banner编号,记录用户号,看过的banner和顺序,以及每个banner的曝光、停留时间、是否点击】
7、如果某天的某电商app的dau下降了很多,你怎么分析?【这题答得不好,大概是讲了分地区、分人群去看,以及考虑网络问题?
8、如果某天某电商广州销售量下降了很多,你怎么分析?【首先确定数据传输和存储是否有问题,然后看下降的量级,环比同比看下降是否突发还是持续。可以从品类、人群(会员)、流量等方面细看,也要看下转化】
9、写个sql:有一个表,字段有bannerid、uid、城市,统计广州和珠海bannerid为2的用户数
10、降序怎么写,随机抽取数据怎么写
11、左连接和右连接?
12、某电商什么时候的dau最高?除了活动日,平常日呢?
13、有什么想问我的?【a. 做这个工作的话,是不是要补充一些产品知识;b. 按照我的面试的情况,请问我还有什么地方需要努力和提高】

总结

春招让我深刻地感受到自己全方位的菜……每次笔试被机器学习数据挖掘算法和概率统计虐成沫,基本每次面试也被质疑为什么没学过算法……
(真的不是每个学计算机的都搞AI,身处天坑实验室一声叹息……但这事还是自己的问题。)真的要好好补上算法和复习概率统计啊,留下了没技术的眼泪……
然后是数据分析偏业务方向实习很重要,个人经历每次面试必问在某电商的实习,基本也问得很深。我对业务的了解和一些工具的学习如Hive基本从实习得来,再另外看书深化。
最后,数据分析这岗位真的杂,(从我非常有限的经历)感受到无法预测会笔试考什么,面试问什么……目前看来笔试一般涵盖概率统计、机器学习和数据挖掘算法、SQL编程,另外业务场景题、Linux甚至计算机网络等都有可能出现……
面试的话则业务和技术都要准备好,因为无法预测会遇上什么背景的面试官,只能从问题风格推测他/她是偏算法还是偏业务分析的。
全文完,撒花~~感谢看到这里的大佬!欢迎交流!(再次厚脸皮状)
宝器说确实如这位小姐姐所说,数据分析是一个定义相对宽泛的岗位,每一家的技能要求可能不大相同,但是基本的SQL、Hive等是需要熟练掌握的。
一句常谈的话:”张口闭口数据科学,你竟然连SQL都不会“,做好每一次的基础工作,千万不能眼高手低,见一张以前发过的趣图。


另上面几家公司面试所涉及的知识点,如数据倾斜处理,大表join小表的顺序,埋点,DAU(销售额下降)怎么分析,abtest等等在公众号「数据管道」都基本有所讲解。
以上,下期见。


©著作权归作者所有:来自51CTO博客作者mob604756e834f7的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 【大数据成神之路】第一版更新完毕
  2. 我看好数据湖的未来,但不看好数据湖的现在
  3. 消息中间件选型分析
  4. 什么是Zero-Copy?
  5. Java NIO?看这一篇就够了!
  6. 数据湖解决方案关键一环,IceBerg会不会脱颖而出?
  7. 《从0到1学习Flink》—— Flink Data transformation(转换)
  8. 电脑手机资料数据误删如何快速恢复?
  9. 《从0到1学习Flink》—— Data Source 介绍

随机推荐

  1. 2010年Android随想!
  2. [51CTO]Android消息机制
  3. Android中的动画详解系列【4】——Activi
  4. 解决Android 状态栏重叠
  5. android api 完整翻译之Application Fund
  6. Android EditText 学习笔记
  7. Android市场将持续爆发
  8. Android 手势识别判断,GestureDetector封
  9. Android - 约束布局实现一个简单的登陆界
  10. 我对学习delphiTeacher的《delphi调用及