数据分析师面试全攻略
数据分析师面试的三大核心
数据分析师面试通常分为三个环节:SQL笔试(考察数据处理能力)、统计学基础(考察分析方法论)、业务案例分析(考察商业思维)。每个环节都很重要,缺一不可。
SQL能力考察
基础查询
SELECT/FROM/WHERE/GROUP BY/HAVING/ORDER BY的执行顺序不要搞反:FROM→WHERE→GROUP BY→HAVING→SELECT→ORDER BY→LIMIT。
JOIN操作
INNER JOIN取交集,LEFT JOIN以左表为准右表无匹配填NULL。实际业务中LEFT JOIN最常用。多表JOIN时注意:先写核心表、用小表驱动大表、检查关联键的唯一性。
窗口函数
ROW_NUMBER(唯一排序号)、RANK(并列占位)、DENSE_RANK(并列不占位)、LAG/LEAD(前后行取值)是数据分析师的必备技能。实际场景:计算用户留存率、求移动平均。
复杂查询
WITH子查询(CTE)让复杂查询更清晰。UNION ALL合并查询。CASE WHEN做条件分组的场景非常多。
统计学基础
描述性统计
均值、中位数、众数分别反映数据的什么特征?标准差衡量离散程度。箱线图的五数概括:最小值、Q1、中位数、Q3、最大值。四分位距IQR=Q3-Q1用于识别异常值。
概率分布
正态分布最常用。中心极限定理为什么重要?不管原始数据什么分布,样本均值的分布趋近正态分布。二项分布和泊松分布的区别以及应用场景。
假设检验
P值的正确理解(不是概率,而是在原假设成立下观察到更极端结果的概率)。第一类错误(拒真)和第二类错误(取伪)。T检验(比较均值)、卡方检验(分类变量关联性)、ANOVA方差分析(多组均值比较)各适用什么场景?
A/B测试
样本量计算、实验时长、分流策略。辛普森悖论警示:总体趋势可能和分组趋势相反。
业务分析思维
指标体系
北极星指标确定核心方向。AARRR海盗模型串联用户生命周期:获取、激活、留存、变现、传播。
异动分析
某指标突然下降时怎么办?全链路拆解+维度下钻、内部vs外部原因排查、建立假设并验证。
分析报告
金字塔原理:先结论后论据。假设驱动的逻辑树结构。好的分析报告三个特点:结论明确有action item、数据可视化直观、考虑业务约束。
高频面试题
日活下降如何分析?先确认数据准确性,再排除周期性波动,然后按渠道/地域/版本拆解。
如何评估一个功能的效果?实验组vs对照组的A/B测试,确保统计显著性。
给盲人描述柱状图的练习反映了数据叙事能力。
工具与技能
SQL是基础中的基础,Excel用于快速分析,Python/R做深度分析,可视化工具Tableau或Power BI,大数据工具SparkSQL和HiveSQL。
数据分析师的核心价值是把数据转化为商业洞察。技术能力是基础,但业务理解力和沟通能力同样重要。