毕业论文
您现在的位置: 腹泻胃胀 >> 胃胀气的原因 >> 正文 >> 正文

数据分析师常见的业务分析逻辑面试题

来源:腹泻胃胀 时间:2021-9-16
皮肤白癜风名家治疗 http://pf.39.net/bdfyy/bdfyc/190129/6845117.html

来源:数师兄

作者:数先生

1.不用任何公开参考资料,估算今年新生儿出生数量。

采用两层模型(人群画像x人群转化):新生儿出生数=Σ各年龄层育龄女性数量*各年龄层生育比率。

(一般面试中采用这种方法,即费米估计问题,可以参考《这也能想到?——巧妙解答无厘头问题》)

从数字到数字:如果有前几年新生儿出生数量数据,建立时间序列模型(需要考虑到二胎放开的突变事件)进行预测

找先兆指标,如婴儿类用品的新增活跃用户数量X表示新生儿家庭用户。Xn/新生儿n为该年新生儿家庭用户的转化率,如X/新生儿为年新生儿家庭用户的转化率。该转化率会随平台发展而发展,可以根据往年数量推出今年的大致转化率,并根据今年新增新生儿家庭用户数量推出今年估计的新生儿数量。

2.如果次日用户留存率下降了5%该怎么分析?

首先采用“两层模型”分析:对用户进行细分,包括新老、渠道、活动、画像等多个维度,然后分别计算每个维度下不同用户的次日留存率。通过这种方法定位到导致留存率下降的用户群体是谁。

对于目标群体次日留存下降问题,具体情况具体分析。具体分析可以采用“内部-外部”因素考虑。

a.内部因素分为获客(渠道质量低、活动获取非目标用户)、满足需求(新功能改动引发某类用户不满)、提活手段(签到等提活手段没达成目标、产品自然使用周期低导致上次获得的大量用户短期内不需要再使用等);

b.外部因素采用PEST分析(宏观经济环境分析),政治(政策影响)、经济(短期内主要是竞争环境,如对竞争对手的活动)、社会(舆论压力、用户生活方式变化、消费心理变化、价值观变化等偏好变化)、技术(创新解决方案的出现、分销渠道变化等)。

3.卖玉米如何提高收益?价格提高多少才能获取最大收益?

收益=单价*销售量,那么我们的策略是提高单位溢价或者提高销售规模。

提高单位溢价的方法:

(1)品牌打造获得长期溢价,但缺陷是需要大量前期营销投入;

(2)加工商品占据价值链更多环节,如熟玉米、玉米汁、玉米蛋白粉;重定位商品,如礼品化等;

(3)价格歧视,根据价格敏感度对不同用户采用不同定价。

销售量=流量x转化率,上述提高单位溢价的方法可能对流量产生影响,也可能对转化率产生影响。

收益=单价x流量x转化率,短期内能规模化采用的应该是进行价格歧视,如不同时间、不同商圈的玉米价格不同,采取高定价,然后对价格敏感的用户提供优惠券等。

4.类比到头条的收益,头条放多少广告可以获得最大收益,不需要真的计算,只要有个思路就行。

收益=出价x流量x点击率x有效转化率,放广告的数量会提高流量,但会降低匹配程度,因此降低点击率。最大收益是找到这个乘积的最大值,是一个有约束条件的最优化问题。同时参考价格歧视方案,可以对不同的用户投放不同数量的广告。

5.APP激活量的来源渠道很多,怎样对来源渠道变化大的进行预警?

如渠道使用时间较长,认为渠道的app激活量满足一个分布,比较可能是正态分布。求平均值和标准差,对于今日数值与均值差大于3/2/1个标准差的渠道进行预警。

对于短期的新渠道,直接与均值进行对比。

6.用户刚进来APP的时候会选择属性,怎样在保证有完整用户信息的同时让用户流失减少?

采用技术接受模型(TAM)来分析,影响用户接受选择属性这件事的主要因素有:技术接受模型提出了两个主要的决定因素:①感知的有用性(perceivedusefulness),反映一个人认为使用一个具体的系统对他工作业绩提高的程度;

②感知的易用性(perceivedeaseofuse),反映一个人认为容易使用一个具体的系统的程度。

(1)感知有用性:a.文案告知用户选择属性能给用户带来的好处(2)感知易用性:a.关联用户第三方账号(如微博),可以冷启动阶段匹配用户更有可能选择的属性,推荐用户选择。b.交互性做好。

(3)使用者态度:用户对填写信息的态度a.这里需要允许用户跳过,后续再提醒用户填写b.告知用户填写的信息会受到很好的保护(4)行为意图:用户使用APP的目的性,难以控制(5)外部变量:如操作时间、操作环境等,这里难以控制

7.如何识别作弊用户(爬虫程序,或者渠道伪造的假用户)

分类问题可以用机器学习的方法去解决,下面是我目前想到的特征:(1)渠道特征:渠道、渠道次日留存率、渠道流量以及各种比率特征

(2)环境特征:设备(一般伪造假用户的工作坊以低端机为主)、系统(刷量工作坊一般系统更新较慢)、wifi使用情况、使用时间、来源地区、ip是否进过黑名单。

(3)用户行为特征:访问时长、访问页面、使用间隔、次日留存、活跃时间、页面跳转行为(假用户的行为要么过于一致,要么过于随机)、页面使用行为(正常用户对图片的点击也是有分布的,假用户的行为容易过于随机)

(4)异常特征:设备号异常(频繁重置idfa)、ip异常(异地访问)、行为异常(突然大量点击广告、点赞)、数据包不完整等

8.怎么做恶意刷单检测?

分类问题用机器学习方法建模解决,我想到的特征有:(1)商家特征:商家历史销量、信用、产品类别、发货快递公司等(2)用户行为特征:用户信用、下单量、转化率、下单路径、浏览店铺行为、支付账号(3)环境特征(主要是避免机器刷单):地区、ip、手机型号等(4)异常检测:ip地址经常变动、经常清空cookie信息、账号近期交易成功率上升等(5)评论文本检测:刷单的评论文本可能套路较为一致,计算与已标注评论文本的相似度作为特征(6)图片相似度检测:同理,刷单可能重复利用图片进行评论

9.一个网站销售额变低,你从哪几个方面去考量?

首先要定位到现象真正发生的位置,到底是谁的销售额变低了?这里划分的维度有:a.用户(画像、来源地区、新老、渠道等)b.产品或栏目c.访问时段

定位到发生未知后,进行问题拆解,

转载请注明:http://www.dgzhengxing.net/wzqdyy/8239.html

  • 上一篇文章:
  • 下一篇文章: 没有了