数据分析问答题

  • Post author:
  • Post category:其他


一.筛选产品、选取指标衡量商品

网易严选是网易旗下原创生活类自营电商品牌,深度贯彻“好的生活,没那么贵”的品牌理念。商品覆盖居家、餐厨、配件、服装、洗护、母婴、原生态饮食等几大类目,兼具品质和性价比,得到用户的广泛好评。若你是网易严选负责商品的数据分析师,当面对以下业务问题时,你会如何解决?

① 用户增长团队期望选择一批合适的商品用于吸引新客,期望你帮助从数据的角度筛选出一批合适的商品,你会如何帮助他们进行筛选?请描述你的思路。

② 商品研发负责人期望能有一套指标帮助衡量开发的商品表现,请你帮助设计对应的评估方案,包括设计思路、涉及的数据指标等

答案:

1.

(1)首先定位发展方向,是发展现有产品还是进行新产品的拓宽。可以通过用户调研,调查目前用户选择网易严选平台的原因,是因为专注于一个方向,还是因为性价比高,如果核心用户选择专注于一个方向,则更应该选择发展现有产品,否则可以考虑拓宽产品类型。

(2)确定方向后,确定具体产品,需要考虑用户的消费能力,选择品牌等。通过调研用户选择其他平台而不选择网易严选的原因,调查产品类别是否存在不足。确定产品类别后,还需考虑用户的消费能力,可根据消费者过往消费记录或调研将用户大致分为高水平消费者、中等水平消费者、低水平消费者三类,从而选择相应价位的产品

(3) 确定大致价格后,还需要调研产品的具体功能还是什么点对于消费者性价比高。例如,如果100元MUJI的香薰机还是80元其他品牌、功能相似的香薰机。

2.

(1)初期,可进行定性调查,考虑小范围用户体验的调研,KPI可以考虑用户一个月内使用次数等。chan从用户日常的使用过程中,衡量商品开发效果。例如,对于新买的家具,用户是否需要晾晒一段时间或者栽种盆栽来去除气味;针对同一款产品的不同颜色,用户是否具有偏好等。

(2)推广期,可进行定量调查,并和同类产品进行比较。

KPI: 该产品和同类产品一个月的浏览次数、点击次数、购买次数、各类评价的数量,以及衍生指标。购买率 = 购买次数/总浏览次数,点击率=点击次数/浏览次数,好评率=好评数量/评价数量,差评率=差评数量/总评价数量等。

该产品浏览次数较低,可能是因为推广度不够;浏览次数高,点击次数、点击率较低则说明该产品开发没有解决用户最急迫的需求,不能吸引用户;好评率低,则说明该产品存在问题等。

二.构建家居类用户画像、选择商品

①   居家品类期望了解购买居家类目的用户是哪群人,期望你帮助她进行品类用户画像的构建,以作为居家品类规划和商品运营的参考,你会从哪些维度去完成类目用户的刻画?

②   如果需要选择一批商品来吸引新用户,你会从哪些维度进行选择?请写出维度,选择的原因,对应的指标

答案

1.  a.构建居家品类用户画像的目的是,了解这类用户的特征进而了解他们的需求,从而作为参考帮助运营给用户提供区别化的对待、个性化的服务,达到提升用户购物体验进而提升平台流水的效果。

b.要具体的刻画购买居家品类的用户,要从和居家有关系的方面入手,涵盖尽可能多的方面。根据以上具体业务目标,我选用以下维度描述购买居家类目的用户:①自然属性 年龄,性别;②社会属性 职业,住在哪里,婚恋状况,教育程度; 三兴趣属性 喜欢进行的活动,花费时间最多的工作之外的活动,是否养宠物 ④消费属性 消费频次,消费额,最喜欢购买哪个品牌的居家类商品,购买次数最多的居家类商品是什么。这些数据平台本身容易获得,对于个别数据如婚恋状况、教育程度等可以通过问卷的形式收集得到。

2. a.从商品品类维度选,各种品类的商品都挑选,显示出网易严选商品的齐全、种类多。涉及到的指标有,覆盖到的商品类目有多少、商品类目有哪些。

b.从商品品质维度选,显示出网易严选定位的一大特点:品质优,这对于商品来说是一个硬核项。要直观的表示商品品质不太容易,可以利用品牌效应,选大牌商品,列举出网易严选平台上有多少垂直领域里的大牌,突出平台的定位。涉及到的指标有:网易严选有多少大牌/专业品牌,具体到每个领域的大牌有哪些

c.从商品性价比维度选,显示出网易严选定位的另一大特点:性价比高。涉及到的指标有:优质商品在网易严选的定价和在其他平台的定价对比

d.从商品好评率维度选,选好评率最高的,让用户的赞扬声感染更多的用户。涉及到的指标有:商品评价里好评个数/评价总数

三.探查原因、聚类

用户分析是电商数据分析中重要的模块,在对用户特征深度理解和用户需求充分挖掘基础上,进行全生命周期的运营管理(拉新—>活跃—>留存—>价值提升—>忠诚),请尝试回答以下3个问题:

① 用户第一单购买的行为往往反映了用户对平台的信任度和消费能力。现在数据库中有一张用户交易表order,其中有userid(用户ID)、amount(消费金额)、paytime(支付时间),请写出对应的SQL语句,查出每个用户第一单的消费金额。

② 当你发现本月的支付用户数环比上月大幅下跌(超30%),你会如何去探查背后的原因?请描述你的思路和其中涉及的关键指标

③ 为了更好的理解用户,我们通常会基于用户的特征对用户进行分类,便于更加精细化的理解用户,设计产品和运营玩法,请你设计对应的聚类方法,包括重点的用户特征的选择及聚类算法并说明其基本原理和步骤

答案:

1.

select userid, amount  
from order  
group by userid  
order by paytime  
limit 1

2.step 1 描述性统计:下降幅度是多少(30%);

step 2 观察变化:环比或同比变化;从长期和短期波动角度出发看近几个月的支付用户数。

step 3 评估变化/方差分析:降幅是否在正常范围内

step 4 交叉分析/相关性分析:有哪些指标可能和支付用户数下降有关,有关到什么程度?比如日活,支付率,弃买率,新增用户数,老用户复购率等;

step 5 业务分析:这些相关指标的运营部门是否有某些运营策略或者活动造成了这些指标的变化从而间接导致了支付用户数下降;

step 6 回归分析/预测:这种下跌趋势还会持续多久,跌幅最坏到什么程度;

step 7 风险/损失预估:支付用户数的下降对核心KPI(商品总营收)有什么影响;

step 8 制定策略:如何挽回损失,如何下次避免。

3.用户特征选择:性别,年龄,地域特征,用户消费金额,用户购买物品类别,用户购买频率。

聚类算法:kmeans算法

kmeans算法基本原理:通过特征分析对用户进行分类,它采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。

步骤:1)初始化K个类别,同时随机选取K个聚类中心点

2)分别计算每个样本点与K个聚类中心点的欧式距离,将样本点分配到距离最小的类别中,重新确定聚类中心(质心),依次循环,直到聚类中心点不再改变时循环结束。



版权声明:本文为hhcharming原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。