数据来源
kaggle
(点击查看)
该数据是一个手游的A/Btest结果
字段名称
- userid:用户id
-
version:版本区别
A
:gate_30
B
:gate_40 - sum_gamerounds:安装后14天内,玩家玩的游戏回合数。
- retention_1:次日留存率
- retention_7:7日留存率
分析目的
运用假设检验的统计学原理对本次手游版本测试数据进行分析,确定哪个版本效果更优
数据导入与清洗
#首先导入必需的第三方包
import numpy as np
import pandas as pd
import statsmodels.stats.proportion as ssp
#读取数据
data = pd.read_csv('/home/mw/input/game5865/cookie_cats.csv')
data.head()
#数据概览
data.info()
#检查是否有空值
data.isnull().sum()
#检查是否有重复值
data.duplicated().sum(
版权声明:本文为Cassiel_f原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。