概要
本书是说明类的类型,主要内容是告诉我们该如何做数据分析。主要从一下几个方面进行阐述:
1数据分析的过程
确定问题-分解问题(将一个大问题分解为几个小问题)-评估(对每个问题使用数据评估)-决策 (循环执行这四个过程)。验证理论需要进行实验对比,检验理论(要注意对照组的设置)。
2数据图形化
- 散点图: 找出数据的规律和特征。可以用来查看数据的总体分布趋势,探索原因。
- 如何展示多种变量的关系:将多张相似的散点图相邻排放。
3假设检验:
- 列出各种可能。
- 利用证据排所有的不可能的假设。证伪法。
- 排出没有用的证据,然后考虑证据的诊断性,即时相对似然性。给剩下的的可能性排序。
- 具有新的证据之后重新进行检测。
4贝叶斯统计。
基础概率随着实验的进行会不断变化。
5主观概率。
将概率使用具体的数字描述,能减少分歧。
6线性回归
- 线性回归可以将数据分区,提高进度。
- 分隔的目的也有助于管理误差
- 线性回归预测需提供提供均方根提供误差范围和描述数据范围。
版权声明:本文为y15166022470原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。