数据分析系列内容,“平均值”可靠吗?辛普森悖论是什么?总体局部如何选择?数据分析是如何应用到日常生活中的?这篇文章作者将详细给出答案,通过白话方式介绍复杂问题。推荐对数据分析感兴趣的童鞋阅读。
00 写在前面
不知道大家有没有类似的经历?有没有曾经因为追求高端的算法和工具而没有及时交付最终的业务结果,最后被老板一通批评;有没有拿着一个单点的数据分析结果就给出了一个全面的结论和建议;有没有给过一些因果倒置或者“幸存者偏差”的结论,导致业务走了弯路。这些经历大家多多少少都会遇到,为什么…
只要是在可拆解场景,都有「坑」的身影。本文从「辛普森悖论」着手,侧重于其在业务中的实际表现场景,分析业务中有哪些可能踩坑的地方,一起来看一下吧。
今天分享一个分析师的老朋友——「辛普森悖论」,只要是在可拆解场景,都有「坑」的身影,所以也成为了数据分析面试中的常客。本文主要侧重于其在业务中的实际表现场景,需要分析同学引起警惕,其之「坑」,小则忽略改进机会,大则结论直接错误。
一、什么是辛普森悖论
既然叫「悖论」,首先肯定是反常识的。还是以一个简单的案例来引入吧:
(案例瞎编,如有雷同…
近期文章
归档
- 2023年3月 (617)
- 2023年2月 (950)
- 2023年1月 (741)
- 2022年12月 (944)
- 2022年11月 (1133)
- 2022年10月 (1054)
- 2022年9月 (1073)
- 2022年8月 (1201)
- 2022年7月 (1192)
- 2022年6月 (1255)
- 2022年5月 (1363)
- 2022年4月 (1368)
- 2022年3月 (1431)
- 2022年2月 (971)
- 2022年1月 (989)
- 2021年12月 (1032)
- 2021年11月 (932)
- 2021年10月 (826)
- 2021年9月 (1079)
- 2021年8月 (1132)
- 2021年7月 (1048)
- 2021年6月 (1168)
- 2021年5月 (883)
- 2021年4月 (824)
- 2021年3月 (1112)
- 2021年2月 (760)
- 2021年1月 (1109)
- 2020年12月 (1158)
- 2020年11月 (1246)
- 2020年10月 (1044)
- 2020年9月 (850)
- 2020年8月 (1324)
- 2020年7月 (1340)
- 2020年6月 (1334)
- 2020年5月 (1869)
- 2020年4月 (2453)
- 2020年3月 (2292)
- 2020年2月 (334)
- 2020年1月 (4)
- 2019年12月 (2)
- 2019年11月 (1)
- 2019年9月 (1)
- 2019年8月 (2)
- 2019年7月 (1)
- 2019年5月 (2)
- 2019年4月 (1)
- 2019年3月 (2)
- 2019年1月 (1)
- 2018年12月 (1)
- 2018年11月 (2)
- 2018年10月 (2)
- 2018年9月 (1)
- 2018年8月 (4)
- 2018年7月 (2)
- 2018年6月 (3)
- 2018年5月 (2)
- 2018年4月 (4)
- 2018年3月 (2)
- 2018年2月 (1)
- 2018年1月 (1)
- 2017年12月 (1)
- 2017年11月 (2)
- 2017年10月 (1)
- 2017年9月 (1)
- 2017年8月 (2)
- 2017年7月 (1)
- 2017年6月 (2)
- 2017年5月 (4)
- 2017年4月 (3)
- 2017年3月 (1)
- 2017年2月 (2)
- 2017年1月 (2)
- 2016年12月 (1)
- 2016年11月 (2)
- 2016年10月 (2)
- 2016年9月 (2)
- 2016年8月 (2)
- 2016年7月 (1)
- 2016年6月 (2)
- 2016年5月 (3)
- 2016年4月 (2)
- 2013年4月 (8)
- 2013年3月 (20)
- 2013年2月 (2)
- 2013年1月 (10)