做好A/B测试,需要了解的6个统计学概念

2024-04-26 04:18

本文主要是介绍做好A/B测试,需要了解的6个统计学概念,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

做好A/B测试,需要了解的6个统计学概念

A/B测试是一项用来验证产品新功能效果的科学在线测试方法,它能够通过对实际实验数据进行统计分析从而帮助用户做出对产品的不同功能版本进行取舍的决策。为了使A/B测试得到的结论更严谨更科学,我们在AB测试中借助了强大的统计学做理论支持。

我们整理了以下几个基本概念,帮助大家更好地理解A/B测试中的统计学知识:

均值

平均数是反映数据集中趋势的一项指标,一般通过将一组数据集中所有数据之和除以这组数据集的数据个数得到。在A/B测试中,我们无法知道所有用户的行为(如点击率)的真正均值,而只能使用每个抽样样本集的均值。

方差

方差是衡量随机变量或一组数据的离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。当方差越高时,我们预测的平均数偏离真正平均数的可能性就越大,我们采样得到的均值从而可能就越不准确。

抽样

由于我们不可能知道所研究事物总体分布的均值,所以我们不得不在总体分布中进行抽样,从而基于抽样数据进行统计分析。一般来说,我们抽样的样本数越多,方差也会逐渐变小,从而使抽样样本的均值和真正均值的误差降低。

正态分布

又称“高斯分布”,是一个在数学、物理、工程与社会学等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。正态分布的概率密度函数曲线呈钟形(两头低,中间高,左右对称),因此又叫钟形曲线。

在进行A/B测试时,有些测试者会直接简单地通过对不同实验版本的指标均值进行比较,从而做出版本之间优劣差异的结果判断。这实际使用了点估计的方法。但是我们需要意识到:

由于样本毕竟有误差,因此点估计的误差也往往比较大。一种更严谨和精确的方法是假设检验的方法,因此专业的A/B测试基本都会选择假设检验来对实验进行判断。

假设检验

又叫显著性检验,是统计学中用来判断从样本得出的结论能否推论到总体的一种方法。一般实验者会提出提出两个假设:一个是“原假设”,另一个是“备择假设”(备选假设)。

其中,“原假设”代表两个样本没有本质区别,而“备择假设”代表两个样本有本质区别。这两个假设互相对立,并且只有一个真正成立。而通过假设检验的分析,我们就能判断出哪个假设有更大的概率成立。在假设检验中,实验者可能犯两类错误:一类错误是指当原假设为真时拒绝了原假设,其概率标记为α(alpha);二类错误是指当原假设为假时没有拒绝原假设,其概率标记为β(Beta)。

通常来说,犯一类错误的影响会比犯二类错误的大。

置信区间

对于假设检验的结果表达来说,置信区间是一个非常重要的概念。置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。

置信区间展现的是目标参数的真实值在一定置信水平下落在测量结果附近的范围大小。在A/B测试中,由于我们无法知道真实分布的均值,因此只能通过采样样本进行统计推理,而置信区间便是用来减轻采样误差的风险。置信区间的范围越小,我们的结果往往越精确。

公式如下:
在这里插入图片描述

其中α为显著性水平(如0.05或0.1等),而 (1-α)指置信水平。在假设检验分析中,我们可以通过Z分布来计算出累计概率,即得出p-value,然后通过α与p-value的比较,我们可以进一步做出A/B两个版本是否有较大概率存在明显差异的结论。

以上,6个概念,你都了解了吗?


Testin A/B测试服务宣布永久免费,加入我们,一起开启科学增长之路吧:立马免费开始!

这篇关于做好A/B测试,需要了解的6个统计学概念的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/936697

相关文章

高度内卷下,企业如何通过VOC(客户之声)做好竞争分析?

VOC,即客户之声,是一种通过收集和分析客户反馈、需求和期望,来洞察市场趋势和竞争对手动态的方法。在高度内卷的市场环境下,VOC不仅能够帮助企业了解客户的真实需求,还能为企业提供宝贵的竞争情报,助力企业在竞争中占据有利地位。 那么,企业该如何通过VOC(客户之声)做好竞争分析呢?深圳天行健企业管理咨询公司解析如下: 首先,要建立完善的VOC收集机制。这包括通过线上渠道(如社交媒体、官网留言

将一维机械振动信号构造为训练集和测试集(Python)

从如下链接中下载轴承数据集。 https://www.sciencedirect.com/science/article/pii/S2352340918314124 import numpy as npimport scipy.io as sioimport matplotlib.pyplot as pltimport statistics as statsimport pandas

BD错误集锦8——在集成Spring MVC + MyBtis编写mapper文件时需要注意格式 You have an error in your SQL syntax

报错的文件 <?xml version="1.0" encoding="UTF-8" ?><!DOCTYPE mapperPUBLIC "-//mybatis.org//DTD Mapper 3.0//EN""http://mybatis.org/dtd/mybatis-3-mapper.dtd"><mapper namespace="com.yuan.dao.YuanUserDao"><!

@ControllerAdvice:你可以没用过,但是不能不了解

1.概述 最近在梳理Spring MVC相关扩展点时发现了@ControllerAdvice这个注解,用于定义全局的异常处理、数据绑定、数据预处理等功能。通过使用 @ControllerAdvice,可以将一些与控制器相关的通用逻辑提取到单独的类中进行集中管理,从而减少代码重复,提升代码的可维护性。 定义如下 /*** Specialization of {@link Component @

【Unity Shader】片段着色器(Fragment Shader)的概念及其使用方法

在Unity和图形编程中,片段着色器(Fragment Shader)是渲染管线中的一个阶段,负责计算屏幕上每个像素(片段)的颜色和特性。片段着色器通常在顶点着色器和任何几何处理之后运行,是决定最终像素颜色的关键步骤。 Fragment Shader的概念: 像素处理:片段着色器处理经过顶点着色器和几何着色器处理后,映射到屏幕空间的像素。颜色计算:它计算每个像素的颜色值,这可能包括纹理采样、光

【Unity Shader】Alpha Blend(Alpha混合)的概念及其使用示例

在Unity和图形编程中,Alpha Blend(也称为Alpha混合)是一种用于处理像素透明度的技术。它允许像素与背景像素融合,从而实现透明或半透明的效果。Alpha Blend在渲染具有透明度的物体(如窗户、玻璃、水、雾等)时非常重要。 Alpha Blend的概念: Alpha值:Alpha值是一个介于0(完全透明)和1(完全不透明)的数值,用于表示像素的透明度。混合模式:Alpha B

编译测试后出现“发现不明确的匹配”错误

原文链接:http://blog.163.com/zhaoyanping_1125/blog/static/201329153201204218533/ 错误提示: 【“/”应用程序中的服务器错误。  分析器错误 说明: 在分析向此请求提供服务所需资源时出错。请检查下列特定分析错误详细信息并适当地修改源文件。  分析器错误信息: 发现不明确的匹配。】   这个问题发生原因一般情况是

RODNet安装测试

项⽬地址: GitHub - yizhou-wang/RODNet: RODNet: Radar object detection network 搭建环境并配置RODNet 1. 参考README.md搭建并配置环境 准备数据集 1. 本实验使⽤ ROD2021 dataset. 百度⽹盘链接:百度网盘 请输入提取码 密码:slxy 2. 使⽤这个script来重新组织文件。 具体形

Mockito测试

Mockito 一 mockito基本概念 Mock测试是单元测试的重要方法之一,而Mockito作为一个流行的Mock框架,简单易学,且有非常简洁的API,测试代码的可读性很高。 Mock测试就是在测试过程中,对于一些不容易构造(如HttpServletRequest必须在Servlet容器中才能构造出来)或者说获取比较复杂的对象(如JDBC中的ResultSet对象)

jmeter测试https请求

公司最近在搞全站HTTPS改造,进一步提高网站的安全性,防止运营商劫持。那么,改造完成后,所有前后端的URL将全部为https。 So ,研究下怎么用Jmeter访问https请求呢。 其实很简单, 第一步在jmeter中创建HTTP请求,如下图进行配置,https端口为443; 第二步,在本机浏览器,如Chrome中导入该域名证书,在更多工具-设置-管理证书的地方,找到该证书,导出到本地。然后在