如何用总体比例估计确定产品质量

2024-01-07 14:59

本文主要是介绍如何用总体比例估计确定产品质量,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

内容导入:

公司生产了一批产品,但这批产品到底怎么样,是不是所有的产品都符合质量标准,这批产品里有没有次品,产品的次品率又是多少,次品率是否符合国家标准?这就是我们今天要说的总体比例的问题了。

之前我们讲过总体均值估计及其在在企业生产过程中的应用,今天我们就来看看总体比例估计以及它在在企业生产过程中的应用。

一、两点分布与二项分布

我们以产品抽样过程为例,假如我们从一批产品中随机抽出一个产品,这个产品可能是次品也可能不是次品,也就是说产品的品质有两种可能:次品、非次品。

在统计学中,我们把这批产品叫做总体,随机抽出的产品叫样本,而产品的品质可以用随机变量X表示,X的取值有两种可能:次品、非次品。

此时若样本为次品的概率是p,随机变量X就服从一个两点分布,用b(1-p)表示,X取值的概率情况即:在这里插入图片描述

两点分布的期望(总体均值)E(x)=p,方差Var(x)=p(1-p)。

我们称上述从总体中随机抽出一个样本的过程为一次伯努利实验,重复抽取n次就是n次伯努利实验。n次抽样抽到次品的次数我们用另一个随机变量Y表示,Y的取值可能是1,2,…,n,Y的分布即二项分布b(n,p)。

两点分布就是n=1的二项分布。

二、总体比例的点估计

总体比例的点估计就是样本比例。

三、大样本总体比例区间估计

3.1区间估计理论

当产品的品质X服从两点分布b(1,p)时,两点分布b(1,p)具有一个显著特点总体均值等于p,总体方差p(1-p)。样本量n足够大时,总体比例的估计与大样本、方差未知时的总体均值估计类似,只是此时我们不再用样本方差代替总体方差。

根据中心极限定理,样本量n足够大时,样本均值渐进正态分布,而在这里插入图片描述

可见样本均值的期望为p,标准化的样本均值服从标准正态分布,即:在这里插入图片描述在这里插入图片描述

的置信水平下,有如下公式成立,在这里插入图片描述在这里插入图片描述

为标准正态分布右侧面积为在这里插入图片描述

的Z值,

可以从不等式在这里插入图片描述

求解p的取值范围,在这里插入图片描述

就等价于在这里插入图片描述

这就是一个一元二次不等式的求解,我们这里就不在介绍求解过程了。

最终我们将置信水平在这里插入图片描述

的置信区间用[Pl,Pu]表示,其中在这里插入图片描述

3.2样本量的确定

在进行总体比例的估计之前,我们要先完成抽样的过程,而抽样就需要我们确定一个适当的样本量。我们进行估计的时候总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度(置信水平)就需要扩大置信区间,而过宽的置信区间在实际估计中是没有意义的,因此,想要保证置信区间的宽度,就要用一定的样本量作为保证,所以样本量的确定也是我们进行估计过程中十分重要的一步,我们知道区间的宽度为在这里插入图片描述

我们给出一个区间宽度d即置信水平就可以求得合适的样本量。

推导过程不再说明,最终我们求得不等式组:在这里插入图片描述

的解就是样本量n的取值范围,然后我们只需取出取值范围内n的最小整数值作为样本量就可以达到要求。

上面的不等式中有一个值^p我们并不知道,此时我们可以用类似的样本比例代替,也可以提前做一个实验调查,选择一个初始样本,以该样本的样本比例作为其估计值。当我们估计该值时,也可以令其为0.5。

3.3区间估计应用举例

我们要检测一批产品的次品率,要求其区间估计的宽度小于等于0.1,置信水平为0.95,则
在这里插入图片描述

我们令^p为0.5,则求得最小样本量为381。

假设抽取381个样本后,发现这381个样本中有15个为次品,求这批产品次品率的95%置信水平的置信区间。

代入下面的公式:在这里插入图片描述

我们求得置信区间为(0.0241, 0.0641)

同样这里我们也用python编程提供了求最小样本量,总体比例估计的函数,

求最小样本量的函数,只需输入区间宽度最大值,置信水平和^p估计值就可以求得最小样本容量。

import scipy.stats 
import math 
def P_sample_num(d,confidence=0.95,p=0.5): ''' d:区间宽度 confidence:置信水平 ''' alpha = 1 - confidence z_score= scipy.stats.norm.isf(alpha / 2) a=d**2 b=2*z_score**2*(d**2-2*(p-p**2)) c=(d**2-1)*z_score**4 sq=np.sqrt(b**2-4*a*c) n=0.5*(-b+sq)/a return math.ceil(n)

求总体比例估计的函数,只需输入样本量、所求占比的样本数、置信水平,就可以得到点估计和区间估计。

import numpy as np 
import scipy.stats 
def p_interval(n,n_p,confidence=0.95): ''' n:样本量 n_p:所求占比的样本数 confidence:置信水平 ''' p=n_p/n alpha = 1 - confidence z_score = scipy.stats.norm.isf(alpha / 2)  # z分布临界值 a=n+z_score**2 b=-(2*n*p+z_score**2) c=n*p**2 sq=np.sqrt(b**2-4*a*c) PL=0.5*(-b-sq)/a PU=0.5*(-b+sq)/a return p,(round(PL,4),round(PU,4))

想获取更多内容,请关注海数据实验室公众号。

本期分享到这里,我们会每天更新内容,咱们下期再见,期待您的再次光临。有什么建议,比如想了解的知识、内容中的问题、想要的资料、下次分享的内容、学习遇到的问题等,请在下方留言。如果喜欢请关注。
在这里插入图片描述在这里插入图片描述社群推荐:

更多有关数据分析的精彩内容欢迎加入海数据在线数据分析交流群,有什么想法

或者疑问都可在里面提出,与同行零距离交流,共同成长进步,请识别下面二维码

加火星小海马微信,邀你进群。
在这里插入图片描述

这篇关于如何用总体比例估计确定产品质量的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/580299

相关文章

poj 2976 分数规划二分贪心(部分对总体的贡献度) poj 3111

poj 2976: 题意: 在n场考试中,每场考试共有b题,答对的题目有a题。 允许去掉k场考试,求能达到的最高正确率是多少。 解析: 假设已知准确率为x,则每场考试对于准确率的贡献值为: a - b * x,将贡献值大的排序排在前面舍弃掉后k个。 然后二分x就行了。 代码: #include <iostream>#include <cstdio>#incl

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

数据集 3DPW-开源户外三维人体建模-姿态估计-人体关键点-人体mesh建模 >> DataBall

3DPW 3DPW-开源户外三维人体建模数据集-姿态估计-人体关键点-人体mesh建模 开源户外三维人体数据集 @inproceedings{vonMarcard2018, title = {Recovering Accurate 3D Human Pose in The Wild Using IMUs and a Moving Camera}, author = {von Marc

数据集 Ubody人体smplx三维建模mesh-姿态估计 >> DataBall

Ubody开源人体三维源数据集-smplx-三维建模-姿态估计 UBody:一个连接全身网格恢复和真实生活场景的上半身数据集,旨在拟合全身网格恢复任务与现实场景之间的差距。 UBody包含来自多人的现实场景的1051k张高质量图像,这些图像拥有2D全身关键点、3D SMPLX模型。 UBody由国际数字经济学院(IDEA)提供。 (UBody was used for mesh r

日本某地发生了一件谋杀案,警察通过排查确定杀人凶手必为4个 嫌疑犯的一个。以下为4个嫌疑犯的供词。

日本某地发生了一件谋杀案,警察通过排查确定杀人凶手必为4个 嫌疑犯的一个。以下为4个嫌疑犯的供词。 A说:不是我。 B说:是C。 C说:是D。 D说:C在胡说 已知3个人说了真话,1个人说的是假话。 现在请根据这些信息,写一个程序来确定到底谁是凶手。  static void Main()         {             int killer = 0;             fo

【压力测试】如何确定系统最大并发用户数?

一、明确测试目的与了解需求 明确测试目的:首先需要明确测试的目的,即为什么要确定系统的最大并发用户数。这通常与业务需求、系统预期的最大用户负载以及系统的稳定性要求相关。 了解业务需求:深入了解系统的业务特性,包括用户行为模式、业务高峰期的时间段、用户请求的复杂程度等。 二、进行基准测试 确定正常负载下的性能:在开始压力测试之前,进行基准测试以确定系统在正常负载下的性能表现。这有助

数字化变革驱动珠江电缆产品质量与数量双提升

在全球化与科技迅猛发展的今天,传统制造业面临前所未有的挑战和机遇。 珠江电缆引入先进的生产管理系统,通过数字化手段优化生产流程。从原材料采购、生产计划到成品检验,每个环节都实现了信息化和数据化。这不仅减少了人为误差,还大大提升了生产效率,使得产品数量在短时间内得到了显著增加。 为了确保产品质量的稳定和提升,珠江电缆积极引进智能制造技术。通过自动化生产线和智能检测设备的应用,企业能够实时

【HDU】1285 确定比赛名次 拓扑排序

确定比赛名次 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 10963    Accepted Submission(s): 4374 Problem Description 有N个比赛队(1<=N<=500),

各大公司中印员工比例

From http://www.myvisajobs.com/, 从Perm的申请数量基本可以看出来, 大家有何感受? Facebook:   China(148),India(93) Google:       China(522),India(467) Linkedin:     India(124),China(64), Apple:        India

MES系统:优化生产流程,产品质量与追溯性

MES系统(Manufacturing Execution System,制造执行系统)在实现产品质量管理方面发挥着重要作用。它通过集成生产过程的各种数据和功能,帮助企业提升产品质量、降低不良率,并确保生产过程的稳定性和一致性。以下是万界星空科技MES系统实现产品质量管理的几个关键方面: 一、数据采集与监控 实时数据采集:MES系统能够实时采集生产过程中的各种数据,包括设备状态、工艺参数、