请问0-1分布中k和p的含义是什么?
p代表事件发生一次概率,k代表事件发生次数
统计学分布类型有哪些呢?
离散分布族
在这里总结一下常见的分布族,这篇主要介绍一下几个常见的离散分布并给出几个常常用到的初等数学中的定理。
其实这些分布大家都知道是什么,但是总是忘记叫什么,我小时候背古诗词也是这样,只记得诗词的内容但是从来不背诗名和作者(有点对不起各大诗人)。
1离散均匀分布
太简单了,不想介绍。
不过给出两个小学就需要掌握的公式吧,有助于计算离散均匀分布的期望和方差。
sum_{i=1}^{k}i=frac{k(k+1)}{2},高斯求和,我真的见过幼儿园小朋友都会这个;sum_{i=1}^ki^2=frac{k(k+1)(2k+1)}{6},这个用来求离散均匀分布的二阶矩很管用(废话了)
怎样计算期望和方差就不说了。
2超几何分布
经典的不放回摸球游戏可用于理解这一分布。
有N个几乎完全相同的球在一个缸内,其中有M个红球,N-M个绿球,蒙眼随机摸出K个球,其中刚好摸出x个红球的概率是多少?用X来表示K个球中红球的个数,则X服从超几何分布。
概率分布如下所示:
P(X=x|N,M,K)=frac{egin{pmatrix}Mxend{pmatrix}egin{pmatrix}N-MK-xend{pmatrix}}{egin{pmatrix}NKend{pmatrix}}
而期望为:EX=frac{KM}{N};
方差则为:VarX=frac{KM}{N}(frac{(N-M)(N-K)}{N(N-1)})
3二项分布
二项分布是我们最常见的离散分布了,并且经常会用到。
其来源于Bernoulli试验,关于Bernoulli试验在此同样不赘述。而服从二项分布的随机变量,可以定义为n个伯努利试验中成功试验的数目。于是可以得到,
P(Y=y|n,p)=egin{pmatrix}nyend{pmatrix}p^y(1-p)^{n-y},y=0,1,2,...,n
在这里可以发现,利用二项式定理就可以证明二项分布满足概率和为1.
二项式定理很有用,初高中应该学过,我也不赘述了。
二项分布的期望和方差为EX=np,VarX=np(1-p)
另外值得一提的是其矩母函数,在上一篇文章简单介绍了下矩母函数,二项分布的矩母函数实际上就可以利用二项式定理。
4Poisson(泊松)分布
泊松分布也是一个应用非常广泛的离散分布,常常用来描述等待某事物出现的现象,在数学建模中可以用这个来刻画等公共汽车、等顾客进入商场等等事件。
(我个人常常记不住泊松分布的概率分布,我有罪,总是莫名觉得其和指数分布长得蛮像的。)
泊松分布的参数只有一个,即是lambda,其概率分布为:
P(X=x|lambda)=frac{e^{-lambda}lambda^x}{x!},x=0,1,...
要证明其概率和为1可以用到e^x在原点展开的泰勒级数。
参数lambda即是泊松分布的期望和方差,非常容易记,矩母函数就不赘述了,同样可以利用泰勒级数得到。
4.1泊松分布和二项分布的递推关系
泊松分布和二项分布都存在概率的递推关系,利用这一关系同样可以证明二项分布的泊松近似(即当p足够小,n足够大时),可以用泊松分布来近似二项分布,其中lambda=np.具体不赘述怎样证明二项分布的泊松近似了,除了这个办法,还可以利用矩母函数来证明泊松近似。
5负二项分布
在介绍完二项分布和泊松分布后,引入负二项分布,其实我平常见负二项分布见的不多,可能也是因为不记名字的原因。负二项分布可以简记为NB(r,p)(这么看起来,容易记多了),另外负二项分布实际上还包括了几何分布(即几何分布是一种特殊的二项分布)。
负二项分布同样和Bernoulli有关,二项分布是指定了试验次数,描述这些试验中成功了的试验的次数,而负二项分布可以理解为:为了得到指定数量的成功试验,需要Bernoulli试验的次数(先浅浅有个理解)。
负二项分布详细来说有两种定义方式,但其实讨论的是同一个事情:
X=得到第r次成功试验时,总共进行的试验次数;P(X=x|r,p)=egin{pmatrix}x-1 -1end{pmatrix}p^r(1-p)^{x-r},x=r,r+1,...Y=得到第r次成功试验时,总共失败的次数;P(Y=y|r,p)=egin{pmatrix}r+y-1yend{pmatrix}p^r(1-p)^y,x=r,r+1,...显然,y=X-r,从组合数的角度也知道这两种定义得到的概率是一样的,不过我们一般采取第二种定义方式,尽管它看起来貌似复杂一点。
其期望为:EY=rfrac{(1-p)}{p};
方差为:VarY=frac{r(1-p)}{p^2}.
负二项分布与Poisson分布一样,可以用于等待事物出现的现象建模,不过等待的是一定数量的成功试验。
6几何分布
这一分布实际上就是只出现一次成功试验所需要的总试验次数,也即设定了成功次数为1的负二项分布。
其期望是:EX=frac{1}{p};
方差为:VarX=frac{1-p}{p^2}.
可能会有同学发现将r=1代入负二项分布的期望和方差,得到的结果并不一样,原因在于这里的X指的是总试验次数,而负二项分布给出的期望和方差定义是失败的次数,需要利用Y=X-r进行一下转换。
方差没变,期望需要加1,故而几何分布的期望和方差也得到了。
几何分布还有一个非常有意思的性质,即“无记忆性”,这个性质应该经常被介绍,即其在已有t个失败后又连续失败s-t次试验的概率与一开始就出现s-t个失败的概率相等,即其得到一连串失败的概率只与个数有关,而与出现的时机无关,可以理解为它会忘记之前发生的事情。
PS.实际上几何分布也即是总试验了X次,而连续失败了X-1次,最后一次才成功,在计算上还是比较方便的;但是这里可以注意到,由于几何分布的无记忆性,故而我们不应该利用它来对一些“发生概率随时机增大而增大”的事件。
浅浅总结
这篇介绍了总共六种离散分布:离散均匀分布、超几何分布、二项分布、泊松分布、负二项分布、几何分布。
二项分布和泊松分布存在一定联系,几何分布是特殊的负二项分布。
还有二项式定理、递推关系这种技巧,但是也无伤大雅。
请问0-1分布中k和p的含义是什么?
0-1分布也叫伯努利分布,描述这个分布的参数只有一个p即可,没有k。
有k的可能是二项式分布,超几何分布,负二项分布等等。