Vés al contingut

Distribució binomial

De la Viquipèdia, l'enciclopèdia lliure
Aquesta és una versió anterior d'aquesta pàgina, de data 05:34, 7 des 2024 amb l'última edició de InternetArchiveBot (discussió | contribucions). Pot tenir inexactituds o contingut no apropiat no present en la versió actual.
(dif.) ←la pròxima versió més antiga | vegeu la versió actual (dif.) | Versió més nova → (dif.)
Infotaula distribució de probabilitatDistribució binomial
Funció de massa de probabilitat
Funció de distribució de probabilitat
Funció de distribució acumulada
TipusDistribució binomial de Poisson, Panjer distribution (en) Tradueix, Distribució multinomial, distribució univariant i distribució de probabilitat discreta Modifica el valor a Wikidata
Paràmetres nombre d'assaigs (sencer)
probabilitat d'èxit (real)
Suport
FD
Esperança matemàtica
Mediana o [1]
Moda o
Variància
Coeficient de simetria
Curtosi
Entropia
FGM Modifica el valor a Wikidata
FC
MathworldBinomialDistribution Modifica el valor a Wikidata

En Teoria de la probabilitat i en estadística, una variable aleatòria es diu que té una distribució binomial de paràmetres i si representa el nombre d'èxits en repeticions independents d'una prova que té probabilitat d'èxit . Per exemple, tirem 10 vegades un dau ordinari i comptem quantes vegades surt un 6; en aquest cas l'èxit és "treure un 6", i la variable que compta el nombre de sisos té una distribució binomial de paràmetres i .

La distribució binomial és la base de la popular prova binomial de significació estadística.[2]

Va ser proposada pel matemàtic i físic suís Jacob Bernoulli.[3]

Distribució de Bernoulli

[modifica]

Les distribucions binomials s'inscriuen en el marc de referència de les distribucions de Bernoulli. S'anomena experiència de Bernoulli aquell experiment aleatori del qual només s'estudia la verificació o no d'un esdeveniment que pot donar-se amb probabilitat La realització de l'esdeveniment s'anomena èxit. S'acostuma a representar la probabilitat del complementari (no ), la realització del qual s'anomena fracàs, per és clar que

Així, un experiment o experiència de Bernoulli es caracteritza per ser dicotòmic, és a dir, només són possibles dos resultats: èxit o fracàs.

Exemples d'experiències de Bernoulli

  1. Es llança una moneda, l'esdeveniment A podria ser "que surti cara".
  2. En una bossa hi ha boles blanques, negres i vermelles. traiem una bola i mirem si és de color blanc o no. L'esdeveniment A podria ser "treure bola blanca".
  3. En un referèndum amb possibles respostes Sí o No, l'esdeveniment A podria ser "que surti Sí".

Distribució binomial

[modifica]

La distribució binomial és una distribució de probabilitat discreta que fa el recompte del nombre de vegades que es verifica l'èxit (realització de l'esdeveniment ) quan es repeteix vegades, de forma independent i en les mateixes condicions, una experiència de Bernouilli.

Per n = 1, la distribució binomial és una distribució de Bernoulli.

Designem per X la variable aleatòria que mesura el nombre d'èxits que s'han produït en els n experiments. Per indicar que segueix una distribució binomial de paràmetres n i p , s'escriu:

Exemples

[modifica]

Les següents situacions són exemples d'experiments que poden modelitzar per aquesta distribució:

  • Es llança un dau deu vegades i es compta el nombre de sisos obtinguts: X ~ B(10, 1/6)
  • Es llança una moneda dues vegades i es compta el nombre de cares obtingudes, tenim
  • Una partícula es mou unidimensionalment amb probabilitat de moure's una unitat de distància cap enrere i de moure's una unitat cap endavant. Després de moviments, el nombre de vegades que s'ha mogut cap endavant és una variable binomial .

Propietats característiques

[modifica]

Mitjana i Variància

[modifica]

Sigui una variable aleatòria binomial de paràmetres i .

Això es dedueix per la linealitat de l'esperança, ja que X és la suma de n variables aleatòries de Bernoulli idèntiques, cadascuna d'elles amb esperança p. És a dir, si són variables aleatòries iguals (i independents) de Bernoulli amb paràmetre p, aleshores i, atès que tindrem que D'altra banda, per a una variable de Bernoulli, d'on Llavors, de la independència de , es dedueix que

Funció de probabilitat

[modifica]

Sigui una variable aleatòria binomial de paràmetres i . Aleshores la probabilitat d'obtenir exactament èxits en repeticions (proves) independents de Bernouilli és:

on és el coeficient binomial.

Així, la funció de probabilitat de és

Funció de distribució

[modifica]


on denota la part entera de .

Fites de les cues

[modifica]

Per knp, es poden derivar fites superiors per la cua inferior de la funció de distribució acumulada , la probabilitat que hi hagi com a màxim k successos. Com que , també es poden interpretar aquestes fites per a la cua superior de la funció de distribució per knp.

La desigualtat de Hoeffding dóna la fita simple

que no és, tanmateix, gaire forta. En particular, quan p = 1, s'obté F(k;n,p) = 0 (per a k i n fixes amb k < n), però la fita de Hoeffding dóna una constant positiva.

S'obté una fita més exacta mitjançant la fita de Chernoff:[4]

on D(a || p) és l'entropia relativa (o divergència Kullback-Leibler) entre una moneda-ai una moneda-p (és a dir entre Bernoulli(a) i Bernoulli(p) distribution):

Asimptòticament, aquesta fita és raonablement exacta; vegi's [4] per més detalls.

També es poden obtenir fites inferiors de la cua , conegudes com fites anti-concentració. Aproximant el coeficient binomial amb l'aproximació de Stirling es pot demostrar que[5]

que implica la fita més simple però menys exacta:

Per p = 1/2 i k ≥ 3n/8 amb n parell, es pot fer que el denominador sigui constant:[6]

Exemple

[modifica]

Suposem que tenim una moneda trucada amb probabilitat 0.3 que surti cara. La probabilitat que surtin 4 cares en 6 llançaments és

Aproximació de la distribució binomial per les distribucions de Poisson i normal

[modifica]

Si tendeix a infinit i és tal que , llavors la distribució d'una variable aleatòria binomial de paràmetres i tendeix a una distribució de Poisson de paràmetre .

D'altra banda, pel teorema central del límit, quan n és gran (normalment s'exigeix que ) la distribució binomial es pot aproximar mitjançant la distribució normal.

Distribucions relacionades

[modifica]

Suma de binomials

[modifica]

Si X ~ B(n, p) i Y ~ B(m, p) són variables binomials independents amb la mateixa probabilitat p, llavors X + Y és també una variable binomial; la seva distribució és Z = X \+ Y ~ B(n + m, p):[7]

Es pot considerar una variable aleatòria distribuïda de forma binomial X ~ B(n, p) com la suma de n variables aleatòries distribuïdes segons Bernoulli. Així doncs, la suma de les variables aleatòries binomials X ~ B(n, p) i Y ~ B(m, p) és equivalent a la suma de n + m variables aleatòries de Bernoulli, és a dir Z = X + Y ~ B(n + m, p). També es pot demostrar això directament utilitzant la regla de la suma.

No obstant això, si X i Y no tenen la mateixa probabilitat p, llavors la variància de la suma serà més petita que la variància de la variable binomial distribuïda com B(n + m, p).

Distribució binomial de Poisson

[modifica]

La distribució binomial és un cas particular de la distribució binomial de Poisson, que és la distribució de una suma de n assajos de Bernoulli independents i no idèntics B(pi).[8]

Ràtio de dues distribucions binomials

[modifica]

Aquest resultat va ser derivat per primer cop per Katz i coautors l'any 1978.[9]

Siguin X ~ B(n, p1) i Y ~ B(m, p2) independents. Sigui T = (X/n) / (Y/m).

Llavors log(T) està distribuït aproximadament de forma normal amb mitjana log(p1/p2) i variància ((1/p1) − 1)/n + ((1/p2) − 1)/m.

Distribució de Bernoulli

[modifica]

La distribució de Bernoulli és un cas particular de la distribució binomial, amb n = 1. Simbòlicament, X ~ B(1, p) té el mateix significat que X ~ Bernoulli(p). En canvi, la distribució binomial, B(n, p), és la distribució de la suma de n assajos de Bernoulli independents, Bernoulli(p), cadascun amb la mateixa probabilitat p.[10]

Aproximació de Poisson

[modifica]

La distribució binomial convergeix a la distribució de Poisson a mesura que el nombre d'assajos tendeix a infinit mentre que el producte np convergeix a un límit finit. Per tant, es pot utilitzar una distirbució de Poisson amb paràmetre λ = np per aproximar B(n, p) de la distribució binomial si n és prou gran i p és prou petit. Segons la regla del polze, aquesta aproximació és bona si n ≥ 20 i p ≤ 0.05[11] tal que np ≤ 1, o si n > 50 i p < 0.1 tal que np < 5,[12] o si n ≥ 100 i np ≤ 10.[13][14]

Sobre la precisió de l'aproximació de Poisson, vegi's Novak,[15] capítol 4, i les referències que s'hi citen.

Propietats reproductives

[modifica]

Donades m variables binomials independents , i = 1, ..., m, de paràmetres i , respectivament, la seva suma S és també una variable binomial, de paràmetres i , és a dir,

Referències

[modifica]
  1. Hamza, K. (1995). The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. Statistica & Probability Letters. 23 21-25.
  2. Westland, J. Christopher. Audit Analytics: Data Science for the Accounting Profession. Chicago, IL, USA: Springer, 2020, p. 53. ISBN 978-3-030-49091-1. 
  3. Cervigon, Francesc La-Roca. Estadística aplicada a les ciències socials. Universitat de València, 2011-11-28, p. 191. ISBN 978-84-370-8650-7. 
  4. 4,0 4,1 Arratia, R.; Gordon, L. «Tutorial on large deviations for the binomial distribution». Bulletin of Mathematical Biology, vol. 51, 1, 1989, pàg. 125–131. DOI: 10.1007/BF02458840. PMID: 2706397.
  5. Robert B. Ash. Information Theory. Dover Publications, 1990, p. 115. ISBN 9780486665214. 
  6. Matoušek, J.; Vondrak, J. «The Probabilistic Method». lecture notes. Arxivat de l'original el 2022-10-09.
  7. Dekking, F.M.; Kraaikamp, C.; Lopohaa, H.P. [et al.].. A Modern Introduction of Probability and Statistics. 1. Springer-Verlag London, 2005. ISBN 978-1-84628-168-6. 
  8. Wang, Y. H. «On the number of successes in independent trials». Statistica Sinica, vol. 3, 2, 1993, pàg. 295–312.
  9. Katz, D.; Baptista, J.; Azen, S. P.; Pike, M. C. «Obtaining confidence intervals for the risk ratio in cohort studies». Biometrics, vol. 34, 3, 1978, pàg. 469–474. DOI: 10.2307/2530610. JSTOR: 2530610.
  10. Taboga, Marco. «Lectures on Probability Theory and Mathematical Statistics». statlect.com. [Consulta: 18 desembre 2017].
  11. «12.4 – Approximating the Binomial Distribution | STAT 414», 28-03-2023. Arxivat de l'original el 2023-03-28. [Consulta: 8 octubre 2023].
  12. Chen, Zac. H2 mathematics handbook. 1. Singapore: Educational publishing house, 2011, p. 348. ISBN 9789814288484. 
  13. NIST/SEMATECH, "6.3.3.1. Counts Control Charts", e-Handbook of Statistical Methods.
  14. «The Connection Between the Poisson and Binomial Distributions», 13-03-2023. Arxivat de l'original el 2023-03-13. [Consulta: 8 octubre 2023].
  15. Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. ISBN 9781-43983-5746.

Vegeu també

[modifica]