Sannsynlighetsfordeling
Sannsynlighetsfordeling anvendes innen sannsynlighetsteori og statistikk for å beskrive hvordan stokastiske variabler, for eksempel tilfeldige utvalg, fordeler seg. De enkelte utfall av en tilfeldig variabel kan ikke forutsies, men sannsynlighetsfordelingen vil beskrive sannsynligheten for at hvert mulige utfall vil inntre, og hvordan verdiene i et større utvalg normalt vil fordele seg.
Disse forholdene er forskjellige avhengig av den underliggende fysiske prosess eller logiske mekanisme; Utfallet av et terningkast, en lotteritrekning, radioaktiv nedbrytning, en intelligenstest eller ventetider i fergekø vil derfor ha forskjellige sannsynlighetsfordelinger.
Formell definisjon
redigerEn sannsynlighetsfordeling tildeler en sannsynlighet til hvert intervall [a, b] av mulige reelle tall slik at forutsetningene for den aktuelle fordelingen er ivaretatt.
Alle stokastiske variabler har en sannsynlighetsfordeling som inneholder den essensielle informasjonen om denne variabelen. Hvis X er en stokastisk variabel, vil sannsynlighetfordelingen tildele en sannsynlighet P[a ≤ X ≤ b] til intervallet [a, b] som er sannsynligheten for at X har en verdi i dette intervallet. Sannsynlighetsfordelingen til X kan entydig beskrives av dens (kumulative) fordelingsfunksjon F(x) som er definert som:
- for alle x i .
Verdiene vil være i området 0 (ingen sannsynlighet) til 1. Dens deriverte kalles sannsynlighetstettheten til X.
Diskrete sannsynlighetsfordelinger
redigerEn fordeling kalles diskret hvis sumfunksjonen består av en rekke endelige sprang, som betyr at variabelen X er en diskret stokastisk variabel; X kan bare anta verdier fra et endelig, høyst numererbart sett. En diskret fordeling av en variabel er gitt ved en funksjon
- for
der
- .
Den kumulative fordelingsfunksjonen er gitt ved summen av sannsynlighetene for enkeltutfall:
- for .
Støtten for en fordeling er det minste lukkede settet som har sannsynlighet 1. En fordeling har endelig støtte der sannsynlighet 1 oppnås med et endelig, høyst numererbart sett for X.
Sannsynlighetsfordelingen for summen av to uavhengige stokastiske variable er konvolusjonen av deres fordelinger. Sannsynlighetsfordelingen for differansen mellom to uavhengige stokastiske variable er krysskorrelasjonen av deres fordelinger.
Kontinuerlige sannsynlighetsfordelinger
redigerKontinuerlige sannsynlighetsfordelinger er fordelinger der sumfunksjonen også er kontinuerlig. Dette betyr også at P[ X = x ] = 0 for alle verdier x i . Fra en grenseverdibetraktning: når antallet mulige verdier for X går mot uendelig må sannsynligheten for enkeltutfall X gå mot null. En kontinuerlig sannsynlighetsfordeling av en variabel er gitt ved en funksjon f(x) der
Sannsynligheten for at X er i intervallet [a,b] er:
Liste over viktige sannsynlighetsfordelinger
redigerDiskrete fordelinger
redigerEndelig støtte
rediger- Bernoulli-fordeling, som har verdi 1 med sannsynlighet p og verdi 0 med sannsynlighet q = 1 − p.
- Rademacher-fordeling, som har verdi 1 med sannsynlighet 1/2 og verdi −1 sannsynlighet 1/2.
- Binomisk fordeling som gir antall treff i en rekke uavhengige Ja/Nei-tester.
- Uniform fordeling der alle elementene i et endelig sett har samme sannsynlighet. Tilnærmet riktig for mynt og terningkast o.l.
- Hypergeometrisk fordeling, beskriver sannsynligheten for treff i de første m tester på en serie n dersom vi vet at totalt antall treff i m er n. Brukes for eksempel for å vurdere test av produkter ved utvalg fra varepartier.
Uendelig støtte
rediger- Boltzmann-fordeling, som brukes innen fysikk for å beskrive diskrete energinivåer i systemer i termisk likevekt.
- Geometrisk fordeling er en diskret stokastisk sannsynlighetsfordeling hvor den stokastiske variable beskriver antall forsøk til første gang et gitt treff skjer.
- Poissonfordeling beskriver antaller treff i en fast tidsperiode dersom treffene skjer med en kjent gjennomsnittsverdi og er uavhengig av tiden siden siste hendelse. Kan brukes for eksempel for radioaktiv nedbrytning, fødselsstatistikk og køberegninger.
- Logaritmisk fordeling
Kontinuerlige fordelinger
redigerStøtte på et ikke-uendelig intervall
rediger- Rektangulær fordeling har lik sannsynlighet over et bestemt intervall. Kontinuerlig ekvivalent til uniform diskret fordeling.
- Logaritmisk fordeling kontinuerlig variant.
- Triangulær fordeling for [a, b], er et spesialtilfelle som er sum (konvolusjon) av to rektangulære fordelinger.
Støtte på halvt uendelig intervall, vanligvis [0,∞)
rediger- Kjikvadratfordeling, som er summen av kvadrater av n uavhengige Gaussiske stokastiske variable. Er en bestemt variant av gammafordelingen som brukes til å måle godhet i tilpasning for eksempel ved minste kvadraters metode
- Eksponentialfordeling beskriver tid mellom uavhengige på hverandre følgende stokastiske hendelser, for eksempel driftsavbrudd.
- Gammafordelingen, beskrive tid til n uavhengige på hverandre følgende stokastiske hendelser har intruffet.
- log-normal fordeling beskriver variable som er satt sammen av produktet av mange uavhengige positive variabler.
- Weibullfordeling, der eksponentialfordeling er et spesialtilfelle brukes for levetidsforventningsberegninger for utstyr (en: MTBF Mean time Between Failure).
Støtte for alle intervall
rediger- Cauchy-fordeling, er en funksjon som ikke har en forventningsverdi eller varians; forbindes med systemer som energifordeling ved resonans.
- Laplace-fordeling Som er spissere ved forventningsverdien og har bredere skuldre enn normalfordelingen.
- Normalfordeling kalles også Gauss-fordeling. Gjelder for en rekke naturlige variasjoner som fordeler seg rundt en middelverdi i en populasjon, for eksempel høyde, intelligens, naturlig variasjon i toleranse osv. – modellert som en sum av mange uavhengig variable og gir en velkjent klokkeformet kurve.
Se også
redigerEksterne lenker
rediger- (en) Probability distributions – kategori av bilder, video eller lyd på Commons
- (en) Probability distribution – galleri av bilder, video eller lyd på Commons