Naar inhoud springen

Kwantiel

Uit Wikipedia, de vrije encyclopedie

In de statistiek is een kwantiel een getal dat een multiset van getallen verdeelt in twee delen: het deel met de kleinere en het deel met de grotere getallen. De verzameling kan een concrete of abstracte populatie zijn of de uitkomsten van een steekproef. Voor het getal , en een verzameling met omvang , verdeelt het -kwantiel de verzameling in een deel met de kleinere waarden met omvang en een deel met de grotere waarden met omvang . Een bekend kwantiel is de mediaan, het 0,5-kwantiel, dat het midden is van de rij van in volgorde van grootte geplaatste getallen.

Spraakgebruik

[bewerken | brontekst bewerken]

De specifiekere termen percentiel, deciel en kwartiel worden in de praktijk ook gebruikt voor de betreffende delen van de dataset. Bij een verdeling in tien delen bijvoorbeeld zijn er negen deelpunten, de decielen , maar worden de tien delen ook wel aangeduid als decielen. Het eerste deciel bestaat dan uit de 10% van de populatie die volgens de gekozen ordening de kleinste zijn, de volgende 10% kleinsten vormen het tweede deciel en er is een tiende deciel van de 10% grootste. De genoemde percentages kunnen niet altijd exact gerealiseerd worden, maar worden zo goed mogelijk benaderd. Daarbij is het gebruik het minimum als ondergrens en het maximum als bovengrens te nemen. Deze worden dan officieus als en aangeduid.

Meerdere variabelen

[bewerken | brontekst bewerken]

Bij een dataset met meerdere variabelen met waarden in een geordende verzameling (zoals getallen) kan een populatie met betrekking tot verschillende variabelen geordend worden. Voor bijvoorbeeld een dataset met de inkomens en vermogens van huishoudens kan gekeken worden naar het gemiddelde inkomen per inkomensdeciel en het gemiddelde vermogen per vermogensdeciel. Voor de samenhang tussen beide variabelen kan ook naar het gemiddelde vermogen per inkomensdeciel gekeken worden.[1]

Voor een ordinaal kenmerk van een abstracte populatie gegeven door een kansverdeling is het getal een -kwantiel als:

en

In het bijzonder kunnen er dus meerdere -kwantielen bestaan. Om eenduidigheid af te dwingen wordt door sommige auteurs het gemiddelde van de mogelijke waarden die als kwantiel in aanmerking komen, als kwantiel gedefinieerd.

In termen van de verdelingsfunctie van zijn de bovenstaande eisen:

en

Bij een continue stochastische variabele met strikt stijgende verdelingsfunctie is het -kwantiel de eenduidige waarvoor geldt:

,

oftewel

Voor een concrete populatie of een steekproef, bestaande uit getallen , waaronder mogelijk gelijke, wordt het -kwantiel bepaald door de eisen:

  • ten minste van de data zijn kleiner dan of gelijk aan .
  • ten minste van de data zijn groter dan of gelijk aan .

Hier geldt hetzelfde als in een discrete verdeling: als twee aangrenzende uitkomsten aan de eisen voldoen, neemt men het gemiddelde van beide als kwantiel.

In een abstracte of concrete populatie is een kwantiel een parameter van de populatie. In een steekproef is een kwantiel een schatting van het overeenkomstige kwantiel in de populatie waaruit de steekproef getrokken is.

Het 0,20-kwantiel in een exponentiële verdeling met parameter 1 wordt bepaald door de vergelijking:

,

waaruit volgt:


Het 0,2-kwantiel van de (geordende) dataset van 9 data:

is het getal 3. Er zijn 2, dus ten minste 0,2×9=1,8 getallen kleiner dan of gelijk aan 3 en er zijn 8, dus ten minste 0,8×9=7,2 getallen groter dan of gelijk aan 3.

Van de dataset:

met 10 data voldoen zowel 3 als 5 aan de eisen. Het 0,2-kwantiel kwantiel is dus (3+5)/2 = 4. Het getal 4 scheidt de dataset mooi in een deel van 2 en een deel van 8 getallen.

Als de dataset een eindige populatie of een steekproefuitkomst betreft van elementen, is het -kwantiel het "element" met als rangnummer in de geordende data:

Het woord "element" staat tussen aanhalingstekens, want niet altijd is dit rangnummer een geheel getal. Als kwantiel wordt dan het gemiddelde van de omliggende elementen gekozen.

Speciale kwantielen

[bewerken | brontekst bewerken]

De kwantielen die behoren bij een verdeling in 2, 4, 10 of 100 delen hebben een aparte naam. Bij een verdeling in: