Hvis du laver statistisk analyse, vil du måske få brug for at lave et 'boksplot' (engelsk: 'box plot') for at vise fordelingen af dine data. Boksplot er oplagt til at sammenligne fordelingen af flere populationer i samme diagram. Det giver ofte et godt og enkelt overblik, med synlige kvartiler og median.
Hvad bruger man et boksplot til?
Et boksplot eller kassediagram anvendes indenfor beskrivende statistik (deskriptiv statistik) som en metode til at illustrere median, kvartiler samt eventuelt maksimum og minimum i et sæt numeriske værdier.
Hvad betyder stregen i et boksplot?
En sådan figur kaldes et boksplot. Kassen viser hvor den midterste halvdel af tallene ligger. Den vandrette streg i venstre ende af boksplottet viser hvor den fjerdedel af tallene der er mindst, ligger. Den vandrette streg i højre ende af boksplottet viser hvor den fjerdedel af tallene der er størst, ligger.
Hvad betyder Q1 i et boksplot?
Nedre kvartil (Q1) er det tal, som 25% af observationerne er mindre end (og 75% større end). Øvre kvartil (Q3) er det tal, som 75% af observationerne er mindre end (og 25% større end). Man aflæser sit kvartilsæt i sumkurven.
Hvad bruges sumkurven til?
En sumkurve er en kurve i et koordinatsystem, der beskriver sammenhængen mellem observationerne i et datasæt og de tilhørende kumulerede frekvenser. På en sumkurve er observationerne ud ad førsteaksen, mens de kumulerede frekvenser er op ad andenaksen.
Box-Plot (simpelt forklaret og opret online)
Hvad fortæller medianen?
Medianen angiver den midterste værdi i en talrække der er sorteret efter størrelsen. Det betyder at halvdelen af observationerne vil være større end medianen og halvdelen af observationerne vil være mindre end medianen. Hvis der er et lige antal observationer er medianen gennemsnittet af de to midterste tal.
Hvordan laver man en sumkurve?
- Gruppér tallene og udregn frekvensen.
- Definér dine intervalpunkter og udregn den kumulerede frekvens.
- Opret sumkurven i Excel.
- Formater sumkurven.
Hvad betyder krydset i et boksplot?
Som udgangspunkt er der et kryds i midten af boksplottene. Det viser middelværdien i den pågældende observationsrække. Hvis man gerne vil have fjernet dette kryds, aktiverer man det enkelte boksplot ved at klikke i det, og fjerner derefter ”fluebenet” ved vis mærker for middelværdi i rullegardinet ude til højre.
Hvad er Q3?
Q1, Q2, Q3 og Q4 er en ofte anvendt måde at benævne hhv. 1., 2., 3. og 4. kvartal.
Hvordan aflæser man et trappediagram?
I et trappediagram aflæses observationerne på førsteaksen, mens de kumulerede frekvenser aflæses på andenaksen. Vi tegner et trappediagram på følgende måde: Vi tegner en lodret streg over den mindste observation. Stregen starter ved førsteaksen og når op til observationens kumulerede frekvens på andenaksen.
Er median og gennemsnit det samme?
Median kontra gennemsnit: Hvad er forskellen? Medianen er det tal, der ligger i midten af et datasæt, når det er sorteret fra mindst til størst. Gennemsnittet er summen af alle tal i et datasæt divideret med antallet af tal. Medianen påvirkes ikke af ekstreme værdier, og er derfor et nyttigt mål i skæve fordelinger.
Hvad betyder højre- og venstreskæv?
Definition: Hvis middelværdien er større end medianen, er datasættet højreskævt. Hvis middelværdien er mindre end medianen, er datasættet venstreskævt.
Hvad er kumulerede frekvenser?
Den kumulerede frekvens af x er andelen af observationer i hele datasættet, der er mindre end eller lig med x. Fx er den kumulerede frekvens af 120 andelen af observationer i et datasæt, der er mindre end eller lig med 120. Kumuleret frekvens kaldes også for summeret frekvens.
Hvad betyder stregerne i et boksplot?
Et boksplot viser, hvordan observationer er fordelt i et observationssæt. "Antennerne" er de to streger i hver ende af boksplottet, og de viser mindsteværdien og størsteværdien.
Hvad er en outlier i et boksplot?
En outlier er en observation, der afviger meget fra de andre observationer i datasættet, fordi den er meget større eller meget mindre end de andre observationer. En outlier kan skyldes måleusikkerheder, en fejl i målingerne, eller det kan være, at der bare er tale om en usædvanlig observation.
Hvad betyder 3 kvartil?
Tredje kvartil eller øvre kvartil er den største observation, hvor alle observationer der er mindre end den, udgør mindst 75% af alle observationerne.
Hvad står Q1 for?
Den nedre kvartil Q1 er medianen for den halvdel af observationerne, der er mindst. Kvartilen Q2 er medianen af alle observationerne (dvs. m).
Hvad er de 4 kvartaler?
Kvartal af middelalderlatin quartale anni = "fjerdedelen af året" og deraf en tidsperiode på 3 måneder. Et år opdeles således i 4 kvartaler. En ældre dansk betegnelse for et kvartal er et fjerdingår (en fjerding er en "fjerdedel").
Hvordan forklarer man boksplot?
Et boksplot er et kassediagram, som illustrerer et sæt numeriske værdiers median, kvartiler samt ofte maksimum og minimum. Et datasæt bliver således opdelt i kvartiler, hvor en boks tegnes mellem det første og tredje kvartil med en yderligere linje trukket langs den anden kvartil som markerer medianen.
Hvad kan man aflæse på et boksplot?
Aflæs et boksplot
De to yderste streger i boksplottet angiver datasættets hhv. mindste og største observation. Stregerne viser, at 15 er den mindste alder i datasættet, og 90 er den største. Boksplottet har desuden et kvartilsæt, som består af den nedre kvartil, medianen og den øvre kvartil.
Er et boksplot et diagram?
Et boksplot er et diagram, der består af en tallinje og en todelt boks med to "antenner" eller "haler". Der er ikke nogen andenakse på et boksplot, så højden af boksen har ingen betydning.
Hvad er kvartilbredden i et boksplot?
Kvartilbredde (kvartilafstand). Kvartilbredden beskriver, hvor tæt den midterste halvdel af observationerne ligger. Kvartilbredden siger altså noget om spredningen i den midterste halvdel af observationerne.
Hvordan regner man frekvens?
Frekvens er i statistik en relativ hyppighed. Hvis fx en bestemt observation optræder i 8 ud af 20 tilfælde, siges dens frekvens at være 8/20 = 0,4.
Hvad betyder variationsbredde?
Variationsbredden er altså afstanden mellem den største observation og den mindste observation i datasættet. Variationsbredden siger derfor noget om, hvor spredte observationerne er. Jo større variationsbredden er, jo mere spredt er observationerne.