Medelvärde mot median - Skillnader mellan metoder som används i statistik

Innehållsförteckning

Skillnaden mellan medel och median

Medelvärdet och medianen är två vanliga termer i matematik, medelvärdet är som genomsnittet för ett visst tal och det summerar siffrorna och delar dem med antalet tal som ger oss medelvärdet medan median å andra sidan returnerar mittantalet från hela datamängd och om datamängden är jämn så lägger medianen till de två mellersta siffrorna och delar den med 2 vilket ger oss medianen.

De är ett mått på den centrala tendensen och används ofta vid mätning av stora datamängder där analys måste ritas och resultaten tolkas. Medel, median och läge är tre mått på medelvärden som visar spridningen data är från medelvärdet eller genomsnittet. Dessa metoder används i statistik i stor utsträckning, medan medelvärdet av data är den mest använda metoden bland de tre.

Vad betyder?

Medelvärdet är en enkel summa av antalet observationer i en matris, som divideras med antalet observationer. Om vi ​​till exempel pratar om medelhöjden eller medelhöjden för en grupp bestående av 5 personer. Medelhöjden beräknas genom att summera höjden på 5 personer dividerat med antalet personer, dvs. 5.

Formel

Medelformel = (summan av alla observationer / antal observationer)

Vad är medianen?

Median är å andra sidan det mellersta numret i datamängden, som skiljer den högre datauppsättningen från den nedre. Data måste ordnas i stigande ordning först för att beräkna medianen för data. När datamängden har kardinalitet måste medelvärdet av de två mellersta siffrorna i datamängden tas. Dessa två metoder används emellertid ofta omväxlande.

Formel

Medianformel = (n + 1) / 2

när n är ett udda tal

Median = ((n / 2) + ((n / 2) +1)) / 2

när n är ett jämnt tal

Medelvärde mot medianinfografik

Låt oss se de största skillnaderna mellan medelvärde och median.

Medelvärdesdifferenser mot median

  • Medelvärdet är enkelt att använda och tillämpa och kan tillämpas på valfri dataarrayuppsättning, oavsett om det är jämnt eller udda. Median, å andra sidan, är lite komplex att använda, och datamängden måste ordnas i stigande eller fallande ordning först innan beräkning.
  • Medelvärdet används normalt för normala fördelningar, medan medianen används för den sneda fördelningsdatamängden.
  • Medelvärdet är enkelt, men det är inte robust eftersom det kan innehålla avvikelser i distributionerna och ibland inte kan ge användaren rätt resultat för tolkning. Å andra sidan är medianmetoden robust och är bättre lämpad att använda för eftersom den används för snedställda fördelningar för att härleda den centrala tendensen för datumuppsättningen och ger användaren många exakta resultat jämfört med
  • Det finns bara en formel av medelvärde som är summan av alla observationer dividerat med antalet observationer. Medianen har två formler, en av de udda där bara mellantalen från datasetet blir medianen. Men när vi har en jämn datamängd, plockas mitten av de två värdena och delas med 2, vilket ger oss medianen för den jämna datamängden.

Medel jämfört med median jämförelsetabell

Betyda Median
Medelvärdet beräknas genom att lägga till alla värden i dataarrayen, som sedan divideras med antalet observationer. Median är det exakta medelvärdet för datamängden. Det kan beräknas genom att ordna datamängden i stigande ordning och sedan hitta eller välja mellanvärdet från datamängden.
Det används mer i branschen på grund av en enkel beräkning av genomsnittet, och det ger oss ett snabbt antal. Det används inte ofta i branschen, men det är mer fullständigt och exakt än medelvärde, vilket bara är en enkel summa av siffror.
Den används vanligtvis för normalt skev datamängd, dvs. normal distribution. Det är särskilt praktiskt att beskriva datamängden med en betydande skevhet i data eller när data har en lång svans. Det används i stor utsträckning där konturerna har betydande vikt i uppgifterna där menar att det inte är en bra beräkningsmetod.
Det är inte ett robust verktyg för en beräkning för att härleda den centrala tendensen. Det är ett mycket robust verktyg eftersom det bestämmer vikten i data, som i allmänhet är hög vikt vid längre svansar.
Det är mycket känsligt för avvikare. Det påverkas mycket mindre av avvikarna.
Det är enkelt att använda Det är komplext till sin natur.
Det kan inte beräknas för kategoriska data, eftersom värdena inte kan summeras. Det kan inte identifieras för kategoriserade nominella data eftersom det inte kan ordnas logiskt.

Slutsats

Bortsett från medelvärdet och medianen, finns det ytterligare en metod som ofta används för att mäta central tendens som är läget. Ett läge är ett värde som oftast förekommer i datamängden. läget har en fördel jämfört med medelvärdet och medianen att det kan hittas för både numeriska och kategoriserade datamängder.

Trots förekomsten av läge och median överlägsenheten av bättre resultat och analys över medelvärdet är medelvärdet fortfarande det mest lämpliga måttet på central tendens, särskilt om datamängden är en normalfördelning och data normalt är snedställda.

Som en bra analytiker bör den centrala tendensen mätas med alla tre datametoderna, och variansen i analysen bör övervägas och analyseras noggrant för att ge bättre och mer exakta resultat i datamängden.

Intressanta artiklar...