Средните стойности и вариации показатели
Концепция и видове средни
Средната стойност - обобщение мярка за статистическо на населението, което се отблагодарява на индивидуалните различия на статистическите стойности на ценности, което позволява да се сравняват различни комбинации помежду си.
Структурната среда включва режим и средната. но най-често използваните среда на различни видове енергия.
Средните стойности на консумираната мощност
Средната мощност може да бъде прост или претеглени.
Простият Средната стойност се изчислява, когато има две или повече негрупирани статистически стойности подредени в произволен ред в следната обща формула:
средно претеглена стойност, изчислена от статистическите стойности, групирани с помощта на следната обща формула:
където X - отделни стойности или статистически стойности средите групиране интервали;
m - експонента, чиято стойност зависи от следните видове мощност на средни стойности:
когато m = -1 хармонична средна;
когато m = 0 среден геометричен;
когато m = 1, средната аритметична стойност;
когато m = 2 означава квадратен;
когато m = 3, средната кубически.
Използване на обща формула и прости претеглени стойности с различни експонати m, ние получаваме частния формула от всеки вид, които ще бъдат обсъдени по-подробно.
средна аритметична
Средноаритметичната стойност - това е най-често се използва от средната стойност, която се получава чрез заместване в обща формула т = 1. Просто средно аритметично е както следва:
където X - стойностите, които трябва да се изчисляват за средната стойност и N - общ брой на X стойности (броя единици в целевата популация). Например, студент положен изпит и 4 получава следната оценка: 3, 4, 4 и 5. изчисляване на средната оценка за проста средна аритметична формула: (3 + 4 + 4 + 5) / 4 = 16/4 = 4.
Претеглена средна аритметична е следното:
където е - брой стойности на същата стойност X (честота). Например, студент положен изпит и 4 получава следната оценка: 3, 4, 4 и 5. Изчислява се средната оценка за претеглена средна аритметична стойност формула: (3 * 1 + 4 * 2 + 5 * 1) / 4 = 16/4 = 4.
Ако стойността на X дава под формата на интервали, след това изчисленията се използват за средата X слотове, които са определени като половината от сумата на горните и долните граници на интервала. А слот X, ако няма долната или горната граница (отворен интервал) е, след това се използва за неговия обхват местоположение (разлика между горната и долната граница) на съседен интервал X.
Така например, в компанията на 10 служители с опит до 3 години, 20 - с опита на 3 до 5 години, 5 служители - с опита на повече от 5 години. След това се изчислява средната продължителност от формулата на служителите претеглена средно аритметично, като X като интервалите на средното време (2, 4 и 6 години):
(2 х 10 + 4 * 20 + 6 * 5) / (10 + 20 + 5) = 3.71 години.
Средноаритметичната стойност се използва най-често, но има моменти, когато е необходимо да се използват и други видове средни стойности. Помислете за тези случаи по-нататък.
средно хармонично
Средната хармоник се използва, когато изходните данни не съдържа честотата е от отделните стойности на X, и техния продукт е представен като Xf. Обозначаващ Xf = w, ние експресират е = W / X, и замествайки с тези наименования във формула претеглена средноаритметичните стойности, ние получаваме формула претеглена хармонична средна стойност:
Така, средната претеглена хармоник се прилага, когато неизвестна честота F, и известен w = Xf. В случаите, когато всички W = 1, т.е. индивидуалните стойности на X се намират на едно време, се използва прост хармонична средна стойност на формула:
Така например, колата е пътувал от точка А до точка Б, при скорост от 90 km / h, и обратно - при скорост от 110 км / ч. За да се определи средната скорост е приложим формула вторичен хармонична прост, както в пример даден разстояние w1 = w2 (разстоянието от точка А до точка В, като и от В до А), която е равна на произведението на скорост (X) по време (е) , Средният процент = (1 + 1) / (1/90 + 1/110) = 99 км / ч.
Геометричната средна стойност
Геометричната средна стойност се използва за определяне на средните относителни промени, както е посочено в субект време серия. Геометрична средна стойност осигурява най-точен резултат от усредняване, ако задачата е да се намерят такива стойности на X, които биха били на еднакво разстояние от двата максималните и минималните стойности на X.
средна квадратична
Rms се прилагат за случаите, когато първоначалните стойности на X могат да бъдат както положителни, така и отрицателни, например при изчисляването на средната отклонение.
Основната област на приложение е измерване на средните квадрат стойности на вариация X, които ще бъдат обсъдени по-късно в тази глава.
Средната кубичен
Средна кубически рядко се използва, например, при изчисляването на индекса на човешка бедност за развиващите се страни (HPI-1) и разработени (HPI-2) предложи и изчислява чрез Организацията на обединените нации.
Структурните средни стойности
Статистическа мода
Статистическа мода - това е най-честата стойността на X ценности в статистическата съвкупност.
Ако X е дискретен комплект. режим се определя, без изчисляване на стойността характеристика, тъй като най-високата честота. Статистическата населението е 2 и повече мода, а след това се счита за бимодален (две, ако мода) или мултимодален (ако има повече от два режима), и това свидетелства за хетерогенността на популацията.
Така например, в компанията работят 16 души: 4 от тях - с опита на 1 година, 3-ма души - с опит от 2 години, 5 - с опита на 3 години и 4-ма души - с опит от 4 години. По този начин, дължината на модален Mo = 3 години, тъй като честотата на максималната стойност (е = 5).
Ако X е настроен равни интервали от време. първата модален решена интервала като интервала с най-висока честота F. В този обхват са конвенционален начин въз основа на формулата:
където Mo - мода;
HNMo - долната граница на модален интервал;
КМО - модален интервал скала (разлика между горната и долната граница);
FMO - модален честотен интервал;
FMO-1 - честотен интервал от предходните модален;
FMO + 1 - честотен интервал след модален. Така например, в компанията на 10 служители с опит до 3 години, 20 - с опита на 3 до 5 години, 5 служители - с опита на повече от 5 години. Изчислява модален старшинство в модален диапазон от 3 до 5 години: Mo = 3 + 2 * (20-10) / (2 * 20-10-5) = 3.8 (години).
Ако на различни интервали мащаб з, вместо на честота F трябва да използват интервали плътност, изчислен чрез разделяне на честотата F да почистват интервал часа.
Статистическа медиана
Статистическа средна - на стойност X, която разделя подреден възходящ или низходящ статистическа съвкупност на 2 равни части в брой. В резултат на това половината от стойността е по-голяма от медианата, а другият - по-малко от средната стойност.
Ако X е дискретен комплект. за определяне на средната стойност на всички стойности са номерирани от 0 до N във възходящ ред. след медианата за четен брой N ще лежи в средата между номера X в 0,5 N и (0,5 N + 1), и с нечетен брой N е равен на стойност X с номера 0,5 (М + 1).
Например, има данни за възрастта на задочните студенти в група от 10 души - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 години. Тези данни са вече във възходящ ред и броят N = 10 - дори, така че ще бъде медианата между числата X 0,5 * 10 = 5 (0,5 * 10 + 1) = 6, което съответства на стойността Х5 = 21 и X6 = 23, тогава медианата: ме = (21 + 23) / 2 = 22 (години).
Ако X е зададена като равни интервали от време. Това е първото определя от средната интервал (интервал, в който завършва половината от честотите е началната и другата половина), които са условно средната стойност от формулата:
където Me - средна;
HNMe - долната граница на средната интервал;
НМЕ - средната почистване интервал (разлика между горната и долната граница);
МФ - средната честота интервал;
МФ-1 - сума честотни интервали предходните медианата. В по-рано счита пример за изчисляване модален време (за растителна 10 работници, които са работили до 3 години, 20 - с опита на 3 до 5 години, 5 служители - с опит над 5 години) изчисли дължината на медианата. Половината от общия брой на служителите е (10 + 20 + 5) / 2 = 17,5 и се съхранява в диапазона от 3 до 5 години, а в първия интервал на до 3 години - само 10 души, като през първите две - (10 + 20) = 30, че повече от 17,5, след интервал от 3 до 5 години - средната. В него се определят условно средната стойност: Ме = 3 + 2 * (0,5 * 30-10) / 20 = 3.5 (години).
Както в случая на мода, в определяне дали средните почистване з различни интервали, вместо на честота F трябва да използва интервали плътност изчислени чрез разделяне на честотата F да почистват интервал часа.
индикатори на вариация
Мащабът на вариация
Мащабът на вариация - разликата между максималната и минималната стойност на X разположение в статистическата популация:
Недостатъкът на експонентата H е, че тя показва само максималната разлика между стойностите на Х и не може да се измери ефекта на вариация в тяхната цялост.
СРЕДНО линеен отклонение
СРЕДНО линеен отклонение - X е средните стойности модул на отклонения от средноаритметичната стойност. Тя може да се изчисли чрез просто средноаритметичната формула - получаване на простата средна линейна отклонение:
Например, един студент е издържало, и 4 постъпила следната оценка: 3, 4, 4 и 5. Това вече е изчислена средна аритметична = 4. Изчислете средната линейна отклонение е проста: A = (| 3-4 | + | 4-4 | + | 4-4 | + | 5-4 |) / 4 = 0,5.
Ако оригиналните данни са групирани X (налични честоти е) изчисляване на средното отклонение се извършва с линеен формула претеглена средна аритметична - получаване на претеглена средна линейна отклонение:
Връщайки се към примера за един студент, който положен изпит и 4 получава следната оценка: 3, 4, 4 и 5. Това вече е изчислена средно аритметично = 4 означава линеен отклонение прост = 0,5. Изчислява отклонението от средната претеглена линейна: R = (| 3-4 | * 1 + | 4-4 | * 2 + | 5-4 | * 1) / 4 = 0.5.
Линейният коефициент на вариация
Коефициент на линейно отклонение - съотношението на средната линейна отклонение към средната аритметична стойност:
С линейния коефициент на вариация може да се сравни с промяната на различни групи от населението, тъй като за разлика от линеен отклонение от средната му стойност не зависи от X. на единици
В този пример, за студент, който преминава изследване и 4 получава следната оценка: 3, 4, 4 и 5, линеен коефициент на вариация е 0,5 / 4 = 0.125 или 12,5%.
Дисперсия - е средните квадратни стойности на X отклонения от средната аритметична стойност. Дисперсията може да бъде изчислена чрез просто средноаритметичната формула - получаване на прост дисперсия от:
Както вече знаете за примера на един студент, който е издържало, и получи 4 Резултат: 3, 4, 4 и 5, преди това са били изчислени средноаритметично = 4. Тогава вариацията на един прост D = ((3-4) 2 + (4-4 ) 2 + (4-4) 2 + (5-4) 2) / 4 = 0,5.
Ако оригиналните данни са групирани X (налични честоти е) изчисляване на дисперсията се извършва съгласно формулата претеглена средна аритметична - получаване на претеглената дисперсия:
В този пример, за студент, който преминава изследване и 4 получава следната оценка: 3, 4, 4 и 5, се изчислява претеглена разсейването на: Е = ((3-4) 2 * 1 + (4-4) 2 * 2 + (5 -4) 2 * 1) / 4 = 0,5.
Ако конвертирате формулата дисперсия (за отваряне на скобите в срока на числител със срок, разделен на знаменател и да доведе подобно), можете да получите друга формула за изчисляването му като разликата между средната стойност на квадратите и квадрата на стойност:
В горния пример можем да знае за студент, който положен изпит и 4 получава следната оценка: 3, 4, 4 и 5, се изчислява като средна метод дисперсията на разликата на площади и квадрат средна стойност:
D = (3 2 * 1 + 4 2 * 2 + 5 2 * 1) / 4-4 2 = 16,5-16 = 0,5.
Ако стойността на X - е делът на населението. дисперсиите се използват за изчисляване на съотношението на дисперсия частен формула:
средното отклонение
Ние вече говорихме за формулата означава квадрат. която се използва за оценка на промяната чрез изчисляване на стандартното отклонение. обозначени с малка гръцката буква сигма:
Даже по-лесно, можете да намерите на стандартното отклонение. ако предварително изчислено дисперсията, корен квадратен от които:
В примера за студент, където се изчислява горе дисперсията. намерите стандартното отклонение като корен квадратен от които :.
Квадратичен коефициент на вариация
Квадратичен коефициент на вариация - е най-популярният вариант на относителна мярка:
Criterial стойност на квадратното Коефициентът на вариация V е 0,333 или 33,3%, тоест, ако V е по-малка или равна на 0,333 - вариация счита, слабите и ако има повече от 0333 - силен. В случай на силни колебания на изследваната статистическа населението се смята за нееднакво. и средната стойност - нетипичен и не може да се използва като общ показател за тази популация.
В примера за студент, където горе изчислява средното отклонение. намерите квадратичен коефициентът на вариация V = 0707/4 = 0.177, която е по-малка от стойността на criterial 0,333, след това отклонението е слаба и е равна на 17,7%.
Предишна лекция. Следващата лекция.