Инесса Бурханова - Теория статистики: конспект лекций
где хме– нижняя граница медианного интервала;
iMe – величина медианного интервала;
f/2 – полусумма частот ряда;
SMe—1 – сумма накопленных частот, предшествующих медианному интервалу;
fMe – частота медианного интервала.
Медиана делит численность ряда пополам, следовательно, она там, где накопленная частота составляет половину или больше половины всей суммы частот, а предыдущая (накопленная) частота меньше половины численности совокупности.
ЛЕКЦИЯ № 8. Показатели вариации
1. Понятие вариации
Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов (условий), которые по–разному сочетаются в каждом отдельном случае.
Колебания отдельных значений характеризуют показатели вариации.
Термин «вариация» произошел от лат. variatio – «изменение, колеблемость, различие». Под вариацией понимают количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака: случайную и систематическую.
Систематическая вариация помогает оценить степень зависимости изменений в изучаемом признаке от определяющих ее факторов.
Абсолютные и средние показатели вариации и способы их расчета
Для характеристики колеблемости признака используется ряд показателей, такие как размах вариации, определяемый как разность между наибольшим (х мах ) и наименьшим (х т щ) значениями вариантов:
R = Xmax — Xmin .
Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений, которое учитывает различия всех единиц изучаемой статистической совокупности. Среднее линейное отклонение определяется как средняя арифметическая из отклонений индивидуальных значений от средней без учета знака этих отклонений:
На практике меру вариации более объективно отражает показатель дисперсии ( 2 – средний квадрат отклонений), определяемый как средняя из отклонений, возведенных в квадрат (х – х1)2 :
Корень квадратный из дисперсии 2 среднего квадрата отклонений представляет собой среднее квадратическое отклонение σ2 и σ– общепринятые меры вариации признака.
Среднее квадратическое отклонение – это мерило надежности средней.
Свойства дисперсии (доказываемые в математической статистике), которые позволяют упростить расчеты:
1) если из всех значений вариант отнять какое–то постоянное число А2 , то средний квадрат отклонений от этого не изменится;
2) если все значения вариант разделить на какое–то постоянное число А, то средний квадрат отклонений уменьшится от этого в А2 раз, а среднее квадратическое отклонение – в А раз
3) если исчислить средний квадрат отклонений от любой величины А, которая в той или иной степени отличается от средней арифметической х, то он всегда будет больше среднего квадрата отклонений σ2 , исчисленного от средней арифметической.
Показатели относительного рассеивания
Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах, которые позволяют сравнивать характер рассеивания в различных распределениях. Расчет показателей меры относительного рассеивания осуществляют отношением абсолютного показателя рассеивания к средней арифметической и умножают на 100%. Виды дисперсий и закон сложения дисперсий При помощи группировок, подразделив изучаемую совокупность на группы, однородные по признаку–фактору, можно определить три показателя колеблемости признака в совокупности: общую дисперсию, межгрупповую дисперсию и среднюю из внут–ригрупповых дисперсий.
Общая дисперсия характеризует вариацию признака, зависящую от всех условий в изучаемой статистической совокупности. Исчисляется общая дисперсия по формуле:
где х0 – общая средняя для всей изучаемой совокупности.
2. Характеристика закономерности рядов распределения
С помощью рядов распределения решается важнейшая задача статистики – характеристика и измерение показателей колеблемости для варьирующих признаков.
В вариационных рядах существует определенная связь в изменении частот и значений варьирующего признака: с увеличением варьирующего признака величина частот вначале возрастает до определенной величины, а затем уменьшается. Такого рода изменения называются закономерностями распределения.
Положение кривой распределения на оси абсцисс и ее рассеивание являются двумя наиболее существенными свойствами кривой. Важные свойства кривой распределения – это степень ее асимметрии, высоко–или низковершинность, которые в совокупности характеризуют форму или тип кривой распределения.
Важная задача – это определение формы кривой, так как статистический материал в обычных условиях дает по определенному признаку характерную, типичную для него кривую распределения. Всякое искажение формы кривой – это нарушение или изменение нормальных условий возникновения материала: появление двухвершинной или асимметричной кривой говорит о разнотипном составе совокупности и о необходимости перегруппировки данных в целях выделения более однородных групп.
Характер общего распределения предполагает оценку степени его однородности и вычисление показателей асимметрии и эксцесса.
Симметричным называют распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой.
Для симметричных распределений средняя арифметическая мода и медиана равны между собой. Простейший показатель асимметрии основан на соотношении показателей центра распределения.
Наиболее точным и распространенным является показатель основанный на определении центрального момента третьего порядка.
Общим является нормальное распределение, которое может быть представлено графически в виде симметричной куполообразной кривой. В сущности, распределения редко бывают точно асимметричны, поэтому нормальная кривая представляет собой идеализированную форму распределения.