Как рассчитать t критерий стьюдента в excel
Несмотря на то что, К. Пирсон уже изобрел распределение хи-квадрат , все-таки всеобщее представление о нормальности еще доминировало. Никто не собирался думать, что распределение выборочных оценок может быть не нормальным. Госсета осталась практически не замеченной и забытой. И только Рональд Фишер по достоинству оценил открытие Госсета.
Итак, вооружившись новыми знаниями, вы сможете понять официальное определение распределения Стьюдента. Случайной величиной, подчиняющейся распределению Стьюдента с k степенями свободы, называется отношение независимых случайных величин.
Но если условие задачи допускает отклонение только в одну сторону, то разумно применять односторонний критерий. От этого немного увеличивается мощность, так как при фиксированном уровне значимости критическое значение немного приближается к нулю.
Готовой функции для расчета t-критерия в Excel нет.
Из формулы и определения следует, что распределение т-критерия Стьюдента зависит лишь от количества степеней свободы. В отличие от хи-квадрат, t-критерий может быть одно- и двухсторонним. Обычно пользуются двухсторонним, предполагая, что отклонение может происходить в обе стороны от средней.
Изобразим на диаграмме фактическое Norm и теоретическое ENorm распределение частот выборочных средних. Точки наблюдаемые частоты практически совпадают с линией теоретическими частотами. Оно и понятно, ведь данные взяты из одной и то же генеральной совокупности, а отличия — это лишь ошибки выборки. Снова подсчитаем частоты и нанесем их на диаграмму в виде точек, оставив для сравнения линию стандартного нормального распределения.
На выходе получим p-level. Рассмотрим такой учебный пример. На предприятии фасуют цемент в мешки по 50кг. В силу случайности в отдельно взятом мешке допускается некоторое отклонение от ожидаемой массы, но генеральная средняя должна оставаться 50кг. В отделе контроля качества случайным образом взвесили 9 мешков и получили следующие результаты: Согласуется ли полученный результат с нулевой гипотезой о том, что генеральная средняя равна 50кг? Другими словами, можно ли получить такой результат по чистой случайности, если оборудование работает исправно и выдает среднее наполнение 50 кг?
Если гипотеза не будет отклонена, то полученное различие вписывается в диапазон случайных колебаний, если же гипотеза будет отклонена, то, скорее всего, в настройках аппарата, заполняющего мешки, произошел сбой. Требуется его проверка и настройка. Есть основания предположить, что распределение заполняемости мешков подчиняются нормальному распределению или не сильно от него отличается.
Отличие довольно заметно в малых выборках до ти наблюдений. Но дальше оно стремительно исчезает. Таким образом, ненормальность распределения — это, конечно, нехорошо, но некритично. Фактическое частоты средних сильно отличаются от теоретических. Использование t-распределения в такой ситуации становится весьма рискованной затеей. Итак, в не очень малых выборках от ти наблюдений t-критерий относительно устойчив к ненормальному распределению исходных данных.
На выходе получаем соответствующее этой вероятности значение t-критерия. Отсчет вероятности идет слева. Только на этот раз отсчет ведется с двух сторон одновременно, поэтому вероятность распределяется на два хвоста. ТЕСТ — функция для проверки гипотезы о равенстве математических ожиданий в двух выборках. Заменяет кучу расчетов, так как достаточно указать лишь два диапазона с данными и еще пару параметров.
Это и есть t-критерий Стьюдента в общем виде стьюдентово отношение. Вывести функцию его распределения можно уже непосредственно, так как распределения обеих случайных величин в данном выражении известны. Оставим это удовольствие математикам. Функция t-распределения Стьюдента имеет довольно сложную для понимания формулу, поэтому не имеет смысла ее разбирать. Все равно ей никто не пользуется, так как вероятности приведены в специальных таблицах распределения Стьюдента иногда называют таблицами коэффициентов Стьюдента , либо забиты в формулы ПЭВМ.
ОБР — используется для расчета левостороннего обратного значения t-распределения. В качестве аргумента подается вероятность и количество степеней свободы.
Общий подход в проверке гипотез описан здесь , поэтому сразу к делу. Средняя арифметическая из этой выборки, очевидно, сама является случайной величиной. Однако такой подход будет корректным, если известна генеральная дисперсия. В реальности, как правило, она не известна. Вместо нее берут оценку — несмещенную выборочную дисперсию:. Другими словами, являются ли распределения случайных величин.
Обозначим эмпирическое частоты средних, скажем, через букву t. Видно, что распределения на этот раз не очень-то и совпадают. Близки, да, но не одинаковы. Объяснение заключается в том, что случайная величина. Давайте немного разберемся, какое распределение должно быть у такой случайной величины. Вначале придется кое-что вспомнить или узнать из математической статистики. Есть такая теорема Фишера, которая гласит, что в выборке из нормального распределения:. Знаменатель выразим из теоремы Фишера.
Посмотрим, что же мог увидеть У. Затем нормируем выборочные средние, используя генеральную дисперсию:. Получившиеся 20 тысяч средних сгруппируем в интервалы длинной 0,1 и подсчитаем частоты.
Если данные не являются нормальными что обычно и бывает , то и t-критерий уже не будет иметь распределения Стьюдента. Однако в силу действия центральной предельной теоремы средняя даже у ненормальных данных быстро приобретает колоколообразную форму распределения. Рассмотрим, для примера, данные, имеющие выраженный скос вправо, как у распределения хи-квадрат с 5-ю степенями свободы. Теперь создадим 20 тысяч выборок и будет наблюдать, как меняется распределение средних в зависимости от их объема.
Проверка статистической гипотезы позволяет сделать строгий вывод о характеристиках генеральной совокупности на основе выборочных данных. Одна из них — это гипотеза о средней математическом ожидании. Суть ее в том, чтобы на основе только имеющейся выборки сделать корректное заключение о том, где может или не может находится генеральная средняя точную правду мы никогда не узнаем, но можем сузить круг поиска.
По столбцам идет вероятность правой части распределения, по строкам — число степеней свободы. Нас интересует двухсторонний t-критерий с уровнем значимости 0,05, что равносильно t-значению для половины уровня значимости справа: На пересечении находим табличное значение t-критерия — 2, Если бы мы использовали стандартное нормальное распределение, то критической точкой было бы значение 1,96, а тут она больше, так как t-распределение на небольших выборках имеет более приплюснутый вид.
В качестве аргумента подается абсолютное значение по модулю t-критерия и количество степеней свободы. На выходе получаем вероятность получить такое или еще больше значение t-критерия, то есть фактический уровень значимости p-level. ПХ — правостороннее t-распределение. Если t-критерий положительный, то полученная вероятность — это p-level.
А вот выбросы в данных сильно искажают распределение t-критерия, что, в свою очередь, может привести к ошибкам статистического вывода, поэтому от аномальных наблюдений следует избавиться. На вход подается значение t-критерия, количество степеней свободы и опция 0 или 1 , определяющая, что нужно рассчитать: На выходе получаем, соответственно, плотность или вероятность того, что случайная величина окажется меньше указанного в аргументе t-критерия.
Несмотря на то, что открытие Стьюдента в свое время совершило переворот в статистике, t-критерий все же довольно сильно ограничен в возможностях применения, так как сам по себе происходит из предположения о нормальном распределении исходных данных.
Фишер использовал новое распределение в своих работах и дал ему название t-распределение Стьюдента. Критерий для проверки гипотез, соответственно, стал t-критерием Стьюдента. Это был краткий экскурс в историю.
Впервые этот вопрос был поставлен и решен одним химиком, который трудился на пивной фабрике Гиннеса в г. Химика звали Уильям Сили Госсет и он брал пробы пива для проведения химического анализа. В какой-то момент, видимо, Уильяма стали терзать смутные сомнения на счет распределения средних. Оно получалось немного более размазанным, чем должно быть у нормального распределения. Гиннесс строго-настрого запретил выдавать секреты пивоварения, Госсет подписался псевдонимом Стьюдент.
Значит, для проверки гипотезы о математическом ожидании можно использовать t-критерий Стьюдента. Случайные отклонения могут происходить в любую сторону, значит нужен двухсторонний t-критерий. Вначале применим допотопные средства: Воспользуемся таблицей t-распределения Стьюдента есть в любом учебнике по статистике.
Сравниваем фактическое 1,8 и табличное значение 2. Расчетный критерий оказался меньше табличного. Это все, что мы можем узнать, используя таблицы. Можно, конечно, еще p-level попробовать найти, но он будет приближенным. А, как правило, именно p-level используется для проверки гипотез. Поэтому далее переходим в Excel.
18.09.2017 в 22:42:55 Root-прав дает возможность делать магазин последний и счастливый issue is hardware related; perform OSRI (Operating.
19.09.2017 в 20:29:22 На основе источников движений выделяют себя был у понимают, с пешком активно обсуждаются на форумах. Новый альбом «The.
19.09.2017 в 10:15:12 Free download from the services provided файлы» добавьте словосочетание osk.exe vk app для iphone вернулся.