Дисперсионный анализ (ANOVA) – это инструмент анализа, используемый в статистике, который разделяет наблюдаемую совокупную изменчивость, обнаруженную в наборе данных, на две части: систематические факторы и случайные факторы. Систематические факторы оказывают статистическое влияние на данный набор данных, а случайные факторы – нет. Аналитики используют тест ANOVA для определения влияния независимых переменных на зависимую переменную в регрессионном исследовании.
T- и методы z-теста Разработанные в 20-м веке использовались для статистического анализа до 1918 года, когда Рональд Фишер создал метод дисперсионного анализа. ANOVA также называется дисперсионным анализом Фишера и является продолжением t- и z-тестов. Этот термин стал известен в 1925 году после появления в книге Фишера «Статистические методы для научных работников». Это использовалось в экспериментальной психологии и позже расширилось до предметов, которые были более сложными.
F = MSTMSE где: F = коэффициент ANOVAMST = средняя сумма квадратов из-за обработкиMSE = средняя сумма квадратов из-за ошибки begin {align} & text {F} = frac { text {MST}} { text { MSE}} & textbf {где:} & text {F} = text {коэффициент ANOVA} & text {MST} = text {Средняя сумма квадратов из-за обработки} & text {MSE} = text {Средняя сумма квадратов из-за ошибки} end {выровнена} F = MSEMST где: F = коэффициент ANOVAMST = Средняя сумма квадратов из-за обработкиMSE = Средняя сумма квадратов из-за ошибка
Тест ANOVA является начальным этапом анализа факторов, влияющих на данный набор данных. По завершении теста аналитик проводит дополнительное тестирование методических факторов, которые в значительной мере способствуют несогласованности набора данных. Аналитик использует результаты теста ANOVA в f-тесте для генерации дополнительных данных, которые соответствуют предложенному регрессия моделей.
Тест ANOVA позволяет сравнивать более двух групп одновременно, чтобы определить, существует ли связь между ними. Результат формулы ANOVA, F-статистика (также называемая F-отношением), позволяет анализировать несколько групп данных, чтобы определить изменчивость между выборками и внутри выборок.
Если между испытуемыми группами нет реальной разницы, которая называется нулевая гипотеза результат статистики коэффициента F ANOVA будет близок к 1. Колебания в ее выборке, вероятно, будут следовать распределению F F. На самом деле это группа функций распределения с двумя характерными числами, называемыми числителем степени свободы и знаменатель степеней свободы.
Ключевые моменты
- Дисперсионный анализ, или ANOVA, представляет собой статистический метод, который разделяет данные наблюдаемой дисперсии на различные компоненты для использования в дополнительных тестах.
- Односторонний ANOVA используется для трех или более групп данных, чтобы получить информацию о взаимосвязи между зависимыми и независимыми переменными.
- Если между группами нет истинной дисперсии, F-отношение ANOVA должно быть близко к 1.
Исследователь может, например, проверить студентов из нескольких колледжей, чтобы определить, превосходят ли учащиеся одного из колледжей учащихся других колледжей. В бизнес-приложении исследователь R & D может протестировать два разных процесса создания продукта, чтобы увидеть, является ли один процесс лучше другого с точки зрения экономической эффективности.
Тип используемого теста ANOVA зависит от ряда факторов. Применяется, когда данные должны быть экспериментальными. Дисперсионный анализ применяется, если нет доступа к статистическому программному обеспечению, что приводит к вычислению ANOVA вручную. Он прост в использовании и лучше всего подходит для небольших образцов. Во многих экспериментальных проектах размеры выборки должны быть одинаковыми для различных комбинаций уровней факторов.
ANOVA полезен для тестирования трех или более переменных. Это похоже на множественные два образца т-тесты , Тем не менее, это приводит к снижению ошибки типа I и подходит для ряда вопросов. ANOVA группирует различия путем сравнения средств каждой группы и включает в себя распространение дисперсии на различные источники. Он используется с предметами, тестовыми группами, между группами и внутри групп.
Существует два типа ANOVA: односторонний (или однонаправленный) и двусторонний. Односторонний или двусторонний относится к числу независимых переменных в вашем анализе дисперсионного теста. Односторонняя ANOVA оценивает влияние единственного фактора на единственную переменную ответа. Он определяет, все ли образцы одинаковы. Односторонний ANOVA используется для определения наличия статистически значимых различий между средствами трех или более независимых (не связанных) групп.
Двухсторонний ANOVA является продолжением одностороннего ANOVA. В одностороннем порядке у вас есть одна независимая переменная, влияющая на зависимую переменную. С двухсторонним ANOVA есть два независимых. Например, двусторонняя ANOVA позволяет компании сравнивать производительность труда на основе двух независимых переменных, таких как зарплата и набор навыков. Он используется для наблюдения за взаимодействием двух факторов и проверки влияния двух факторов одновременно.