Gocapital.ru

Мировой кризис и Я
3 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Сравнительный анализ статистических данных

Статистический анализ

Заключительный и наиболее ответственный этап исследования — статистический анализ, представляющий собой процесс изучения, сопоставления, сравнения полученных данных (в т.ч. и с другими данными), их обобщения, истолкования и формулирования научных и практических выводов.

Анализ – это научный метод исследования объекта путем рассмотрения его отдельных сторон, свойств и составных частей.

Анализ – это единство познания и оценки. В процессе познания аналитик получает фактические данные о состоянии преступности и мер борьбы с ней. Оценка предполагает соотнесение показателей друг с другом в целях выработки управленческого решения.

Исходя из основных функций статистики, можно назвать четыре основные задачи статистического анализа, которые кратко можно сформулировать так: описать, сопоставить и выявить закономерности, дать прогноз и сделать выводы.

Итак, задачи анализа:

1) дать цифровую характеристику состояния, уровня, структуры, динамики преступности и деятельности правоохранительных органов (описательная функция);

2) выявить статистические связи, зависимости, соотношения, закономерности в состоянии, структуре и динамике преступности и деятельности правоохранительных органов ( в т.ч. в связи с другими социальными явлениями) (объяснительная функция);

3) определить тенденции развития преступности, составить статистический криминологический прогноз (прогностическая функция);

4) выявить «тревожные моменты» в характеристике преступности, положительные стороны и недостатки в работе, чтобы на основе этих данных своевременно принять решение (организаторская, управленческая функция).

Для того чтобы выводы и рекомендации, сделанные в результате статистического анализа, имели объективный, научно достоверный характер, необходимо соблюдать следующие требования:

  1. Количественный анализ статистических показателей должен основываться на глубоком знании основных теоретических положений юридических наук.
  2. Статистическая совокупность должна состоять из достаточно большого числа единиц, собранных на большой территории за длительный период.
  3. При анализе статистического материала необходимо использовать не только данные официальной статистики, но и другие материалы (опросы граждан, данные медицинских учреждений и т.п.).
  4. В процессе изучения материалов правовой статистики следует учитывать материалы других отраслей статистики (экономической, демографической, здравоохранения и т.д.).
  1. Постановка целей анализа;
  2. Подбор статистического материала и критическая оценка данных (т.е. проверка их полноты, качества, достоверности, научной обоснованности).
  3. Приведение отобранных данных в систему и расчет недостающих показателей.
  4. Сравнительная оценка и обеспечение сопоставимости данных.
  5. Формирование обобщающих показателей.
  6. Фиксация и обоснование существующих свойств, особенностей, сходств и различий, связей и закономерностей изучаемых явлений и процессов.
  7. Формулировка выводов и подготовка предложений в управленческое решение.

Анализ данных: используем методы статистического исследования

Анализ данных и статистика — вещи одного порядка. Если статистика первооснова и источник информации, то анализ данных — это инструмент для ее исследования, и зачастую анализ данных без статистики невозможен.

Статистика — это изучение любых явлений в числовой форме. Статистика используется анализом данных в количественных исследованиях. Противоположность им — качественные, описывающие ситуацию без применения цифр, в текстовом выражении.

Количественный анализ статистических данных проводится по интервальной шкале и по рациональной:

  • интервальная шкала указывает, насколько тот или иной показатель больше или меньше другого и дает возможность подобрать похожие по свойствам соотношения показатели,
  • рациональная шкала показывает, во сколько раз тот или иной показатель больше или меньше другого, но в ней содержатся только положительные значения, что не всегда будет отражать реальное положение дел.

Как используют Data Mining в компании Mail.ru?

Методы анализа статистических данных

В анализе статистических данных можно выделить аналитический этап и описательный. Описательный этап — последний, он включает представление собранных данных в удобном графическом виде – в графиках, диаграммах, дашбордах. Аналитический этап — это анализ, заключающийся в использовании одного из следующих методов:

  • статистического наблюдения – систематического сбора данных по интересующим характеристикам;
  • сводки данных, в которой можно обработать информацию после наблюдения; она описывает отдельные факты как часть общей совокупности или создает группировки, делит информацию по группам на основании каких-либо признаков;
  • определении абсолютной и относительной статистической величины; абсолютная величина придает данным количественные характеристики в индивидуальном порядке, в независимости от других данных; относительные величины описывают одни объекты или признаки относительно других;
  • метода выборки – использовании при анализе не всех данных, а только их части, отобранной по определенным правилам (выборка может быть случайной, стратифицированной, кластерной и квотной);
  • корреляционного и регрессионного анализа — выявляет взаимосвязи данных и причины, по которым данные зависят друг от друга, определяет силу этой зависимости;
  • метода динамических рядов — отслеживает силу, интенсивность и частоту изменений объектов и явлений; позволяет оценить данные во времени и дает возможность прогнозирования явлений.

Программное обеспечение для статистического исследования

Статистические исследования могут проводить маркетологи-аналитики:

Для качественного анализа статистических данных необходимо либо обладать знаниями математической статистики, либо использовать отчетно-аналитическую программу, либо не заниматься этим. Европейские компании давно осознали пользу big data для анализа больших данных, поэтому либо нанимают хороших аналитиков с математическим образованием, либо устанавливают профессиональное программное обеспечение для аналитиков-маркетологов. Ежедневный анализ в этих компаниях помогает им правильно организовывать закупку товаров, их хранение и логистику, корректировать количество персонала и их рабочие графики.

Решения для автоматизации анализа данных позволяют работать с ними аналитикам-маркетологам. Сегодня есть решения, доступные даже небольшим компаниям, такие как Tableau. Их преимущества по сравнению с анализом, проведенным исключительно человеком:

  • невысокая стоимость внедрения (от 2000 рублей в месяц – на февраль 2018 года),
  • современное графическое представление анализа,
  • возможность мгновенно переходить от одного, более полного отчета, к другому, более детальному.

Хотите узнать, как провести анализ и сделать отчеты быстро?

Полезные статьи → Статистические методы анализа данных в решении практических задач (часть первая)

Опрос сотрудников, клиентов, потребителей, – это не просто сбор информации, а полноценное исследование. А целью всякого исследования является научно обоснованная интерпретация изученных фактов. Первичный материал необходимо обработать, а именно упорядочить и проанализировать. После опроса респондентов происходит анализ данных исследования. Это ключевой этап. Он представляет собой совокупность приемов и методов, направленных на то, чтобы проверить, насколько были верны предположения и гипотезы, а также ответить на заданные вопросы. Данный этап является, пожалуй, наиболее сложным с точки зрения интеллектуальных усилий и профессиональной квалификации, однако позволяет получить максимум полезной информации из собранных данных. Методы анализа данных многообразны. Выбор конкретного метода зависит, в первую очередь, от того, на какие вопросы мы хотим получить ответ. Можно выделить два класса процедур анализа:

  • одномерные (дескриптивные) и
  • многомерные.
Читать еще:  Характеристика качественного анализа

Целью одномерного анализа является описание одной характеристики выборки в определенный момент времени. Рассмотрим более подробно.

Одномерные типы анализа данных

Количественные исследования

Дескриптивный анализ

Дескриптивные (или описательные) статистики являются базовым и наиболее общим методом анализа данных. Представьте, что вы проводите опрос с целью составления портрета потребителя товара. Респонденты указывают свой пол, возраст, семейное и профессиональное положение, потребительские предпочтения и т.д., а описательные статистики позволяют получить информацию, на основе которой будет строиться весь портрет. В дополнение к числовым характеристикам создаются разнообразные графики, помогающие визуально представить результаты опроса. Всё это многообразие вторичных данных объединяется понятием «дескриптивный анализ». Полученные в ходе исследования числовые данные наиболее часто представляются в итоговых отчетах в виде частотных таблиц. В таблицах могут быть представлены разные виды частот. Давайте рассмотрим на примере: Потенциальный спрос на товар

  1. Абсолютная частота показывает, сколько раз тот или иной ответ повторяется в выборке. Например, 23 человека купили бы предложенный товар стоимостью 5000 руб., 41 человек – стоимостью 4500 руб. и 56 человек – 4399 руб.
  2. Относительная частота показывает, какую долю данное значение составляет от всего объема выборки (23 человека – 19,2%, 41 – 34,2%, 56 – 46,6%).
  3. Кумулятивная или накопленная частота показывает долю элементов выборки, не превышающих определенное значение. Например, изменение процента респондентов, готовых приобрести тот или иной товар при уменьшении цены на него (19,2% респондентов готовы купить товар за 5000 руб., 53,4% — от 4500 до 5000 руб., и 100% — от 4399 до 5000 руб. ).

Наряду с частотами, дескриптивный анализ предполагает расчет различных описательных статистик. Соответствуя своему названию, они предоставляют основную информацию о полученных данных. Уточним, использование конкретной статистики зависит от того, в каких шкалах представлена исходная информация. Номинальная шкала используется для фиксации объектов, не имеющих ранжированного порядка (пол, место жительства, предпочитаемая марка и т.д.). Для подобного рода массива данных нельзя рассчитать каких-либо значимых статистических показателей, кроме моды — наиболее часто встречающегося значения переменной. Несколько лучше в плане анализа ситуация обстоит с порядковой шкалой. Здесь становится возможным, наряду с модой, расчет медианы – значения, разбивающего выборку на две равные части. Например, при наличии нескольких ценовых интервалов на товар (500-700 руб. руб., 700-900, 900-1100 руб.) медиана позволяет установить точную стоимость, дороже или дешевле которой потребители готовы приобретать или, наоборот, отказаться от покупки. Наиболее богатыми на все возможные статистики являются количественные шкалы, которые представляют собой ряды числовых значений, имеющих равные интервалы между собой и поддающихся измерению. Примерами подобных шкал могут служить уровень дохода, возраст, время, отводимое на покупки и т.д. В данном случае становятся доступными следующие информационные меры: среднее, размах, стандартное отклонение, стандартная ошибка среднего. Конечно, язык цифр является довольно «сухим» и для многих весьма непонятным. По этой причине дескриптивный анализ дополняется визуализацией данных путем построения различных диаграмм и графиков, как, например: гистограммы, линейные, круговые или точечные диаграммы.

Таблицы сопряженности и корреляции

Таблицы сопряженности – это средство представления распределения двух переменных, предназначенное для исследования связи между ними. Таблицы сопряженности можно рассматривать как частный тип дескриптивного анализа. В них также является возможным представление информации в виде абсолютных и относительных частот, графическая визуализация в виде гистограмм или точечных диаграмм. Наиболее эффективно таблицы сопряженности проявляют себя в определении наличия взаимосвязи между номинальными переменными (например, между полом и фактом потребления какого-либо продукта). В общем виде таблица сопряженности выглядит так. Зависимость между полом и пользованием страховыми услугами

Статистический анализ данных

На основе представленных в таблице данных и можно делать выводы о наличии/отсутствии взаимосвязи между исследуемыми переменными. Для более точного выявления наличия связи между переменными используют разные статистические критерии. Наиболее часто применяются такие, как:

  • критерий Хи-квадрат (χ2);
  • коэффициент сопряженности;
  • критерий лямбда;
  • коэффициент R Спирмена;
  • критерий корреляции Пирсона и др.

Правильный выбор критерия является решающим шагом для получения корректных результатов. Поэтому, если перед вами стоит задача проведения статистического анализа и интерпретация его результатов, но вы не чувствуете уверенности – лучше обратиться к специалистам сервиса Анкетолог, чтобы не получить неправильные выводы, не приближающие к решению проблемы.

По вопросам расчета индексов:

Телефон: +7 (383) 203-49-99

Продолжение статьи «Статистические методы анализа данных для решения практических задач»: часть вторая и часть третья.

Анализ статистических данных

Расчет выборочных параметров ряда. Построение диаграммы накопленных частот и гистограммы выборки. Линейная диаграмма исходного временного ряда. Его аналитическое выравнивание с помощью линейной функции, статистические показатели и прогнозирование.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

к курсовой работе на тему

«Анализ статистических данных»

по дисциплине «Статистика»

1. Задание к курсовой работе

2. Построение ряда распределения

3. Расчет выборочных параметров ряда

4. Построение диаграммы накопленных частот и гистограммы выборки

4.1 Диаграмма накопленных частот

4.2 Гистограмма выборки

5. Проверка основной гипотезы распределения

6. Линейная диаграмма исходного временного ряда

7. Статистические показатели временного ряда

8. Сглаживание временного ряда методом скользящей средней

9. Аналитическое выравнивание временного ряда с помощью линейной функции

10. Прогнозирование временного ряда

выборочный временной ряд выравнивание

Читать еще:  Факторный анализ товарной продукции

С переходом на рыночные условия хозяйствования изменились требования к качеству подготовки экономистов, менеджеров и руководителей предприятий. Они в совершенстве должны владеть современным статистическим инструментарием анализа экономической информации, поскольку от этого в значительной степени зависит эффективность управления предприятием.

Статистические методы являются важной частью процесса управления. Они позволяют вырабатывать обоснованные стратегические решения, сочетающие интуицию специалиста с тщательным анализом имеющейся информации. Использование статистики становится важным преимуществом в конкурентной борьбе.

В качестве исследуемого экономического показателя в работе взята урожайность зерновых культур. Такой выбор обусловлен следующими соображениями.

1. Доступность статистической информации.

2. В значительной степени упрощается само исследование. Это связано с тем, что, исходя из существа изучаемого явления, для описания урожайности может быть принята математической модель в виде стационарного (на определённом отрезке времени) случайного процесса с нормальным законом распределением.

Российская Федерация занимает четвёртое место в общемировом производстве зерна. Её доля в мировой торговле зерном — более 8%. Зерно — это продукт, являющийся основой питания для человека, кормовой базой для сельскохозяйственных животных и сырьём для многих отраслей промышленности.

Урожайность — один из основных экономических показателей сельскохозяйственного производства. В нём суммируются различия в уровне хозяйствования, агроклиматических условий и т.д. Исследование урожайности с позиций статистической науки позволяет осуществлять прогнозы, оценивать риск и многое другое. Поэтому анализ урожайности имеет важное практическое значение.

Источником информации для выполнения исследования служат ежегодные статистические сборники, выпускаемые Челябинским областным комитетом государственной статистики.

Курсовая работа предполагает определение и анализ основных статистических показателей урожайности, изучение закона распределения и корреляционной связи, количественную оценку риска неурожайности, построение, сглаживание и анализ структуры временного ряда, а также выделение тренда.

Наряду с выравниванием временного ряда предлагается осуществить его прогнозирование. Аналогичные по постановке задачи возникают и в других, несельскохозяйственных сферах деятельности. Освоение подходов к решению подобных задач позволит студентам решать проблемы статистического анализа в любой предметной области и грамотно интерпретировать полученные результаты.

В курсовой работе статистические методы обработки информации сочетаются с графическим представлением полученных результатов и использованием для расчётов компьютерной техники.

Методы исследования базируются на знании общей теории статистики и теории вероятностей.

1. ЗАДАНИЕ К КУРСОВОЙ РАБОТЕ

Провести статистическое исследование урожайности зерновых культур и проанализировать полученные результаты.

В расчётах необходимо использовать данные по фактическому сбору урожая в среднем с 1 га посевной (или убранной) площади за последние годы, начиная с 1998 года.

Варианту 14 соответствует Нязепетровский район.

2. ПОСТРОЕНИЕ РЯДА РАСПРЕДЕЛЕНИЯ

Из выданных преподавателем данных отберем те, которые относятся к 14 варианту работы, и занесём в табл. 2.1.

Исходные статистические данные по урожайности

для Нязепетровского района Челябинской области

Медицинские интернет-конференции

Курышова В.В., Щербакова И.В.

Резюме

Знание основ медицинской статистики и использование их при статистическом анализе клинико-лабораторных данных играет важную роль в прогнозировании закономерностей между медицинскими параметрами. В данной статье рассмотрены основные аспекты статистического анализа клинико-лабораторных данных, описывается пример расчета t-критерия и доверительного интервала для определения зависимости концентрации гемоглобина крови от различных факторов.

Ключевые слова

Статья

Статистика – это наука, изучающая количественную сторону массовых явлений в неразрывной связи с их качественной стороной. А медицинская статистика изучает вопросы, связанные с медициной. Для того чтобы стать по-настоящему грамотным специалистом, студенты медицинского вуза должны изучать биометрию, статистику, медицинскую информатику. Роль этих наук в практической деятельности современного врача очень велика, их умелое применение позволяет своевременно оценить уровень здоровья пациентов, оперативно выбрать эффективные диагностические и лечебные мероприятия, повысить качество медицинской помощи и соответственно – качество жизни населения.

Основную цель данной работы составлял анализ методики статистического анализа клинико-лабораторных данных. В результате обзора научной литературы мы остановились на работе И.А. Зворыгина [1], в которой пошагово, в доступной форме, представлена последовательность статистического анализа клинико-лабораторных данных.

1. Описание исходных данных

Как правило, основными задачами статистического анализа являются:

— описание группы (либо нескольких групп) данных с расчетом параметров распределения;

— сравнение нескольких групп данных с учетом параметров распределения.

Компактное описание данных – задача так называемой описательной статистики, в фундаменте которой лежит понятие нормального распределения (распределения Гаусса) [2]. Такое распределение встречается достаточно часто в нормальных физиологических условиях, если значения изучаемого признака близки к их среднему арифметическому значению и примерно с равной вероятностью отклоняются от него в большую или меньшую сторону (рис. 1). Для описания такого распределения используются параметры: среднее значение М и стандартное отклонение s[3].

В качестве примера нормального распределения можно рассмотреть концентрацию гемоглобина крови: данный показатель отклоняется от среднего значения под действием различных слабо выраженных, не зависящих друг от друга факторов – таких, как поступление и потеря железа, интенсивность эритропоэза, время жизни эритроцитов и др. Исходные лабораторные данные – результаты определения концентрации гемоглобина у 30 дноров мужского пола [1].

Рассмотрим ход расчета параметров распределения и будем заносить результаты в табл. 1. Прежде всего, введем исходные показатели в первую колонку таблицы. Далее вычислим среднее арифметическое путем деления суммы исходных значений концентрации гемоглобина на число проб согласно формуле:

Во вторую колонку запишем отклонения данных от среднего значения, т.е. разности (X – M) (из каждого значения вычитается среднее арифметическое). Затем возведем полученные величины в квадрат и поместим их в третью колонку таблицы (X – M) 2 .

Теперь рассчитаем стандартное отклонение (среднее квадратическое отклонение) по формуле

т.е. сумму квадратов отклонений поделим на величину «число проб минус единица» и извлечем из полученного значения квадратный корень.

В результате проведенных расчетов у нас появятся два важных параметра: среднее значение и стандартное отклонение. Эти величины характеризуют распределение признака (концентрации гемоглобина) в совокупности данных. Полученные значения принято записывать формате M ± s с указанием единицы измерения: 147,13 ± 8,54 г/л.

2. Сравнение двух групп с использованием критерия Стьюдента

Полученную выше информацию систематизируем и дополним. По исходным данным о показателях гемоглобина крови, взятой в той же лаборатории у доноров женского пола, в соответствии с вышеприведенным алгоритмом вычислим М, (X – M), (X – M) 2 , s. Для сравнения показателей гемоглобина для мужчин и женщин составим табл. 2.

Читать еще:  Анализ потребительских свойств

Из данных табл. 2 видно, что у некоторых женщин концентрация гемоглобина выше, чем у некоторых мужчин. Однако, концентрация гемоглобина может быть и не связана с гендерным фактором, а быть всего лишь «игрой случая» [1]. Данное предположение составляет суть «нулевой гипотезы» – предположения, что те или иные факторы не оказывают никакого влияния на исследуемую величину, а наблюдаемые различия между группами носят случайный характер.

Дальнейший статистический анализ при сравнении двух групп данных состоит в подтверждении либо опровержении выдвинутой нулевой гипотезы. Для этого используются статистические критерии – методы оценки статистической значимости различий, среди которых наиболее часто применяется критерий Стьюдента t.

Наиболее простая формула расчета критерия Стьюдента выглядит следующим образом:

В числителе – разность средних значений двух групп, в знаменателе – квадратный корень из суммы квадратов стандартных ошибок этих средних значений.

Существуют и другие варианты расчета критерия Стьюдента – например, с использованием числа наблюдений и стандартных отклонений:

Здесь тот же числитель, но в знаменателе – квадратный корень из суммы квадратов стандартных отклонений, деленных на число наблюдений в соответствующей группе. Отметим, что величина s 2 – квадрат стандартного отклонения – отражает степень разброса данных в выборке и носит название «дисперсия» (от английского слова disperse –«рассеиваться»). Согласно исходным данным для рядов мужчин и женщин, s1 = 8,54, s2 = 6,21.

Рассмотрим последнюю формулу. Нулевая гипотеза подразумевает, что обе группы данных представляют собой случайные выборки из одной совокупности. В этом случае из двух квадратов стандартных отклонений s1 2 и s2 2 необходимо рассчитать объединенную оценку дисперсии для двух групп данных [1]:

Затем, зная объединенную оценку дисперсии s 2 для двух выборок, можно рассчитать критерий Стьюдента по вышеприведенной формуле.

По данным табл. 2 мы видим, что группы доноров – мужчин и женщин неравнозначны по объему (n1 = 30; n2 = 21). В подобном случае необходимо вычислить объединенную оценку дисперсии:

По формуле для расчета критерия Стьюдента получаем

Полученную величину критерия Стьюдента t = 9,09 необходимо правильно оценить. Чем ближе к нулю полученный результат, тем больше вероятность нулевой гипотезы. И напротив – чем выше полученное значение t, тем больше оснований отвергнуть нулевую гипотезу и считать, что различия между исследуемыми выборками статистически значимы. Значение критерия, начиная с которого нулевая гипотеза считается отвергнутой, называется критическим значением t.

В задаче об отклонении либо принятии нулевой гипотезы есть следующие «подводные камни»: ошибки первого и второго рода. Если исследователь на основании статистического критерия отклоняет нулевую гипотезу там, где она на самом деле верна, т.е. находит различия там, где их нет, принято говорить об ошибке первого рода. Максимально допустимая вероятность ошибочно отвергнуть нулевую гипотезу называется уровнем значимости и обозначается греческим символом a, поэтому ошибка первого рода – это a-ошибка.

Формально уровень значимости может задаваться непосредственно исследователем. Традиционно в медицинских исследованиях считается достаточным, чтобы вероятность a-ошибки не превышала 5% (a = 0,05). Соответственно, чем меньше уровень значимости, тем выше критическое значение tкр. Уменьшая величину a, например до 0,01, мы снижаем вероятность найти несуществующие различия до 1%. Однако, следует учитывать, что слишком низкий уровень значимости (и, следовательно, слишком высокое критическое значение) приводит к риску не найти различий там, где они есть (иными словами, ошибочно подтвердить нулевую гипотезу) – в этом случае пойдет речь об ошибке второго рода (b-ошибке).

Фактором, влияющим на критическое значение, является также число наблюдений в исследуемой группе. Чем больше объем выборок, тем меньше критическое значение tкр, т.к. в больших выборках параметры распределения меньше зависят от случайных отклонений и точнее представляют исходную совокупность данных [2]. Величину, отражающую объем выборок и влияющую на критическое значение, называют числом степеней свободы и обозначают греческой буквой h: h = n1 + n2 2.

Итак, a и h – факторы, влияющее на критическое значение критерия Стьюдента. Примем уровень значимости a = 0,05, вычислим число степеней свободы:

h = 30 + 21 – 2 = 49.

Формулы расчета критических значений достаточно сложны, поэтому принято пользоваться готовыми таблицами, которые можно найти в учебниках и пособиях по статистике – например, в работе С. Гланца [2]. Выбирается строка с параметром h (при его отсутствии в рассматриваемой таблице берется ближайшее меньшее значение – в нашем случае 48 вместо 49). Далее определяем, что при уровне значимости a = 0,05 критическое значение критерия Стьюдента составляет t = 2,011.

Следовательно, полученное выше значение t > 2,011 позволяет отказаться от нулевой гипотезы и признать статистически значимыми различия между группами доноров – мужчин и женщин. Вычисленное значение критерия Стьюдента t = 9,09 с большим запасом превышает критическое значение даже для уровня значимости a = 0,001.

Далее, для завершения анализа нужна еще одна характеристика, которая фигурирует в большинстве научных работ – вероятность справедливости нулевой гипотезы, обозначаемая p. Дело в том, что кроме критерия Стьюдента существует довольно много других статистических критериев для оценки значимости различий. Способы расчета и критические значения каждый раз будут разные, но выводы в любом случае будут отражать вероятность справедливости нулевой гипотезыp. Иными словами, p представляет собой вероятность ошибки [1].

Например, если полученная величина t оказывается ниже критического значения для a = 0,05, то это означает p > 0,05 – вероятность отвергнуть справедливую нулевую гипотезу в этом случае превышает 5%, и это не позволяет считать различия статистически значимыми. В случае, когда величина t превышает критическое значение для a = 0,05, но все же остается меньше критического значения для a = 0,01, результат записывается как p 2 и стандартную ошибку разности средних по формулам:

Находим произведение стандартной ошибки разности и значения tкр: 2,18 × 2,01 = 4,38. Проводим построение 95%-ного доверительного интервала для разности средних, определяя верхнюю и нижнюю границы:

Ссылка на основную публикацию
Adblock
detector