95 cl: GraphPad Prism 9 Statistics Guide
Лампа накаливания CLAS A CL 95 E27 Osram 4058075027831
Артикул: | 4058075027831 |
Бренд: | Ledvance |
Тип товара: | Лампа накаливания |
Семейство: | Обычная |
Производство
Производитель PHILIPS ведущий мировой бренд по производству бытовой, медицинской и осветительной техники. Мы представляем только светильники и лампы производства под брендом PHILIPS. Штаб-квартира Philips находится в Нидерландах. OSRAM (Название OSRAM образовано слиянием частей названия металлов осмий (OSmium) и вольфрам (wolfRAM) — ведущий мировой бренд по производству источников света. В последние годы Osram изменил от источников света и начал представлять полное светотехническое решение: лампы, светодиоды, светильники. В настоящее время компания OSRAM принадлежит концерну SIEMES (Мюнхен, Германия) LAPP GROUP (Lapp Holding AG, Oskar-Lapp-Str. 2 D-70565 Stuttgart, Германия). В 1957 году Оскар Лапп изобрел первый в мире контрольно-соединительный кабель промышленного изготовления, который получил название ÖLFLEX® и основал новую компанию — U.I.Lapp KG В состав Lapp Group сегодня входит 17 производственных предприятий, в том числе и завод Lapp Kabel, 100 национальных партнеров и 41 торговая компания по всему миру. : | Osram | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Страна производства
: | DE |
Техническая информация и характеристика источника света
Тип источника: | Лампа накаливания |
Описание: | Стандартная лампа накаливания с грушевидной формой |
Области применения лампы: | Бытовое использование Освещение общего назначения Наружное применение только в соответствующих светильниках |
Описание системы: | Прямое включение в сеть |
Цоколь : | E27 |
Цоколь — описание: | Винтовой |
Колба: | A — Грушевидная |
Отделка колбы (цвет): | Прозрачный |
Материал колбы: | Стекло |
Средний срок службы: | 1000 часов |
Световой поток*: | 1260 Lm |
Мощность источника: | 95 W |
Общая длина С, мм: | 97 |
Диаметр D: | 55 mm |
Упаковка
Кол-во в упаковке, ед.: | 100 |
Ед. Изм. : | шт. |
Заказ и Срок поставки
Минимальное кол-во для заказа, шт: | 1 |
Срок поставки: | складская, при отсутствии — по согласованию |
Где купить
Поставщик: | Интернет-портал Elmar, АСТ-Светотехника Киев |
Телефон: | Киев 097 439-6335 |
IEK Лампа накаливания A55 шар 95Вт E27, LN-A55-95-E27-CL
Лампы накаливания вольфрамовые с цоколями Е14, Е27 товарного знака IEK предназначены для использования в осветительных приборах внутреннего и наружного освещения объектов промышленного, коммерческого и бытового назначения. Лампы накаливания соответствуют ГОСТ 31998.1.
Традиционный источник света с минимальной стоимостью. Не требует специальной утилизации. Широкая сфера применения. Выпускается в 2 типах колбы: прозрачной и матовой. Цветная индивидуальная упаковка, привлекающая внимание потенциальных покупателей.
Технические характеристики
Тип источника света: | Лампа накаливания |
Форма лампы или колбы: | Грушевидная (тип A) |
Мощность лампы: | 95 Вт |
Световой поток: | 1240 лм |
Цоколь: | E27 |
Модель или исполнение: | Прозрачный (чистый) |
Напряжение лампы: | 230 В |
Средн номин срок службы: | 1000 ч |
Класс энергоэффективности: | E |
Диаметр: | 53 мм |
Общ длина: | 94 мм |
Цвет: | Нет |
Номин частота: | 50 Гц |
Температура эксплуатации: | от -60 до +45 °C |
Эксплуатационные параметры
Срок службы, Часов: | не менее 1000 |
Номер | 34 | ||
Бренд, модель | Camelion 95/A/CL/E27 | ||
Штрихкод | 4895117846285 | ||
Цоколь, вид, тип | E27 Bulb STD | ||
Цена, руб, $ | 10 руб | ||
Общая оценка параметров лампы | 4.8 | ||
Заявлено | Измерено | % | |
Мощность, Вт | 95.0 | 98.1 | 103.3 |
Световой поток, лм | 1250 | 1305 | 104.4 |
Эквивалент лампы накаливания, Вт | 95 | ||
Цветовая температура, К | 2700 | 2800 | 103.7 |
Индекс цветопередачи, CRI (Ra) | 98.7 | ||
Индекс передачи красного цвета, R9 | 99 | ||
Индексы цветопередачи TM30 Rf, Rg | , | ||
Эффективность (количество люмен на ватт) | 13.3 | ||
Угол освещения, град. | 297 | ||
Коэффициент пульсации света, % | 11 | ||
Напряжение рабочее, минимальное, В | 220-240 | ||
Коэффициент мощности, PF | 1.00 | ||
Срок службы, час | 1000 | ||
Минимальный уровень диммирования, % | 1 | ||
Работа с выключателем, имеющим индикатор | OK | ||
Тип драйвера: | |||
Максимальная температура корпуса | |||
Гарантийный срок, мес | |||
Размер и вес лампы | 50×88мм | ||
Дата изготовления лампы | |||
Завод-изготовитель | |||
Дата тестирования | 24.01.16 | ||
Актуальность лампы | продается | ||
Для измерений использовались приборы |
|
Colgate-Palmolive (CL) — дивиденды компании, график стоимости акций. Прогноз цены Colgate-Palmolive (CL) :: РБК Инвестиции
Выводим дату закрытия реестра акционеров. Чтобы успеть получить дивиденды по акции, необходимо успеть купить её не менее чем за 2 торговых дня до указанной даты
21 июля 2021 0,45 0,545% 14 апреля 2021 0,45 0,565% 25 января 2021 0,44 0,56% 23 октября 2020 0,44 0,555% 20 июля 2020 0,44 0,592% 20 апреля 2020 0,44 0,61% 23 января 2020 0,43 0,609% 23 октября 2019 0,43 0,64% 18 июля 2019 0,43 0,584% 19 апреля 2019 0,43 0,62% 23 января 2019 0,42 0,68% 19 октября 2018 0,42 0,652% 18 июля 2018 0,42 0,644% 20 апреля 2018 0,42 0,616% 21 января 2018 0,4 0,573% 19 октября 2017 0,4 0,539% 13 июля 2017 0,4 — 18 апреля 2017 0,4 — 18 января 2017 0,39 —
Характеристики | |
---|---|
Гарантия | Гарантийные условия |
Модель | Ambrella Orbital Crystal F95 CH/CL 72W D600 |
Тип светильника | Светильник потолочный |
Новинки | Новинки 2018/19 |
Где применяется | Для гостиной, Для спальни |
Максимальная площадь помещения | 31 м2 |
Тип крепления к поверхности | На планку |
Подходит для натяжного потолка | да |
Дополнительные функции | С пультом, Диммер |
Водозащита | Нет |
Габариты | |
Вес, кг | 6.5000 |
Высота | 12 см |
Длина/ширина конструкции | Диаметр 60 см |
Материалы и цвет | |
Материал арматуры | Акрил |
Цвет арматуры | Белый |
Материал плафона | Акрил |
Цвет плафонов | Белый |
Лампочки | |
Цветовая температура | 3000K, 4200K, 6400K |
Общая мощность | 72 Вт |
Количество ламп | 1 |
Мощность одной лампы | 72 Вт |
Тип используемых ламп | LED |
Возможность замены ламп | Встроенный источник света |
Комплектация лампочками | Лампы входят в комплект |
О производителе | |
Производитель | Ambrella |
Страна бренда | Россия |
Страна производства | Китай |
1 | Артикул | 1056000130 |
2 | Тип ИС | LED |
3 | Световой поток | 3400 лм |
4 | Мощность светильника | 32 Вт |
5 | Энергоэффективность | 106 лм/Вт |
6 | Индекс цветопередачи (CRI) | >80 |
7 | Коррелированная цветовая температура (в сфере) | 4000 K |
8 | Коэффициент мощности (cos φ) | > 0,95 |
9 | Переменный/постоянный ток (AC/DC) | Да |
10 | Диммирование | — |
11 | Напряжение питания | 230 В |
12 | Класс защиты от поражения током | I |
13 | Электромагнитная совместимость (ТР ТС 020/2011) | Да |
14 | Климатическое исполнение | УХЛ4 |
15 | Температурный режим | от +5 до +35 C |
16 | Цвет корпуса | Металлик |
17 | Класс пожароопасности | — |
18 | Коэффициент пульсации | <5% |
19 | Степень защиты (IP) | IP20 |
20 | Ударопрочность | IK02/0,2 Дж |
21 | Класс энергоэффективности | A+ |
22 | Блок аварийного питания | Да |
23 | Угол обзора | D120 |
24 | Гарантия | 36 мес. |
25 | Время работы в аварийном режиме, ч. | 1 |
26 | Световой поток в аварийном режиме | 10% лм |
27 | Цвет свечения | Белый |
Доверительных интервалов
Интервал 4 плюс-минус 2
Доверительный интервал — это диапазон значений . мы почти уверены, что наше истинное значение находится в пределах .
Пример: Средняя высота
Мы измеряем рост 40 случайно выбранных мужчин и получаем средний рост 175 см ,
Нам также известно, что стандартное отклонение роста мужчин составляет 20 см .
95% доверительный интервал (мы покажем, как его вычислить позже):
175 см ± 6,2 см
Это говорит о том, что истинное среднее значение ВСЕХ мужчин (если бы мы могли измерить их рост), вероятно, находятся в диапазоне от 168,8 до 181,2 см.
А может и не быть!
«95%» означает, что 95% экспериментов, подобных тому, что мы только что провели, будут включать истинное среднее значение, но 5% не будут .
Таким образом, вероятность того, что наш доверительный интервал НЕ включает истинное среднее значение, составляет 1 из 20 (5%).
Расчет доверительного интервала
Шаг 1 : начать с
Примечание: мы должны использовать стандартное отклонение всей совокупности , но во многих случаях мы этого не узнаем.
Мы можем использовать стандартное отклонение для выборки , если у нас достаточно наблюдений (по крайней мере, n = 30, надеюсь, больше).
В нашем примере:
- количество наблюдений n = 40
- среднее X = 175
- стандартное отклонение с = 20
Шаг 2 : решите, какой доверительный интервал мы хотим: 95% или 99% являются обычным выбором. Затем найдите здесь значение «Z» для этого доверительного интервала:
Доверие Интервал | Z |
80% | 1.282 |
85% | 1,440 |
90% | 1,645 |
95% | 1,960 |
99% | 2,576 |
99,5% | 2,807 |
99,9% | 3,291 |
Для 95% значение Z равно 1,960
Шаг 3 : используйте это значение Z в этой формуле для доверительного интервала
X ± Z с √n
Где:
- X — среднее значение
- Z — выбранное значение Z из таблицы выше
- с — стандартное отклонение
- n — количество наблюдений
А у нас:
175 ± 1.960 × 20 √40
Что такое:
175 см ± 6,20 см
Другими словами: от 168,8 см до 181,2 см
Значение после ± называется пределом погрешности
Погрешность в нашем примере 6,20 см
Калькулятор
У нас есть калькулятор доверительного интервала, который облегчит вам жизнь.
Симулятор
У нас также есть очень интересный симулятор нормального распределения.где мы можем начать с некоторого теоретического «истинного» среднего и стандартного отклонения, а затем взять случайные выборки.
Это помогает нам понять, как случайные выборки иногда могут быть очень хорошими или плохими при представлении лежащих в основе истинных значений.
Другой пример
Пример: Яблоневый сад
Яблоки достаточно большие?
На деревьях сотни яблок, поэтому вы случайным образом выбираете всего 46 яблок и получаете:
- a Среднее из 86
- Стандартное отклонение 6.2
Итак, посчитаем:
X ± Z с √n
Мы знаем:
- X — это среднее значение = 86
- Z — значение Z = 1,960 (из таблицы выше для 95%)
- с — стандартное отклонение = 6,2
- n — количество наблюдений = 46
86 ± 1,960 × 6,2 √46 = 86 ± 1.79
Таким образом, истинное среднее значение (для всех сотен яблок) составляет , вероятно, находится между 84,21 и 87,79
Истинное Среднее
А теперь представьте, что мы можем сразу собрать ВСЕ яблоки и измерить их ВСЕ с помощью упаковочной машины (такая роскошь, как правило, не встречается в статистике!)
И истинное среднее значение оказывается 84,9
Разложим все яблоки на земле от самых маленьких до самых больших:
Каждое яблоко — зеленая точка,
за исключением наших наблюдений, которые синие
Наш результат не был точным… это случайно, в конце концов … но истинное среднее находится в пределах нашего доверительного интервала 86 ± 1,79 (другими словами от 84,21 до 87,79)
Теперь истинное среднее значение может не находиться в пределах доверительного интервала , но в 95% случаев оно будет!
95% всех «95% доверительных интервалов» будут включать истинное среднее значение.
Может быть, у нас был этот образец со средним значением 83,5:
Каждое яблоко — зеленая точка,
наши наблюдения отмечены фиолетовым
Это не включает истинное среднее значение. Ожидайте, что это произойдет в 5% случаев при доверительном интервале 95%.
Итак, как мы узнаем, является ли взятый нами образец одним из «счастливых» 95% или неудачных 5%? Если мы не сможем измерить всю популяцию, как указано выше, мы просто не знаем .
Это риск при выборке, у нас может быть плохая выборка.
Пример из исследований
Вот доверительный интервал, использованный в фактических исследованиях дополнительных упражнений для пожилых людей :
Что там говорится? Глядя на «Мужскую» строчку видим:
- 1226 мужчин (47.6% всех людей)
- имел «HR» (см. Ниже) со средним значением 0,92 ,
- и 95% доверительный интервал (95% ДИ) от 0,88 до 0,97 (что также составляет 0,92 ± 0,05)
«ЧСС» — это показатель пользы для здоровья (чем ниже, тем лучше), так что эта линия говорит о том, что истинная польза от упражнений (для более широкой популяции мужчин) с вероятностью 95% находится между 0,88 и 0,97
* Примечание для любопытных: «ЧСС» часто используется в медицинских исследованиях и означает «коэффициент опасности», где чем ниже, тем лучше, поэтому ЧСС равняется 0.92 означает, что у испытуемых было лучше, а 1,03 означает немного хуже.
Стандартное нормальное распределение
Все это основано на идее стандартного нормального распределения, где значение Z — это «Z-оценка».
Например, Z для 95% составляет 1,960, и здесь мы видим, что диапазон от -1,96 до +1,96 включает 95% всех значений:
От -1,96 до +1,96 стандартное отклонение составляет 95%
Если применить это к нашему образцу, то это выглядит так:
Также с -1.От 96 до +1,96 стандартного отклонения, поэтому включает 95%
Заключение
Доверительный интервал основан на среднем и стандартном отклонении. Его формула:
X ± Z с √n
Где:
- X — среднее значение
- Z — значение Z из таблицы ниже
- с — стандартное отклонение
- n — количество наблюдений
Доверие Интервал | Z |
80% | 1.282 |
85% | 1,440 |
90% | 1,645 |
95% | 1,960 |
99% | 2,576 |
99,5% | 2,807 |
99,9% | 3,291 |
Что такое доверительные интервалы? | Simply Psychology
- Статистика
- Доверительные интервалы
Что такое доверительные интервалы в статистике?
Что такое доверительные интервалы в статистике?
Автор: Dr.Saul McLeod, опубликовано 10 июня 2019 г., обновлено 2021 г.
Доверительный интервал (ДИ) — это диапазон значений, который с определенной степенью уверенности может включать в себя значение генеральной совокупности. Часто выражается в процентах, при этом среднее значение по совокупности находится между верхним и нижним интервалом.
Что означает 95% доверительный интервал?
95% доверительный интервал — это диапазон значений, который, как вы можете быть уверены на 95%, содержит истинное среднее значение генеральной совокупности.Из-за естественной изменчивости выборки среднее значение выборки (центр ДИ) будет варьироваться от выборки к выборке.
Уверенность в методе, а не в конкретном КЭ. Если мы повторим этот метод выборки много раз, примерно 95% построенных интервалов будут соответствовать истинному среднему значению генеральной совокупности.
Следовательно, по мере увеличения размера выборки диапазон значений интервала будет сужаться, а это означает, что вы знаете это среднее с гораздо большей точностью по сравнению с меньшей выборкой.
Мы можем визуализировать это, используя нормальное распределение (см. График ниже).
Например, вероятность того, что среднее значение генеральной совокупности находится между -1,96 и +1,96 стандартных отклонений (z-баллов) от среднего значения выборки, составляет 95%.
Соответственно, существует 5% -ная вероятность того, что среднее значение генеральной совокупности находится за пределами верхнего и нижнего доверительного интервала (как показано 2,5% выбросов по обе стороны от 1,96 z-значений).
Почему исследователи используют доверительные интервалы?
Более или менее невозможно изучить каждого отдельного человека в популяции, поэтому исследователи выбирают выборку или подгруппу населения.
Это означает, что исследователь может только оценить параметры (то есть характеристики) популяции, при этом предполагаемый диапазон рассчитывается на основе заданного набора данных выборки.
Следовательно, Доверительный интервал — это просто способ измерить, насколько хорошо ваша выборка представляет изучаемую вами совокупность.
Вероятность того, что доверительный интервал включает истинное среднее значение в генеральной совокупности, называется доверительным уровнем доверительного интервала.
Вы можете рассчитать доверительный интервал для любого уровня достоверности, но чаще всего используется значение 95%.95% -ный доверительный интервал — это диапазон значений (верхних и нижних), которые, как вы можете быть уверены на 95%, содержат истинное среднее значение генеральной совокупности.
Как рассчитать доверительный интервал?
Чтобы вычислить доверительный интервал, начните с вычисления среднего значения и стандартной ошибки выборки.
Помните, что вы должны рассчитать верхний и нижний баллы для доверительного интервала, используя z-балл для выбранного уровня достоверности (см. Таблицу ниже).
Уровень уверенности | Z-Score |
---|---|
0.90 | 1,645 |
0,95 | 1,96 |
0,99 | 2,58 |
Формула доверительного интервала
Где:
- X
- среднее значение — выбранное значение Z (1,96 для 95%)
- с — стандартная ошибка
- n — размер выборки
Для оценки нижнего интервала разделите стандартную ошибку на квадратный корень из n, и затем умножьте сумму этого расчета на z-оценку (1.96 на 95%). Наконец, вычтите значение этого расчета из выборочного среднего.
Пример
- X (среднее) = 86
- Z = 1,960 (из таблицы выше для 95%)
- с (стандартная ошибка) = 6,2
- n ( размер выборки) = 46
Нижнее значение: 86 — 1,960 × 6,2 √46 = 86 — 1,79 = 84,21
Верхнее значение: 86 + 1,960 × 6,2 √46 = 86 + 1,79 = 87.79
Таким образом, среднее значение для генеральной совокупности, вероятно, будет между 84,21 и 87,79
Как мы можем быть уверены, что среднее значение для генеральной совокупности аналогично среднему по выборке?
Чем уже интервал (верхнее и нижнее значения), тем точнее наша оценка.
Как правило, с увеличением размера выборки доверительный интервал должен сужаться.
Следовательно, с большими выборками вы можете оценить среднее значение генеральной совокупности с большей точностью, чем с меньшими выборками, поэтому доверительный интервал довольно узкий при вычислении по большой выборке.
Как сообщить о доверительном интервале Стиль APA
В руководстве по стилю APA 6 указано (стр.117):
«При сообщении доверительных интервалов используйте формат 95% ДИ [LL, UL], где LL — нижнее значение. предел доверительного интервала, а UL — верхний предел. ”
Например, можно сообщить: 95% ДИ [5,62, 8,31].
Доверительные интервалы также можно указать в таблице
Как ссылаться на эту статью: Как ссылаться на эту статью:McLeod, S.А. (2019, 10 июня). Что такое доверительные интервалы в статистике? Просто психология: https://www.simplypsychology.org/confidence-interval.html
сообщить об этом объявлениидоверительных интервалов
доверительных интерваловДоверительные интервалы
Автор:
Лиза Салливан, доктор философии
Профессор биостатистики
Школа общественного здравоохранения Бостонского университета
Как отмечалось в предыдущих модулях, ключевая цель прикладной биостатистики состоит в том, чтобы делать выводы о неизвестных параметрах популяции на основе статистики выборки.Есть две широкие области статистического вывода, оценки и проверки гипотез. Оценка — это процесс определения вероятного значения параметра совокупности (например, истинного среднего значения совокупности или доли совокупности) на основе случайной выборки. На практике мы выбираем выборку из целевой совокупности и используем статистику выборки (например, среднее значение выборки или долю выборки) в качестве оценок неизвестного параметра. Выборка должна быть репрезентативной для всей совокупности, при этом участники должны выбираться случайным образом из совокупности.При создании оценок также важно количественно оценить точность оценок из различных выборок.
После завершения этого модуля студент сможет:
- Определите точечную оценку, стандартную ошибку, уровень достоверности и допустимую погрешность
- Сравните и сопоставьте стандартную ошибку и предел погрешности
- Вычислить и интерпретировать доверительные интервалы для средних и пропорций
- Различение независимых и сопоставленных или парных выборок
- Вычислить доверительные интервалы для разницы средних и пропорций в независимых выборках и для средней разницы в парных выборках
- Определите подходящую формулу доверительного интервала на основе типа переменной результата и количества выборок
Существует ряд параметров населения, представляющих потенциальный интерес при оценке результатов для здоровья (или «конечных точек»).Многие из результатов, которые мы хотим оценить, являются либо непрерывными, либо дихотомическими переменными, хотя есть и другие типы, которые обсуждаются в следующем модуле. Оцениваемые параметры зависят не только от того, является ли конечная точка непрерывной или дихотомической, но и от количества изучаемых групп. Более того, когда сравниваются две группы, важно установить, являются ли группы независимыми (например, мужчины или женщины) или зависимыми (например, совпадающими или парными, например, сравнение до и после).В таблице ниже приведены параметры, которые могут быть важны для оценки в исследованиях, связанных со здоровьем.
Оцениваемые параметры
Непрерывная переменная
Дихотомическая переменная
Один образец
означает
пропорция или ставка, e.г., распространенность, кумулятивная заболеваемость, заболеваемость
Два независимых образца
разница в средствах
разница в пропорциях или ставках, например, разница в рисках, разница в ставках, соотношение рисков, отношение шансов, относимая доля
Две зависимые совпадающие выборки
средняя разница
Существует два типа оценок для каждого параметра совокупности: точечная оценка и оценка доверительного интервала (ДИ).Как для непрерывных переменных (например, среднего значения совокупности), так и для дихотомических переменных (например, доли населения) сначала вычисляется точечная оценка по выборке. Напомним, что средние значения выборки и доли выборки представляют собой несмещенные оценки соответствующих параметров генеральной совокупности.
Как для непрерывных, так и для дихотомических переменных оценка доверительного интервала (ДИ) представляет собой диапазон вероятных значений параметра совокупности на основе:
- точечная оценка, эл.г., выборочное среднее
- желаемый уровень уверенности исследователя (чаще всего 95%, но можно выбрать любой уровень от 0 до 100%)
- и изменчивость выборки или стандартная ошибка точечной оценки.
Строго говоря, 95% доверительный интервал означает, что если бы мы взяли 100 различных образцов и вычислили 95% доверительный интервал для каждого образца, то приблизительно 95 из 100 доверительных интервалов будут содержать истинное среднее значение ( μ ).Однако на практике мы выбираем одну случайную выборку и генерируем один доверительный интервал, который может содержать или не содержать истинное среднее значение. Наблюдаемый интервал может завышать или недооценивать μ . Следовательно, 95% доверительный интервал — это вероятный диапазон истинного, неизвестного параметра. Доверительный интервал не отражает изменчивость неизвестного параметра. Скорее, он отражает количество случайной ошибки в выборке и предоставляет диапазон значений, из которых , вероятно, включают неизвестный параметр.Другой способ представления доверительного интервала заключается в том, что это диапазон вероятных значений параметра (определяемый как точечная оценка + предел погрешности ) с заданным уровнем достоверности (который аналогичен вероятности).
Предположим, мы хотим сгенерировать оценку доверительного интервала 95% для неизвестного среднего значения генеральной совокупности. Это означает, что существует 95% -ная вероятность того, что доверительный интервал будет содержать истинное среднее значение генеральной совокупности. Таким образом, P ([выборочное среднее] — погрешность <μ <[выборочное среднее] + погрешность) = 0.95.
Центральная предельная теорема, представленная в модуле Вероятность, заявила, что для больших выборок распределение выборочных средних приблизительно нормально распределено со средним значением:
и стандартное отклонение (также называемое стандартной ошибкой):
Для стандартного нормального распределения P (-1,96
Подставив выражение в правую часть уравнения:
Используя алгебру, мы можем переработать это неравенство так, чтобы среднее значение (μ) было средним членом, как показано ниже.
, затем
и, наконец,
Это последнее выражение, таким образом, обеспечивает 95% доверительный интервал для среднего значения генеральной совокупности, и это также можно выразить как:
Таким образом, погрешность равна 1.96-кратная стандартная ошибка (стандартное отклонение точечной оценки от выборки), а 1,96 отражает тот факт, что был выбран уровень достоверности 95%. Итак, общий вид доверительного интервала:
точечная оценка + Z SE (точечная оценка)
, где Z — значение стандартного нормального распределения для выбранного уровня достоверности (например, для уровня достоверности 95% Z = 1,96).
На практике мы часто не знаем значение стандартного отклонения генеральной совокупности ( σ ).Однако, если размер выборки большой (n > 30), то стандартные отклонения выборки могут использоваться для оценки стандартного отклонения генеральной совокупности.
Таблица— Z-значения для обычно используемых доверительных интервалов
Желаемый доверительный интервал
Z-счет
90%
95%
99%
1.645
1,96
2,576
В публикациях, связанных со здоровьем, чаще всего используется 95% доверительный интервал, но это произвольное значение, и можно выбрать другие уровни достоверности. Обратите внимание, что для данной выборки 99% доверительный интервал будет шире, чем 95% доверительный интервал, потому что он позволяет быть более уверенным в том, что неизвестный параметр совокупности содержится в пределах интервала.
Для меньших выборок (n <30) центральная предельная теорема не применяется, и необходимо использовать другое распределение, называемое распределением t .Распределение t похоже на стандартное нормальное распределение, но принимает несколько иную форму в зависимости от размера выборки. В некотором смысле можно было бы думать о t-распределении как о семействе распределений для меньших выборок. Вместо значений «Z» используются значения «t» для доверительных интервалов, которые больше для меньших выборок, что дает больший предел погрешности, потому что маленькие выборки менее точны. Значения t перечислены по степеням свободы (df). Как и в случае с большими выборками, t-распределение предполагает, что интересующий результат приблизительно нормально распределен.
Таблица значений t показана в рамке ниже. Обратите внимание, что к таблице также можно получить доступ из «Другие ресурсы» в правой части страницы.
Предположим, мы хотим оценить среднее систолическое артериальное давление, индекс массы тела, общий уровень холестерина или количество лейкоцитов в одной целевой популяции. Мы выбираем образец и вычисляем описательную статистику, включая размер выборки (n), среднее значение выборки и стандартное отклонение выборки (я).Формулы доверительных интервалов для среднего значения генеральной совокупности зависят от размера выборки и приведены ниже.
Доверительные интервалы для μ
Используйте таблицу Z для стандартного нормального распределения.
Используйте таблицу t с df = n-1
Пример: Описательные статистические данные по переменным, измеренным в выборке из n = 3 539 участников, пришедших на седьмой осмотр потомства в рамках Фрамингемского исследования сердца, показаны ниже.
Характеристика
n
Среднее значение по выборке
Стандартное отклонение (с)
Систолическое артериальное давление
3,534
127,3
19.0
Диастолическое артериальное давление
3,532
74,0
9,9
Общий холестерин сыворотки
3,310
200,3
36,8
Масса
3 506
174.4
38,7
Высота
3,326
65.957
3,749
Индекс массы тела
3,326
28,15
5.32
Поскольку образец большой, мы можем сгенерировать 95% доверительный интервал для систолического артериального давления, используя следующую формулу:
Значение Z для доверительной вероятности 95% составляет Z = 1,96. [ Примечание: И таблица Z-оценок, и таблица t-оценок также доступны из «Другие ресурсы» в правой части страницы.]
Подставляя статистику выборки и значение Z для достоверности 95%, получаем
Таким образом, доверительный интервал равен
.(126.7 127,9)
Точечная оценка истинного среднего систолического артериального давления в популяции составляет 127,3, и мы на 95% уверены, что истинное среднее значение находится между 126,7 и 127,9. Погрешность здесь очень мала из-за большого размера выборки
.Каков доверительный интервал 90% для ИМТ? (Обратите внимание, что Z = 1,645, чтобы отразить уровень достоверности 90%.)
Ответ
В таблице ниже представлены данные по подвыборке из n = 10 участников седьмого экзамена Framingham Offspring Study.
Характеристика
n
Среднее значение по выборке
Стандартное отклонение (с)
Систолическое артериальное давление
10
121,2
11.1
Диастолическое артериальное давление
10
71,3
7,2
Общий холестерин сыворотки
10
202,3
37,7
Масса
10
176.0
33,0
Высота
10
67,175
4.205
Индекс массы тела
10
27,26
3.10
Предположим, мы вычисляем 95% доверительный интервал для истинного систолического артериального давления, используя данные в подвыборке. Поскольку размер выборки невелик, теперь мы должны использовать формулу доверительного интервала, которая включает t, а не Z.
Размер выборки n = 10, степени свободы (df) = n-1 = 9. Значение t для 95% достоверности с df = 9 составляет t = 2,262.
Подставляя статистику выборки и значение t для доверительной вероятности 95%, мы получаем следующее выражение:
.
Интерпретация: Основываясь на этой выборке размером n = 10, наша наилучшая оценка истинного среднего систолического артериального давления в популяции составляет 121,2. Основываясь на этой выборке, мы на 95% уверены, что истинное систолическое артериальное давление в популяции находится между 113,3 и 129,1. Обратите внимание, что погрешность здесь больше, в первую очередь из-за небольшого размера выборки.
Используя подвыборку в таблице выше, каков 90% доверительный интервал для ИМТ?
Ответ
Предположим, мы хотим оценить долю людей с диабетом в популяции или долю людей с гипертонией или ожирением.Эти диагнозы определяются конкретными уровнями лабораторных тестов и измерений артериального давления и индекса массы тела, соответственно. Согласно определениям, субъекты определяются как имеющие эти диагнозы или нет. Когда интересующий результат дихотомичен, как этот, запись для каждого члена выборки указывает наличие интересующего условия или характеристики или нет. Напомним, что для дихотомических исходов исследователь определяет один из результатов как «успех», а другой как «неудачу».Размер выборки обозначается n, и мы позволяем x обозначать количество «успешных» в выборке.
Например, если мы хотим оценить долю людей с диабетом в популяции, мы рассматриваем диагноз диабета как «успех» (т.е. индивидуума, у которого есть интересующий результат), и мы считаем отсутствие диагноза диабет как «неудача». В этом примере X представляет количество людей с диагнозом диабета в выборке. Доля выборки равна p̂ (называемая «p-hat»), и она вычисляется путем взятия отношения количества успешных результатов в выборке к размеру выборки, то есть:
p̂ = х / п
Доверительный интервал для численности населения
Если имеется более 5 успехов и более 5 неудач, то доверительный интервал может быть вычислен по следующей формуле:
Точечная оценка доли населения — это доля выборки, а предел погрешности — произведение значения Z для желаемого уровня достоверности (например,g., Z = 1,96 для 95% достоверности) и стандартной ошибки точечной оценки. Другими словами, стандартная ошибка точечной оценки составляет:
.Эта формула подходит для больших выборок, определяемых как минимум 5 успешных и минимум 5 неудачных попыток. Это было условием центральной предельной теоремы для биномиальных исходов. Если имеется менее 5 успешных или неудачных результатов, то для оценки доли населения необходимо использовать альтернативные процедуры, называемые точными методами. 1,2
Пример: Во время 7-го обследования когорты потомства в Фрамингемском исследовании сердца 1219 участников лечились от гипертонии и 2313 не получали лечения. Если мы назовем лечение «успешным», тогда x = 1219 и n = 3532. Образец пропорции:
Это точечная оценка, т.е. наша наилучшая оценка доли населения, получающего лечение от гипертонии, составляет 34,5%.Выборка большая, поэтому доверительный интервал можно рассчитать по формуле:
Подставляя наши значения, получаем
, что равно
Итак, 95% доверительный интервал равен (0,329, 0,361).
Таким образом, мы на 95% уверены, что истинная доля лиц, принимающих гипотензивные препараты, составляет от 32,9% до 36,1%.
Конкретные применения оценки для отдельной популяции с дихотомическим исходом включают оценку распространенности, совокупной заболеваемости и показателей заболеваемости.
В таблице ниже, взятой из 5-го обследования когорты потомства Фрамингема, показано количество мужчин и женщин с сердечно-сосудистыми заболеваниями (ССЗ) или без них. Оцените распространенность ССЗ у мужчин, используя доверительный интервал 95%.
Без CVD
Превалирующая CVD
Итого
Мужчины
1,548
244
1,792
Женщины
1872
135
2 007
Итого
3,420
379
3,799
Ответ
Есть много ситуаций, когда интересно сравнить две группы относительно их средних баллов по непрерывному результату.Например, нас может заинтересовать сравнение среднего систолического артериального давления у мужчин и женщин или, возможно, сравнение индекса массы тела (ИМТ) у курильщиков и некурящих. Обе эти ситуации включают сравнения между двумя независимыми группами, что означает, что в сравниваемых группах есть разные люди.
Мы могли бы начать с вычисления размеров выборки (n 1 и n 2 ), средних значений (и) и стандартных отклонений (s 1 и s 2 ) в каждой выборке.
В приложении двух независимых выборок с непрерывным результатом интересующим параметром является разница в средних значениях генеральной совокупности, μ 1 — μ 2 . Точечная оценка разницы средних значений совокупности — это разница средних значений выборки:
Доверительный интервал будет вычислен с использованием распределения Z или t для выбранного уровня достоверности и стандартной ошибки точечной оценки. Использование Z или t снова зависит от того, большой ли размер выборки (n 1 > 30 и n 2 > 30) или маленький.Стандартная ошибка точечной оценки будет включать изменчивость интересующего результата в каждой из групп сравнения. Если мы предполагаем равные различия между группами, мы можем объединить информацию об изменчивости (дисперсии выборки), чтобы произвести оценку изменчивости совокупности. Следовательно, стандартная ошибка (SE) разницы в выборочных средних — это объединенная оценка общего стандартного отклонения (Sp) (при условии, что дисперсии в популяциях схожи), вычисленного как средневзвешенное значение стандартных отклонений в образцы, т.э .:
, а совокупная оценка общего стандартного отклонения —
.Вычисление доверительного интервала для разницы между двумя средними значениями
Если размеры выборки больше, то есть n 1 и n 2 больше 30, тогда используется z-таблица.
Если любой размер выборки меньше 30, то используется t-таблица.
- Если n 1 > 30 и n 2 > 30, мы можем использовать z-таблицу:
Использовать таблицу Z для стандартного нормального распределения
- Если n 1 <30 или n 2 <30, используйте t-таблицу: \
Используйте t-таблицу со степенями свободы = n 1 + n 2 -2
Как для больших, так и для малых выборок Sp — это объединенная оценка общего стандартного отклонения (при условии, что дисперсии в популяциях схожи), вычисленного как средневзвешенное значение стандартных отклонений в выборках.
Эти формулы предполагают одинаковую изменчивость в двух популяциях (т. Е. Дисперсии популяций равны, или σ 1 2 = σ 2 2 ), что означает, что результат одинаково варьируется в каждой из сравниваемых популяций. . Для анализа у нас есть выборки из каждой из сравниваемых популяций, и если дисперсии выборки аналогичны, то предположение об изменчивости популяций является разумным. В качестве ориентира, если отношение дисперсий выборки, s 1 2 / s 2 2 находится между 0.5 и 2 (т. Е. Если одно отклонение не более чем вдвое превышает другое), тогда подходят формулы в таблице выше. В противном случае необходимо использовать альтернативные формулы для учета неоднородности дисперсий. 3,4
Пример большой выборки:
В таблице ниже обобщены данные n = 3539 участников, принявших участие в 7-м обследовании когорты потомства в Фрамингемском исследовании сердца.
Мужчины
Женщины
Характеристика
N
с
№
с
Систолическое артериальное давление
1,623
128.2
17,5
1 911
126,5
20,1
Диастолическое артериальное давление
1,622
75,6
9,8
1,910
72.6
9,7
Общий холестерин сыворотки
1,544
192,4
35,2
1,766
207,1
36,7
Масса
1,612
194.0
33,8
1,894
157,7
34,6
Высота
1,545
68,9
2,7
1,781
63.4
2,5
Индекс массы тела
1,545
28,8
4,6
1,781
27,6
5,9
Предположим, мы хотим вычислить разницу в средних систолических АД между мужчинами и женщинами, и нам также нужен 95% доверительный интервал для разницы в средних.Выборка большая (> 30 как для мужчин, так и для женщин), поэтому мы можем использовать формулу доверительного интервала с Z. Затем мы проверим предположение о равенстве дисперсий генеральной совокупности. Отношение дисперсий выборки составляет 17,5 2 / 20,1 2 = 0,76, что находится между 0,5 и 2, что позволяет предположить, что предположение о равенстве дисперсий генеральной совокупности является разумным.
Во-первых, нам нужно вычислить Sp, объединенную оценку общего стандартного отклонения.
Подставляя получаем
, что упрощается до
Обратите внимание, что для этого примера Sp, объединенная оценка общего стандартного отклонения, составляет 19, и это находится между стандартными отклонениями в группах сравнения (т.е.е., 17,5 и 20,1). Затем мы подставляем показатель Z для достоверности 95%, Sp = 19, средние значения выборки и размеры выборки в уравнение для доверительного интервала.
Замена
, что упрощается до
Следовательно, доверительный интервал (0,44, 2,96)
Интерпретация: С достоверностью 95% разница в среднем систолическом артериальном давлении между мужчинами и женщинами составляет 0.44 и 2,96 единиц. Наша лучшая оценка разницы, точечная оценка, составляет 1,7 единицы. Стандартная ошибка разницы составляет 0,641, а погрешность — 1,26 единицы. Обратите внимание, что когда мы генерируем оценки для параметра совокупности в одной выборке (например, среднее [μ]) или пропорции совокупности [p]), полученный доверительный интервал предоставляет диапазон вероятных значений для этого параметра. Напротив, при сравнении двух независимых выборок таким образом доверительный интервал предоставляет диапазон значений для разницы .В этом примере мы оцениваем, что разница в средних систолических артериальных давлениях составляет от 0,44 до 2,96 единиц с мужчинами, имеющими более высокие значения. В этом примере мы произвольно обозначили мужчин как группу 1, а женщин как группу 2. Если бы мы обозначили группы другим способом (т.е. женщины как группа 1, а мужчины как группа 2), доверительный интервал был бы от -2,96 до — 0,44, что свидетельствует о более низком систолическом артериальном давлении у женщин (на 0,44–2,96 единиц ниже, чем у мужчин).
В таблице ниже приведены различия между мужчинами и женщинами в отношении характеристик, перечисленных в первом столбце.Во втором и третьем столбцах показаны средние значения и стандартные отклонения для мужчин и женщин соответственно. Четвертый столбец показывает различия между мужчинами и женщинами и 95% доверительный интервал для различий.
Мужчины
Женщины
Разница
Характеристика
Среднее значение
Среднее значение
95% ДИ
Систолическое артериальное давление
128.2 (17,5)
126,5 (20,1)
(0,44, 2,96)
Диастолическое артериальное давление
75,6 (9,8)
72,6 (9,7)
(2,38, 3,67)
Общий холестерин сыворотки
192.4 (35,2)
207,1 (36,7)
(-17,16, -12,24)
Масса
194,0 (33,8)
157,7 (34,6)
(33,98, 38,53)
Высота
68.9 (2,7)
63,4 (2,5)
(5,31, 5,66)
Индекс массы тела
28,8 (4,6)
27,6 (5,9)
(0,76, 1,48)
Обратите внимание, что 95% доверительный интервал для разницы в средних уровнях общего холестерина между мужчинами и женщинами составляет -17.От 16 до -12,24. У мужчин средний уровень общего холестерина ниже, чем у женщин; где-то от 12,24 до 17,16 единиц ниже. Мужчины имеют более высокие средние значения по каждой из других рассматриваемых характеристик (на что указывают положительные доверительные интервалы).
Доверительный интервал для разницы в средних обеспечивает оценку абсолютной разницы в средних значениях интересующей переменной результата между группами сравнения. Часто представляет интерес сделать суждение о том, существует ли статистически значимая разница между группами сравнения.Это суждение основано на том, превышает ли наблюдаемое различие то, что можно было ожидать случайно.
Доверительные интервалы для разности средних обеспечивают диапазон вероятных значений для (μ 1 -μ 2 ). Важно отметить, что все значения в доверительном интервале являются одинаково вероятными оценками истинного значения (μ 1 -μ 2 ). Если между средними значениями генеральной совокупности нет разницы, то разница будет равна нулю (т. Е. (Μ 1 -μ 2 ).= 0). Ноль — это нулевое значение параметра (в данном случае разница в средних). Если 95% доверительный интервал включает нулевое значение, то между группами нет статистически значимой или статистически значимой разницы. Если доверительный интервал не включает нулевое значение, мы заключаем, что существует статистически значимая разница между группами. Для каждой характеристики в приведенной выше таблице существует статистически значимая разница в средних значениях между мужчинами и женщинами, поскольку ни один из доверительных интервалов не включает нулевое значение, ноль.Обратите внимание, однако, что некоторые средние значения не сильно различаются между мужчинами и женщинами (например, систолическое и диастолическое артериальное давление), но 95% доверительные интервалы не включают ноль. Это означает, что существует небольшая, но статистически значимая разница в средних значениях. Когда есть небольшие различия между группами, можно продемонстрировать, что различия статистически значимы, если размер выборки достаточно велик, как в этом примере.
Пример небольшой выборки:
Ранее мы рассматривали подвыборку из n = 10 участников, посещающих седьмое обследование когорты потомков в Фрамингемском исследовании сердца.Следующая таблица содержит описательную статистику по тем же непрерывным характеристикам в подвыборке, стратифицированной по полу.
Мужчины
Женщины
Характеристика
n
Среднее значение по выборке
с
n
Среднее значение по выборке
с
Систолическое артериальное давление
6
117.5
9,7
4
126,8
12,0
Диастолическое артериальное давление
6
72,5
7,1
4
69.5
8,1
Общий холестерин сыворотки
6
193,8
30,2
4
215,0
48,8
Масса
6
196.9
26,9
4
146,0
7,2
Высота
6
70,2
1,0
4
62.6
2,3
Индекс массы тела
6
28,0
3,6
4
26,2
2,0
Предположим, мы хотим построить 95% доверительный интервал для разницы в среднем систолическом артериальном давлении между мужчинами и женщинами, используя эти данные.Мы снова произвольно обозначим группу мужчин 1 и группу женщин 2. Поскольку размеры выборки небольшие (т. Е. N 1 <30 и n 2 <30), подходит формула доверительного интервала с t. Однако сначала мы проверим, разумно ли предположение о равенстве дисперсий совокупности. Отношение дисперсий выборки составляет 9,7 2 /12,0 2 = 0,65, что находится между 0,5 и 2, что позволяет предположить, что предположение о равенстве дисперсий генеральной совокупности является разумным.Решение показано ниже.
Сначала мы вычисляем Sp, объединенную оценку общего стандартного отклонения:
Замена:
Обратите внимание, что снова объединенная оценка общего стандартного отклонения Sp находится между стандартными отклонениями в группах сравнения (т. Е. 9,7 и 12,0). Степени свободы (df) = n 1 + n 2 -2 = 6 + 4-2 = 8. Из таблицы t = 2,306. 95% доверительный интервал для разницы средних систолических артериальных давлений:
Замена:
Затем, еще более упрощая:
Итак, 95% доверительный интервал для разницы равен (-25.07, 6.47)
Толкование: Наша наилучшая оценка разницы, точечная оценка, составляет -9,3 единицы. Стандартная ошибка разницы составляет 6,84 единицы, а допустимая погрешность — 15,77 единицы. Мы на 95% уверены, что разница в среднем систолическом артериальном давлении между мужчинами и женщинами составляет от -25,07 до 6,47 единиц. В этой выборке у мужчин среднее систолическое артериальное давление ниже, чем у женщин, на 9,3 единицы. Основываясь на этом интервале, мы также заключаем, что нет статистически значимой разницы в среднем систолическом артериальном давлении между мужчинами и женщинами, поскольку 95% доверительный интервал включает нулевое значение, ноль.Опять же, доверительный интервал — это диапазон вероятных значений разницы в средних. Поскольку интервал содержит ноль (без разницы), у нас нет достаточных доказательств, чтобы сделать вывод о наличии разницы. Также обратите внимание, что этот 95% доверительный интервал для разницы в среднем артериальном давлении здесь намного шире, чем интервал, основанный на полной выборке, полученной в предыдущем примере, потому что очень маленький размер выборки дает очень неточную оценку разницы в средних систолических величинах. артериальное давление.
В предыдущем разделе были рассмотрены доверительные интервалы для разницы средних значений между двумя независимыми группами. Существует альтернативный дизайн исследования, в котором две группы сравнения являются зависимыми, подобранными или парными. Рассмотрим следующие сценарии:
- Отдельная выборка участников и каждый участник измеряется дважды: один раз до и затем после вмешательства.
- Один образец участников и каждый участник измеряется дважды в двух разных экспериментальных условиях (например,г., в перекрестном испытании).
Целью этих исследований может быть сравнение средних баллов, измеренных до и после вмешательства, или сравнение средних баллов, полученных с двумя условиями в перекрестном исследовании.
Еще один сценарий — это тот, в котором используются совпадающие выборки. Например, нас может интересовать разница в исходе между близнецами или братьями и сестрами.
И снова у нас есть два образца, и цель состоит в том, чтобы сравнить два средних значения.Однако образцы связаны или зависимы. В первом сценарии измерения «до» и «после» проводятся у одного и того же человека. В последнем сценарии меры принимаются парами особей из одной семьи. Когда выборки являются зависимыми, мы не можем использовать методы из предыдущего раздела для сравнения средних. Поскольку выборки являются зависимыми, необходимо использовать статистические методы, учитывающие зависимость. Эти методы сосредоточены на различиях в баллах (т. Е. На различиях показателей каждого человека до и после вмешательства или на различии показателей между близнецами или парами братьев и сестер).
Блок анализа
Это различие между независимыми и зависимыми выборками подчеркивает важность правильного определения единицы анализа, то есть независимых субъектов в исследовании.
- В один образец и два независимых образца приложений участников являются единицами анализа.
- Однако с двумя зависимыми образцами, приложением , , пара представляет собой единицу (а не количество измерений, которое в два раза больше количества единиц).
Интересующий параметр — это средняя разница μ d . Опять же, первый шаг — вычислить описательную статистику. Мы вычисляем размер выборки (который в данном случае представляет собой количество отдельных участников или отдельных пар), среднее значение и стандартное отклонение баллов разницы , и мы обозначаем эти сводные статистические данные как n, d и s d соответственно. Подходящая формула для доверительного интервала для средней разницы зависит от размера выборки.Формулы показаны в Таблице 6.5 и идентичны тем, которые мы представили для оценки среднего значения для одной выборки, за исключением того, что здесь мы сосредотачиваемся на баллах разницы.
Вычисление доверительных интервалов для μ
dИспользовать таблицу Z для стандартного нормального распределения
Использовать t-таблицу с df = n-1
Когда образцы сопоставлены или объединены в пары, баллы разницы вычисляются для каждого участника или между членами сопоставленной пары, а «n» — это количество участников или пар, является средним значением баллов разницы, а S d — это количество участников или пар. стандартное отклонение разницы баллов
Пример:
В Framingham Offspring Study участники проходят клинические осмотры примерно каждые четыре года.Предположим, мы хотим сравнить систолическое артериальное давление между исследованиями (т. Е. Изменения за 4 года). Приведенные ниже данные представляют собой систолическое артериальное давление, измеренное на шестом и седьмом обследованиях в подвыборке из n = 15 случайно выбранных участников. Поскольку данные в двух выборках (обследование 6 и 7) совпадают, мы вычисляем разницу в баллах, вычитая артериальное давление, измеренное при обследовании 7, из давления, измеренного при обследовании 6, или наоборот. [Если мы вычтем артериальное давление, измеренное при обследовании 6, из того, что было измерено при обследовании 7, то положительные различия представляют увеличение с течением времени, а отрицательные различия представляют собой уменьшение с течением времени.]
Тема №
Экзамен 6
Осмотр 7
Разница
1
168
141
-27
2
111
119
8
3
139
122
-17
4
127
127
0
5
155
125
-30
6
115
123
8
7
125
113
-12
8
123
106
-17
9
130
131
1
10
137
142
5
11
130
131
1
12
129
135
6
13
112
119
7
14
141
130
-11
15
122
121
–1
Обратите внимание, что систолическое артериальное давление у некоторых участников снизилось за 4 года (например,g., артериальное давление участника №1 снизилось на 27 единиц со 168 до 141), в то время как у других увеличилось (например, артериальное давление участника №2 увеличилось на 8 единиц со 111 до 119). Теперь мы оцениваем средней разницы артериального давления за 4 года. Это похоже на задачу одного образца с непрерывным результатом, за исключением того, что теперь мы используем баллы разницы. В этом примере n = 15, средняя разница баллов = -5,3 и s d = 12,8, соответственно. Расчеты показаны ниже
Тема №
Разница
Разница — средняя разница
(разница — средняя разница) 2
1
-27
-21.7
470,89
2
8
13,3
176,89
3
-17
-11,7
136,89
4
0
5.3
28.09
5
-30
-24,7
610,09
6
8
13,3
176,89
7
-12
-6.7
44,89
8
-17
-11,7
136,89
9
1
6,3
39,69
10
5
10.3
106,09
11
1
6,3
39,69
12
6
11,3
127,69
13
7
12.3
151,29
14
-11
-5,7
32,49
15
–1
4,3
18,49
∑ = -79.0
∑ = 0
∑ = 2296,95
Следовательно,
и
Теперь мы можем использовать эту описательную статистику для вычисления 95% доверительного интервала для средней разницы систолического артериального давления в популяции. Поскольку размер выборки невелик (n = 15), мы используем формулу, в которой используется t-статистика. Степени свободы df = n-1 = 14.Из таблицы t-показателей (см. Другой ресурс справа) t = 2,145. Теперь мы можем заменить описательную статистику баллов разницы и значение t для достоверности 95% следующим образом:
Итак, 95% доверительный интервал для разницы равен (-12,4, 1,8).
Устный перевод:
Мы на 95% уверены, что средняя разница систолического артериального давления между обследованиями 6 и 7 (с интервалом примерно 4 года) составляет -12.4 и 1.8. Нулевое (или не имеющее эффекта) значение CI для средней разницы равно нулю. Следовательно, на основе 95% доверительного интервала мы можем сделать вывод об отсутствии статистически значимой разницы в артериальном давлении во времени, потому что доверительный интервал для средней разницы включает ноль.
Испытательный кроссовер
Перекрестные испытания — это особый тип рандомизированного исследования, в котором каждый субъект получает оба лечения (например, экспериментальное лечение и контрольное лечение).Обычно участников случайным образом распределяют на первое лечение, а затем на другое. Во многих случаях между двумя процедурами существует «период вымывания». Результаты измеряются после каждого сеанса лечения у каждого участника. [Пример перекрестного испытания с периодом вымывания можно увидеть в исследовании Pincus et al. в котором исследователи сравнивали реакцию на анальгетики у пациентов с остеоартритом коленного или тазобедренного сустава.] Основным преимуществом перекрестного исследования является то, что каждый участник действует как собственный контроль, и, следовательно, обычно требуется меньшее количество участников, чтобы продемонстрировать эффект.Если результат является непрерывным, оценка лечебного эффекта в перекрестном исследовании выполняется с использованием описанных здесь методик.
Пример:
Перекрестное испытание проводится для оценки эффективности нового препарата, предназначенного для уменьшения симптомов депрессии у взрослых старше 65 лет после инсульта. Симптомы депрессии измеряются по шкале от 0 до 100, причем более высокие баллы указывают на более частые и тяжелые симптомы депрессии. Пациенты, перенесшие инсульт, были допущены к участию в исследовании.Испытание проводилось как перекрестное испытание, в котором каждый пациент получал и новый препарат, и плацебо. Пациенты были слепы к назначению лечения, и порядок лечения (например, плацебо, затем новое лекарство или новое лекарство, а затем плацебо) был назначен случайным образом. После каждого лечения депрессивные симптомы измерялись у каждого пациента. Разница в депрессивных симптомах измерялась у каждого пациента путем вычитания баллов депрессивных симптомов после приема плацебо из баллов депрессивных симптомов после приема нового препарата.В общей сложности 100 участников завершили испытание, и данные приведены ниже.
n
Средняя разница
Стд. Dev. Разница
Депрессивные симптомы после приема нового лекарства — симптомы после плацебо
100
-12.7
8,9
Средняя разница в выборке составляет -12,7, что означает, что в среднем пациенты набрали на 12,7 баллов ниже по шкале депрессивных симптомов после приема нового препарата по сравнению с плацебо (т.е. улучшение в среднем на 12,7 балла). Каким будет 95% доверительный интервал для средней разницы в популяции? Поскольку размер выборки велик, мы можем использовать формулу, в которой используется Z-оценка.
Подставляя текущие значения получаем
Итак, 95% доверительный интервал (-14.1, -10,7).
Интерпретация: Мы на 95% уверены, что среднее улучшение депрессивных симптомов после приема нового препарата по сравнению с плацебо составляет от 10,7 до 14,1 единиц (или, альтернативно, оценка депрессивных симптомов на 10,7–14,1 единиц ниже после приема нового препарата по сравнению с к плацебо). Поскольку мы вычисляли различия, вычитая баллы после приема плацебо из баллов после приема нового препарата, и поскольку более высокие баллы указывают на более тяжелые или более серьезные депрессивные симптомы, отрицательные различия отражают улучшение (т.е., более низкие баллы депрессивных симптомов после приема нового препарата по сравнению с плацебо). Поскольку 95% доверительный интервал для средней разницы не включает ноль, мы можем заключить, что существует статистически значимая разница (в данном случае значительное улучшение) в оценках депрессивных симптомов после приема нового препарата по сравнению с плацебо.
Обычно сравнивают две независимые группы на предмет наличия или отсутствия дихотомической характеристики или атрибута (например,g., распространенное сердечно-сосудистое заболевание или диабет, текущий статус курения, ремиссия рака или успешная имплантация устройства). Когда результат дихотомический, анализ включает сравнение пропорций успехов между двумя группами. Есть несколько способов сравнить пропорции в двух независимых группах.
- Можно вычислить разницу в рисках, которая вычисляется путем взятия разницы в пропорциях между группами сравнения и аналогична оценке разницы в средних для непрерывного результата.
- Коэффициент риска (или относительный риск) — еще одна полезная мера для сравнения пропорций между двумя независимыми популяциями, и он вычисляется путем взятия соотношения пропорций.
Обычно контрольная группа (например, лица, не подвергавшиеся воздействию, лица без фактора риска или лица, отнесенные к контрольной группе в условиях клинического исследования) учитывается в знаменателе отношения. Коэффициент риска является хорошей мерой силы эффекта, в то время как разница в рисках является лучшим измерителем воздействия на общественное здоровье, поскольку сравнивает разницу в абсолютном риске и, следовательно, дает представление о том, сколько людей может выиграть от вмешательства.Отношение шансов — это мера ассоциации, используемая в исследованиях случай-контроль. Это соотношение шансов заболевания у людей с фактором риска и шансов заболеть у людей без фактора риска. Когда интересующий результат относительно необычен (например, <10%), отношение шансов является хорошей оценкой того, каким будет соотношение рисков. Шансы определяются как отношение количества успехов к количеству неудач. Все эти меры (разница рисков, отношение рисков, отношение шансов) используются эпидемиологами в качестве показателей ассоциации, и эти три показателя более подробно рассматриваются в модуле «Меры ассоциации» основного курса эпидемиологии.Ниже описаны оценки доверительного интервала для разницы рисков, относительного риска и отношения шансов.
A. Доверительный интервал для разницы рисков или разницы в распространенности
Разница в риске (RD) или разница в распространенности — это разница в пропорциях (например, RD = p 1 -p 2 ) и аналогична разнице в средних значениях, когда результат является непрерывным. Точечная оценка — это разница в пропорциях образца, как показано в следующем уравнении:
Пропорции выборки вычисляются путем взятия отношения количества «успехов» (или событий здоровья, x) к размеру выборки (n) в каждой группе:
.
Вычисление доверительного интервала для разницы в пропорциях (стр.
1 — стр. 2 )Формула доверительного интервала для разницы в пропорциях или разницы рисков выглядит следующим образом:
Обратите внимание, что эта формула подходит для больших выборок (минимум 5 успешных и минимум 5 неудачных попыток в каждой выборке). Если в любой группе сравнения менее 5 успешных (представляющих интерес событий) или неудач (не-событий), то для оценки разницы в долях населения необходимо использовать точные методы. 5
Пример:
Следующая таблица содержит данные о распространенных сердечно-сосудистых заболеваниях (ССЗ) среди участников, которые в настоящее время не курили, и тех, кто в настоящее время курит на момент пятого обследования в рамках Framingham Offspring Study.
Без CVD
История сердечно-сосудистых заболеваний
Итого
Некурящие
2,757
298
3 055
Курильщик в настоящее время
663
81
744
Итого
3,420
379
3,799
Точечная оценка распространенности ССЗ среди некурящих составляет 298 / 3,055 = 0.0975, а точечная оценка распространенности ССЗ среди нынешних курильщиков составляет 81/744 = 0,1089. При построении доверительных интервалов для разницы рисков принято называть подвергнутую воздействию или лечению группу 1 и не подвергавшуюся или необработанную группу 2. Здесь статус курения определяет группы сравнения, и мы будем называть текущих курильщиков группой 1 и некурящих. группа 2. Доверительный интервал для разницы в распространенности ССЗ (или разницы в распространенности) между курильщиками и некурящими представлен ниже.В этом примере у нас гораздо больше 5 успешных (случаев распространенных ССЗ) и неудач (люди без ССЗ) в каждой группе сравнения, поэтому можно использовать следующую формулу:
Подставляя получаем:
Это упрощается до
Таким образом, 95% доверительный интервал (-0,0133, 0,0361),
Интерпретация: Мы на 95% уверены, что разница в доле распространенных ССЗ у курильщиков по сравнению с некурящими составляет от -0.0133 и 0,0361. Нулевое значение разницы рисков равно нулю. Поскольку 95% доверительный интервал включает ноль, мы заключаем, что разница в распространенных ССЗ между курильщиками и некурящими не является статистически значимой.
Рандомизированное исследование проводится среди 100 субъектов для оценки эффективности недавно разработанного обезболивающего, предназначенного для уменьшения боли у пациентов после операции по замене суставов. Испытание сравнивает новое обезболивающее с болеутоляющим, используемым в настоящее время («стандарт лечения»).Пациенты случайным образом распределяются для приема нового обезболивающего или стандартного обезболивающего после операции. Пациенты не знают назначения лечения. Перед получением назначенного лечения пациентов просят оценить свою боль по шкале от 0 до 10, при этом высокие баллы указывают на усиление боли. Затем каждому пациенту назначают назначенное лечение, и через 30 минут снова просят оценить свою боль по той же шкале. Первичный результат — уменьшение боли на 3 или более баллов по шкале (определяется клиницистами как клинически значимое снижение).
- Используя данные в таблице ниже, вычислите точечную оценку разницы в доле облегчения боли в 3+ балла, наблюдаемых в испытании.
- Вычислите 95% доверительный интервал для разницы в пропорциях пациентов, сообщающих об облегчении (в данном случае разница в риске, поскольку это разница в совокупной частоте).
- Расскажите о своих выводах словами.
Группа лечения
n
# с редуктором
из 3+ точек
Пропорция с уменьшением
из 3+ точек
Новое обезболивающее
50
23
0.46
Стандартное обезболивающее
50
11
0,22
Ответ
B. Доверительные интервалы для коэффициента риска (относительного риска)
Разница в рисках количественно определяет абсолютную разницу в риске или распространенности, тогда как относительный риск, как следует из названия, является относительной мерой.Обе меры полезны, но они дают разные точки зрения на информацию. Кумулятивная заболеваемость — это пропорция, которая обеспечивает меру риска, а относительный риск (или коэффициент риска) рассчитывается как отношение двух пропорций, p 1 / p 2 . По соглашению мы обычно рассматриваем группу, не подвергавшуюся воздействию (или наименее подверженную воздействию), как группу сравнения, а доля успехов или риск для группы сравнения, не подвергавшейся воздействию, является знаменателем этого отношения. Интересующий параметр — это относительный риск или соотношение рисков в популяции, RR = p 1 / p 2 , а точечная оценка — это RR, полученная из наших выборок.
Относительный риск — это соотношение, которое не подчиняется нормальному распределению, независимо от размеров выборки в группах сравнения. Однако натуральный логарифм (Ln) выборки RR имеет приблизительно нормальное распределение и используется для получения доверительного интервала для относительного риска. Следовательно, вычисление доверительного интервала для отношения рисков представляет собой двухэтапную процедуру. Сначала создается доверительный интервал для Ln (RR), а затем вычисляется антилогарифм верхнего и нижнего пределов доверительного интервала для Ln (RR), чтобы получить верхний и нижний пределы доверительного интервала для RR.
Данные могут быть расположены следующим образом:
с исходом
Без выхода
Итого
Открытая группа (1)
x 1
n 1 -x 1
n 1
Не подвергавшаяся воздействию группа (2)
х 2
n 2 -x 2
п 2
Расчет доверительного интервала для коэффициента риска
RR = p 1 / p 2
- Вычислите доверительный интервал для Ln (RR), используя приведенное выше уравнение.
- Вычислите доверительный интервал для RR, найдя антилогарифм результата на шаге 1, то есть exp (нижний предел), exp (верхний предел).
Обратите внимание, что нулевое значение доверительного интервала для относительного риска равно единице. Если 95% доверительный интервал для относительного риска включает нулевое значение 1, то нет достаточных доказательств, чтобы сделать вывод о том, что группы статистически значимо различаются.
Пример:
[На основе Belardinelli R, et al.: «Рандомизированное контролируемое испытание долгосрочных умеренных физических упражнений при хронической сердечной недостаточности — влияние на функциональные возможности, качество жизни и клинические результаты». Тираж. 1999; 99: 1173-1182].
Эти исследователи случайным образом распределили 99 пациентов со стабильной застойной сердечной недостаточностью (ЗСН) на программу упражнений (n = 50) или отсутствие упражнений (n = 49) и наблюдали пациентов два раза в неделю в течение одного года. Интересующим исходом была смертность от всех причин. Те, кто попал в лечебную группу, тренировались 3 раза в неделю в течение 8 недель, затем два раза в неделю в течение 1 года.Тренировки с упражнениями были связаны с более низкой смертностью (9 против 20) у тех, кто тренировался, по сравнению с теми, кто не тренировался.
Умер
Живой
Итого
Исполнено
9
41
50
Нет упражнения
20
29
49
29
70
99
Кумулятивная частота смерти в группе упражнений составила 9/50 = 0.18; в группе, не занимавшейся спортом, заболеваемость составила 20/49 = 0,4082. Следовательно, точечная оценка отношения рисков: RR = p 1 / p 2 = 0,18 / 0,4082 = 0,44. Таким образом, у тех, кто занимается спортом, риск смерти в ходе исследования был в 0,44 раза выше, чем у тех, кто не тренировался. Мы также можем интерпретировать это как сокращение смертности на 56%, поскольку 1-0,44 = 0,56.
Оценка 95% доверительного интервала для относительного риска вычисляется с использованием двухэтапной процедуры, описанной выше.
Подставляя, получаем:
Это упрощается до
Итак, 95% доверительный интервал равен (-1.50193, -0,14003).
95% доверительный интервал для Ln (RR) равен (-1,50193, -0,14003). Чтобы сгенерировать доверительный интервал для риска, мы берем антилогарифм (exp) нижнего и верхнего пределов:
ехр (-1,50193) = 0,2227 и ехр (-0,14003) = 0,869331
Интерпретация: Мы на 95% уверены, что относительный риск смерти у лиц, занимающихся ЗСН, по сравнению с лицами, не занимающимися ЗСН, составляет от 0,22 до 0,87. Нулевое значение равно 1. Поскольку 95% доверительный интервал не включает нулевое значение (RR = 1), результат является статистически значимым.
Еще раз рассмотрим рандомизированное исследование, в котором оценивалась эффективность недавно разработанного обезболивающего для пациентов после операции по замене суставов. Используя данные в таблице ниже, вычислите точечную оценку относительного риска для достижения облегчения боли, сравнив тех, кто получал новое лекарство, с теми, кто получал стандартное обезболивающее. Затем вычислите 95% доверительный интервал для относительного риска и интерпретируйте свои результаты словами.
Группа лечения
n
# с редуктором
из 3+ точек
Пропорция с уменьшением
из 3+ точек
Новое обезболивающее
50
23
0.46
Стандартное обезболивающее
50
11
0,22
Ответ
C. Доверительные интервалы для отношения шансов
В исследованиях «случай – контроль» невозможно оценить относительный риск, поскольку знаменатели групп воздействия неизвестны при стратегии выборки «случай – контроль».Тем не менее, можно вычислить отношение шансов, которое является аналогичной относительной мерой эффекта. 6 (Более подробное объяснение схемы случай-контроль см. В модуле исследований случай-контроль во Введении в эпидемиологию).
Рассмотрим следующее гипотетическое исследование связи между воздействием пестицидов и раком груди в популяции из 6 647 человек. Если бы данные были доступны по всем субъектам в популяции, распределение заболеваний и воздействия могло бы выглядеть следующим образом:
Больной
Незаболевший
Всего
Воздействие пестицидов
7
1 000
1 007
Без экспонирования
6
5,634
5,640
Если бы у нас были такие данные по всем субъектам, мы бы знали общее количество подвергшихся и не подвергавшихся воздействию субъектов, и в каждой группе воздействия мы бы знали количество больных и здоровых людей, чтобы мы могли рассчитать риск соотношение.В этом случае ОР = (7 / 1,007) / (6 / 5,640) = 6,52, что позволяет предположить, что у тех, кто имел фактор риска (воздействие), риск заболевания в 6,5 раз выше, чем у лиц без фактора риска.
Однако предположим, что исследователи планировали определить статус воздействия, проанализировав образцы крови на концентрацию ДДТ, но у них было достаточно средств только для небольшого пилотного исследования с участием около 80 человек. Проблема, конечно, в том, что результат бывает редким, и если бы они взяли случайную выборку из 80 субъектов, в выборке могло бы не оказаться ни одного больного человека.Чтобы обойти эту проблему, в исследованиях «случай-контроль» используется альтернативная стратегия выборки: исследователи находят адекватную выборку случаев из исходной совокупности и определяют распределение воздействия между этими «случаями». Затем исследователи берут образец здоровых людей, чтобы оценить распределение воздействия в общей популяции. В результате, в гипотетическом сценарии для ДДТ и рака груди исследователи могут попытаться включить все доступные случаи и 67 здоровых субъектов, т.е.е., всего 80, так как это все, что они могут себе позволить. После анализа образцов крови результаты могут выглядеть следующим образом:
Больной
Незаболевший
Воздействие пестицидов
7
10
Без экспонирования
6
57
При таком подходе к выборке мы больше не можем вычислять вероятность заболевания в каждой группе воздействия, потому что мы просто взяли выборку здоровых субъектов, поэтому у нас больше нет знаменателей в последнем столбце.Другими словами, мы не знаем распределения воздействия для всей исходной совокупности. Однако небольшая контрольная выборка здоровых субъектов дает нам возможность оценить распределение воздействия в исходной популяции. Таким образом, мы не можем вычислить вероятность заболевания в каждой группе воздействия, но мы можем вычислить вероятность заболевания у подвергнутых воздействию субъектов и вероятность заболевания у субъектов, не подвергавшихся воздействию.
Вероятность того, что событие произойдет, — это доля случаев, когда вы ожидаете увидеть это событие во многих испытаниях.Вероятности всегда находятся в диапазоне от 0 до 1. Шансы определяются как вероятность того, что событие произойдет, деленная на вероятность того, что событие не произойдет.
Если вероятность наступления события равна Y, то вероятность того, что событие не произойдет, равна 1-Y. (Пример: если вероятность события равна 0,80 (80%), то вероятность того, что событие не произойдет, составляет 1-0,80 = 0,20 или 20%.
Шансы события представляют собой отношение (вероятность того, что событие произойдет) / (вероятность того, что событие не произойдет).Это можно выразить следующим образом:
Вероятность события = Y / (1-Y)
Итак, в этом примере, если вероятность наступления события = 0,80, то шансы равны 0,80 / (1-0,80) = 0,80 / 0,20 = 4 (т.е. 4 к 1).
- Если скаковая лошадь пробежит 100 скачек и выиграет 25 раз и проиграет остальные 75 раз, вероятность выигрыша составляет 25/100 = 0,25 или 25%, но шансы на победу лошади составляют 25/75 = 0,333 или 1 победа. до 3 поражений.
- Если лошадь пробежит 100 скачек и выиграет 5 и проиграет остальные 95 раз, вероятность победы равна 0.05 или 5%, а вероятность выигрыша лошади составляет 5/95 = 0,0526.
- Если лошадь пробежит 100 скачек и выиграет 50, вероятность выигрыша составляет 50/100 = 0,50 или 50%, а шансы на победу равны 50/50 = 1 (равные шансы).
- Если лошадь пробежит 100 скачек и выиграет 80, вероятность выигрыша составит 80/100 = 0,80 или 80%, а шансы на победу будут равны 80/20 = 4 к 1.
ПРИМЕЧАНИЕ, когда вероятность мала, шансы и вероятность очень похожи.
С дизайном случай-контроль мы не можем вычислить вероятность заболевания в каждой из групп воздействия; следовательно, мы не можем вычислить относительный риск.Однако мы можем вычислить шансы заболевания в каждой из групп воздействия, и мы можем сравнить их, вычислив отношение шансов. В гипотетическом исследовании пестицидов отношение шансов составляет
.ИЛИ = (7/10) / (5/57) = 6,65
Обратите внимание, что это отношение шансов очень близко к ОР, которое было бы получено, если бы была проанализирована вся исходная совокупность. Объяснение этому состоит в том, что если изучаемый результат является довольно необычным, то вероятность заболевания в группе воздействия будет аналогична вероятности заболевания в группе воздействия.Следовательно, отношение шансов обеспечивает относительную меру эффекта для исследований случай-контроль и дает оценку отношения рисков в исходной популяции при условии, что интересующий результат является необычным.
Мы подчеркнули, что в исследованиях случай-контроль единственной мерой ассоциации, которую можно рассчитать, является отношение шансов. Однако в исследованиях когортного типа, которые определяются следующими группами воздействия для сравнения частоты исхода, можно рассчитать как отношение рисков, так и отношение шансов.
Если мы произвольно помечаем ячейки в таблице непредвиденных обстоятельств следующим образом:
Больной
Незаболевший
Открытые
а
б
Без экспонирования
с
д
, то отношение шансов вычисляется путем взятия отношения шансов, где шансы в каждой группе вычисляются следующим образом:
ИЛИ = (a / b) / (c / d)
Как и в случае с коэффициентом риска, в знаменателе принято помещать шансы неэкспонированной группы.Кроме того, как и отношение рисков, отношения шансов не подчиняются нормальному распределению, поэтому мы используем преобразование лог, чтобы обеспечить нормальность. В результате процедура вычисления доверительного интервала для отношения шансов представляет собой двухэтапную процедуру, в которой мы сначала генерируем доверительный интервал для Ln (OR), а затем берем антилогарифмический диапазон верхнего и нижнего пределов доверительного интервала для Ln. (OR) для определения верхнего и нижнего пределов доверительного интервала для OR. Эти два шага подробно описаны ниже.
Вычисление доверительного интервала для отношения шансов
Для вычисления доверительного интервала отношения шансов используйте формулу
- Вычислите доверительный интервал для Ln (OR), используя приведенное выше уравнение.
- Вычислите доверительный интервал для ИЛИ, найдя антилогарифм результата на шаге 1, то есть exp (нижний предел), exp (верхний предел).
Нулевое или нулевое значение доверительного интервала для отношения шансов равно единице.Если 95% доверительный интервал для отношения шансов не включает его, то считается, что шансы статистически значимо различаются. Мы снова пересматриваем предыдущие примеры и производим оценки отношения шансов и сравниваем их с нашими оценками различий рисков и относительных рисков.
Пример:
Еще раз рассмотрим гипотетическое пилотное исследование воздействия пестицидов и рака груди:
Больной
Незаболевший
Воздействие пестицидов
7
10
Без экспонирования
6
57
Выше мы отметили, что
ИЛИ = (7/10) / (5/57) = 6.6
Мы можем вычислить 95% доверительный интервал для этого отношения шансов следующим образом:
Подставив получаем:
Это дает следующий интервал (0,61, 3,18), но его все еще необходимо преобразовать, найдя их антилогарифм (1,85–23,94), чтобы получить 95% доверительный интервал.
Интерпретация: Вероятность рака груди у женщин с высоким уровнем воздействия ДДТ в 6,65 раза выше, чем вероятность рака груди у женщин без высокого воздействия ДДТ.Мы на 95% уверены, что истинное отношение шансов составляет от 1,85 до 23,94. Нулевое значение равно 1, и, поскольку этот доверительный интервал не включает 1, результат указывает на статистически значимую разницу в шансах заболеть раком груди у женщин с низким уровнем воздействия ДДТ.
Обратите внимание, что отношение шансов является хорошей оценкой отношения рисков, когда результат возникает относительно нечасто (<10%). Следовательно, отношения шансов обычно интерпретируются как отношения рисков.
Отметим также, что, хотя этот результат считается статистически значимым, доверительный интервал очень широк, поскольку размер выборки невелик.В результате точечная оценка неточна. Также обратите внимание, что доверительный интервал асимметричен, то есть точечная оценка OR = 6,65 не находится в точном центре доверительного интервала. Помните, что мы использовали преобразование журнала для вычисления доверительного интервала, потому что отношение шансов не имеет нормального распределения. Следовательно, доверительный интервал является асимметричным, потому что мы использовали преобразование журнала для вычисления Ln (OR), а затем взяли антилогарифмический диапазон для вычисления нижнего и верхнего пределов доверительного интервала для отношения шансов.
Помните, что в истинном исследовании случай-контроль можно рассчитать отношение шансов, но не отношение рисков. Однако можно рассчитать разницу рисков (RD), отношение рисков (RR) или отношение шансов (OR) в когортных исследованиях и рандомизированных клинических испытаниях. Снова рассмотрим данные в таблице ниже рандомизированного исследования, оценивающего эффективность недавно разработанного обезболивающего по сравнению со стандартом лечения. Помните, что в предыдущем вопросе в этом модуле вы просили вас вычислить балльную оценку разницы в пропорциях пациентов, сообщающих о клинически значимом уменьшении боли между обезболивающими как (0.46-0,22) = 0,24, или 24%, а 95% доверительный интервал для разницы рисков составил (6%, 42%). Поскольку 95% доверительный интервал для разницы рисков не содержал нуля (нулевое значение), мы пришли к выводу, что существует статистически значимая разница между обезболивающими. Затем, используя те же данные, мы сгенерировали точечную оценку отношения рисков и нашли RR = 0,46 / 0,22 = 2,09 и 95% доверительный интервал (1,14, 3,82). Поскольку этот доверительный интервал не включал 1, мы еще раз пришли к выводу, что это различие было статистически значимым.Теперь мы будем использовать эти данные для создания точечной оценки и оценки 95% доверительного интервала для отношения шансов.
Теперь мы просим вас использовать эти данные для расчета шансов облегчения боли в каждой группе, отношения шансов для пациентов, получающих новое обезболивающее, по сравнению с пациентами, получающими стандартное обезболивающее, и 95% доверительного интервала для отношения шансов.
Группа лечения
n
# с редуктором
из 3+ точек
Пропорция с уменьшением
из 3+ точек
Новое обезболивающее
50
23
0.46
Стандартное обезболивающее
50
11
0,22
Ответ
Когда дизайн исследования позволяет рассчитать относительный риск, это предпочтительный показатель, поскольку он гораздо более интерпретируемый, чем отношение шансов.Однако отношение шансов чрезвычайно важно, так как это единственная мера эффекта, которую можно вычислить в дизайне исследования случай-контроль. Когда интересующий результат относительно редок (<10%), тогда отношение шансов и относительный риск будут очень близкими по величине. В таком случае исследователи часто интерпретируют отношение шансов как относительный риск (т.е.как сравнение рисков, а не сравнение шансов, что менее интуитивно).
Этот модуль сосредоточен на формулах для оценки различных неизвестных параметров популяции.В каждом приложении случайная выборка или две независимые случайные выборки были отобраны из целевой совокупности, и была создана статистика выборки (например, размеры выборки, средние значения и стандартные отклонения или размеры и пропорции выборки). Точечные оценки — это наилучшие однозначные оценки неизвестного параметра совокупности. Поскольку они могут варьироваться от образца к образцу, большинство исследований начинается с точечной оценки с учетом погрешности. Предел погрешности количественно определяет изменчивость выборки и включает значение из распределения Z или t, отражающее выбранный уровень достоверности, а также стандартную ошибку точечной оценки.Важно помнить, что доверительный интервал содержит диапазон вероятных значений неизвестного параметра совокупности; диапазон значений параметра совокупности, согласующихся с данными. Также возможно, хотя вероятность мала, что доверительный интервал не содержит истинного параметра совокупности. Это важно помнить при интерпретации интервалов. Доверительные интервалы также очень полезны для сравнения средних или пропорций и могут использоваться для оценки наличия статистически значимой разницы.Это зависит от того, включает ли доверительный интервал нулевое значение (например, 0 для разницы средних, разницы средних и разницы рисков или 1 для относительного риска и отношения шансов).
Точность доверительного интервала определяется пределом погрешности (или шириной интервала). Большая погрешность (более широкий интервал) указывает на менее точную оценку. Например, предположим, что мы оцениваем относительный риск осложнений от экспериментальной процедуры по сравнению со стандартной процедурой, равной 5.7. Эта оценка показывает, что пациенты, перенесшие новую процедуру, в 5,7 раз чаще страдают осложнениями. Предположим, что 95% доверительный интервал равен (0,4, 12,6). Доверительный интервал предполагает, что относительный риск может составлять от 0,4 до 12,6, и, поскольку он включает 1, мы не можем сделать вывод, что существует статистически значимо повышенный риск с новой процедурой. Предположим, в том же исследовании была получена оценка относительного риска 2,1 с 95% доверительным интервалом (1.5, 2.8). Это второе исследование показывает, что пациенты, перенесшие новую процедуру, в 2,1 раза чаще страдают осложнениями. Однако, поскольку доверительный интервал здесь не содержит нулевого значения 1, мы можем сделать вывод, что это статистически повышенный риск. Мы обсудим эту идею статистической значимости более подробно в главе 7.
Следующая сводка предоставляет ключевые формулы для оценок доверительного интервала в различных ситуациях.
- Доверительный интервал для среднего (μ) по одной выборке
Для n > 30 используйте z-таблицу с этим уравнением:
Для n <30 используйте t-таблицу со степенями свободы (df) = n-1
- Доверительный интервал для разности средних (μ1-μ2) из двух независимых выборок
Если n 1 > 30 и n 2 > 30, используйте z-таблицу с этим уравнением:
Если n 1 <30 или n 2 <30, используйте t-таблицу со степенями свободы = n 1 + n 2 -2.
Как для больших, так и для малых выборок Sp — это объединенная оценка общего стандартного отклонения (при условии, что дисперсии в популяциях схожи), вычисленного как средневзвешенное значение стандартных отклонений в выборках.
- Доверительный интервал для разницы в непрерывном исходе (μd) с двумя подобранными или парными выборками
Если n> 30, используйте z-таблицу для стандартного нормального распределения
Если n <30, использовать t-таблицу со степенями свободы (df) = n-1
- Доверительный интервал для доли из одной выборки (p) с дихотомическим исходом
- Доверительный интервал для разницы рисков (RD), рассчитанный по двум независимым выборкам
- Доверительный интервал для отношения риска (ОР) или коэффициента распространенности по двум независимым выборкам
RR = p 1 / p 2
Затем возьмите exp [нижний предел Ln (RR)] и exp [верхний предел Ln (RR)], чтобы получить нижний и верхний пределы доверительного интервала для RR.
- Доверительный интервал для отношения шансов (OR)
Затем возьмите exp [нижний предел Ln (OR)] и exp [верхний предел Ln (OR)], чтобы получить нижний и верхний пределы доверительного интервала для OR.
Обратите внимание, что эта сводная таблица содержит формулы только для больших выборок. Как отмечалось в модулях, для небольших выборок необходимо использовать альтернативные формулы.
- Ньюкомб Р.Г. Двусторонние доверительные интервалы для одной пропорции: сравнение семи методов. Статистика в медицине 1998; 17 (8): 857-872.
- StatXact версии 7 © 2006 Cytel, Inc., Кембридж, Массачусетс.
- Д’Агостино Р. Б., Салливан Л. М. и Байзер A: Вводная прикладная биостатистика. Белмонт, Калифорния: Даксбери-Брукс / Коул; 2004
- Роснер Б. Основы биостатистики . Бельмонт, Калифорния: Даксбери-Брукс / Коул; 2006.
- Agresti A. Категориальный анализ данных 2 nd ed ., New York: John Wiley & Sons, 2002.
- Rothman KJ and Greenland S. Modern Epidemiology 2 nd ed., Philadelphia. Издательство Липпинкотт-Рэйвен, 1998 г.
Ответ на первые вопросы на стр. 3
Каков доверительный интервал 90% для ИМТ? (Обратите внимание, что Z = 1,645, чтобы отразить уровень достоверности 90%.)
Итак, 90% доверительный интервал (126,77, 127,83)
================================================= ======
Ответ на проблему ИМТ на стр. 3
Вопрос: Используя подвыборку в таблице выше, каков 90% доверительный интервал для ИМТ?
Решение: И снова размер выборки был 10, поэтому мы переходим к t-таблице и используем строку с 10 минус 1 степенями свободы (то есть 9 степеней свободы).Но теперь вам нужен доверительный интервал 90%, поэтому вы должны использовать столбец с двусторонней вероятностью 0,10. Посмотрев вниз на строку с 9 степенями свободы, вы получите значение t 1,833.
Вы снова будете использовать это уравнение:
Подставляя значения для этой задачи, мы получаем следующее выражение:
Следовательно, 90% доверительный интервал находится в диапазоне от 25,46 до 29,06.
================================================= ======
Ответ на проблему внизу страницы 4
В таблице ниже, взятой из 5-го исследования когорты потомства Фрамингема, показано количество мужчин и женщин с сердечно-сосудистыми заболеваниями (ССЗ) или без них.Оцените распространенность ССЗ у мужчин, используя доверительный интервал 95%.
Без CVD
Превалирующая CVD
Итого
Мужчины
1,548
244
1,792
Женщины
1872
135
2 007
Итого
3,420
379
3,799
Распространенность сердечно-сосудистых заболеваний (ССЗ) среди мужчин составляет 244/1792 = 0.1362. Размер выборки большой и удовлетворяет требованию, согласно которому количество успешных попыток должно быть больше 5, а количество неудач больше 5. Таким образом, следующая формула может быть использована снова.
Подставляя, получаем
Итак, 95% доверительный интервал равен (0,120, 0,152).
С достоверностью 95% распространенность сердечно-сосудистых заболеваний у мужчин составляет от 12,0 до 15,2%.
================================================= ======
Ответ на вопрос о доверительном интервале для разницы рисков на стр. 7
Балльная оценка разницы в пропорциях: (0.46-0,22) = 0,24. Обратите внимание, что новая лечебная группа — это группа 1, а стандартная лечебная группа — это группа 2. Таким образом, на 24% больше пациентов сообщили о значительном уменьшении боли с помощью нового препарата по сравнению со стандартным обезболивающим. Поскольку в каждой группе более 5 событий (обезболивание) и не событий (отсутствие обезболивания), можно использовать формулу большой выборки с использованием z-показателя.
Подставляя получаем
Это еще больше упрощается до
Итак, 96% доверительный интервал для этой разницы рисков равен (0.06, 0,42).
Интерпретация: По нашим оценкам, обезболивание с новым лечением увеличится на 24%, а с достоверностью 95% разница в риске составляет от 6% до 42%. Поскольку 95% доверительный интервал не содержит нулевого значения 0, мы можем сделать вывод, что есть статистически значимое улучшение с новым лечением.
================================================= ======
Ответ на вопрос об доверительном интервале для относительного риска — стр. 8
Еще раз рассмотрим рандомизированное исследование, в котором оценивалась эффективность недавно разработанного обезболивающего для пациентов после операции по замене суставов.Используя данные в таблице ниже, вычислите точечную оценку относительного риска для достижения облегчения боли, сравнив тех, кто получал новое лекарство, с теми, кто получал стандартное обезболивающее. Затем вычислите 95% доверительный интервал для относительного риска и интерпретируйте свои результаты словами.
Группа лечения
n
# с редуктором
из 3+ точек
Пропорция с уменьшением
из 3+ точек
Новое обезболивающее
50
23
0.46
Стандартное обезболивающее
50
11
0,22
Точечная оценка относительного риска
Пациенты, получающие новое лекарство, в 2,09 раза чаще сообщают о значительном уменьшении боли по сравнению с пациентами, получавшими стандартное обезболивающее.Оценка 95% доверительного интервала может быть вычислена в два этапа следующим образом:
Это доверительный интервал для ln (RR). Чтобы вычислить верхний и нижний пределы доверительного интервала для RR, мы должны найти антилогарифм, используя функцию (exp):
Таким образом, мы на 95% уверены, что пациенты, получающие новое обезболивающее, в 1,14–3,82 раза чаще сообщают о значительном уменьшении боли по сравнению с пациентами, получающими стандартное обезболивающее.
===========================================
Ответ на проблему отношения шансов на странице 10
Теперь мы просим вас использовать эти данные для расчета шансов облегчения боли в каждой группе, отношения шансов для пациентов, получающих новое обезболивающее, по сравнению с пациентами, получающими стандартное обезболивающее, и 95% доверительного интервала для отношения шансов.
Группа лечения
n
# с редуктором
из 3+ точек
Пропорция с уменьшением
из 3+ точек
Новое обезболивающее
50
23
0.46
Стандартное обезболивающее
50
11
0,22
Эту проблему легче решить, если информация организована в таблице непредвиденных обстоятельств следующим образом:
Обезболивающее 3+
Меньше помощи
Новый препарат
23
27
Стандартное лекарство
11
39
Шансы на облегчение боли 3+ с новым препаратом = 23/27 0.8519
Шансы облегчения боли 3+ стандартным препаратом = 11/39 = 0,2821
Соотношение шансов = 0,8519 / 0,2821 = 3,02
Чтобы вычислить 95% доверительный интервал для отношения шансов, мы используем
Подставляя получаем
Поскольку мы использовали журнал (Ln), теперь нам нужно взять антилогарифм, чтобы получить пределы конфиденциального интервала.
Точечная оценка отношения шансов OR = 3.2, и мы на 95% уверены, что истинное отношение шансов находится между 1,27 и 7,21. Это статистически значимо, поскольку 95% доверительный интервал не включает нулевое значение (OR = 1,0).
Отметим также, что коэффициент вероятности был больше, чем коэффициент риска для той же проблемы. По математическим причинам отношение шансов склонно преувеличивать партнеров, когда результат более распространен.
Ответ на проблему с обезболивающими — страница 8
Еще раз рассмотрим рандомизированное исследование, в котором оценивалась эффективность недавно разработанного обезболивающего для пациентов после операции по замене суставов.Используя данные в таблице ниже, вычислите точечную оценку относительного риска для достижения облегчения боли, сравнив тех, кто получал новое лекарство, с теми, кто получал стандартное обезболивающее. Затем вычислите 95% доверительный интервал для относительного риска и интерпретируйте свои результаты словами.
Группа лечения
n
# с редуктором
из 3+ точек
Пропорция с уменьшением
из 3+ точек
Новое обезболивающее
50
23
0.46
Стандартное обезболивающее
50
11
0,22
Доверительный интервал для среднего
Доверительный интервал в среднем
Автор (ы)
Дэвид М.переулокПомогите поддержать этот бесплатный сайт, купив свои книги на Amazon по одной из этих ссылок:
Naked Statistics: Stripping the Dread from the Data
Статистика, 4-е издание
Статистика для чайников (для чайников (образ жизни))Предварительные требования
Области При нормальном распределении, выборка Распределение среднего, Введение к оценке, введение до доверительных интерваловЦели обучения
- Используйте калькулятор обратного нормального распределения, чтобы найти значение z использовать для доверительного интервала
- Вычислить доверительный интервал среднего значения, когда σ равно известно
- Определите, использовать ли t-распределение или нормальное распределение
- Вычислить доверительный интервал для среднего значения при оценке σ
Просмотр мультимедийной версии
Когда вы вычисляете уверенность интервал от среднего, вы вычисляете среднее значение выборки, чтобы оценить среднее значение населения.Очевидно, если вы уже знали среднее значение для генеральной совокупности, доверительный интервал не нужен. Однако, чтобы объяснить, как строятся доверительные интервалы, мы будем работать в обратном направлении и начнем с предположения характеристик населения. Затем мы покажем, как можно использовать образцы данных. используется для построения доверительного интервала.
Предположим, что веса 10-летних детей обычно распределяются со средним значением 90 и стандартным отклонением из 36.Каково выборочное распределение среднего для выборки размер 9? Напомним из раздела о выборочном распределении среднего значения выборки распределение — μ, а стандартное ошибка среднего
Для данного примера выборочное распределение среднего имеет среднее значение 90 и стандартное отклонение 36/3 = 12. Обратите внимание, что стандартное отклонение выборочного распределения это стандартная ошибка.На рисунке 1 показано это распределение. Затененный площадь представляет собой средние 95% распределения и простирается с 66,48 до 113,52. Эти пределы были вычислены путем сложения и вычитая 1,96 стандартного отклонения из среднего значения 90 как следует:
90 — (1,96) (12) = 66,48
90 + (1,96) (12) = 113,52Значение 1,96 основано на том факте, что 95% области нормального распределения находится в пределах 1.96 стандартных отклонений среднего; 12 — стандартная ошибка среднего.
Рисунок 1. Выборочное распределение среднее значение для N = 9. Средние 95% распределения — это заштрихованные.
Рисунок 1 показывает, что 95% средств больше не используются. чем на 23,52 единицы (1,96 стандартного отклонения) от среднего значения 90.Теперь рассмотрим вероятность того, что среднее значение выборки вычислено в случайной выборке находится в пределах 23,52 единиц от среднего значения генеральной совокупности из 90. Поскольку 95% распределения находится в пределах 23,52 от 90, вероятность того, что среднее значение по любой данной выборке будет в пределах 23,52 от 90 составляет 0,95. Это означает, что если мы неоднократно вычислить среднее значение (M) из выборки и создать интервал ранжирования от M — 23,52 до M + 23,52, этот интервал будет содержать популяцию означают 95% случаев.В общем, вы вычисляете 95% доверительный интервал для среднего значения по следующей формуле:
Нижний предел = M — Z .95 σ M
Верхний предел = M + Z .95 σ M
, где Z .95 — номер стандарта. требуются отклонения от среднего нормального распределения содержать 0,95 площади и σ M стандартная ошибка среднего.
Если вы внимательно посмотрите на эту формулу уверенности интервале, вы заметите, что вам нужно знать стандартное отклонение (σ) чтобы оценить среднее значение. Это может показаться нереальным, и Это. Однако вычисление доверительного интервала, когда σ равно знать легче, чем когда нужно оценить σ, и служит педагогическая цель. Позже в этом разделе мы покажем, как для вычисления доверительного интервала для среднего, когда σ имеет быть оцененным.
Предположим, что были выбраны следующие пять чисел из нормального распределения со стандартным отклонением 2,5: 2, 3, 5, 6 и 9. Чтобы вычислить доверительный интервал 95%, запустите путем вычисления среднего и стандартной ошибки:
M = (2 + 3 + 5 + 6 + 9) / 5 = 5.
σ M = = 1.118.
Z .95 можно найти с помощью обычного калькулятор распределения и указав, что заштрихованная область равно 0.95 и указав, что вы хотите, чтобы область находилась между точки отсечки. Как показано на рисунке 2, значение составляет 1,96. Если бы ты хотел чтобы вычислить доверительный интервал 99%, вы должны установить заштрихованная область до 0,99, и результат будет 2,58.Рисунок 2. 95% площади находится между -1,96 и 1,96.
Нормальный Калькулятор распределения
Доверительный интервал может быть вычислен следующим образом:
Нижний предел = 5 — (1.96) (1,118) = 2,81
Верхний предел = 5 + (1,96) (1,118) = 7,19Вы должны использовать t распространение, а не нормальное распределение, когда дисперсия неизвестна и должна быть оценена из выборочных данных. Когда размер выборки большой, скажем, 100 или выше, t-распределение очень похоже на стандартное нормальное распределение. Однако при меньшем размере выборки t распределение лептокуртическое, что означает, что у него относительно больше очков в хвосте, чем у него нормальное распределение.В результате вам нужно расширять от среднего, чтобы содержать заданную долю площади. Отзывать что при нормальном распределении 95% распределения находится в пределах 1,96 стандартного отклонения среднего. Используя t-распределение, если у вас размер выборки всего 5, 95% площади находится в пределах 2,78 стандартного отклонения среднего. Поэтому стандарт ошибка среднего будет умножена на 2,78, а не на 1.96.
Значения t, которые будут использоваться в доверительном интервале можно посмотреть в таблице распределения t. Маленькая версия такой таблицы приведена в таблице 1. Первый столбец df означает для степеней свободы и для доверительных интервалов в среднем, df равно N — 1, где N — размер выборки.
Таблица 1. Сокращенная таблица t.
df 0.95 0,99 2 4,303 9,925 3 3,182 5.841 4 2,776 4,604 5 2,571 4,032 8 2.306 3,355 10 2,228 3,169 20 2,086 2.845 50 2,009 2,678 100 1,984 2.626 Вы также можете использовать «обратный t Распределение «калькулятор, чтобы найти значения t для использования в доверительных интервалах. Вы узнаете больше о t-распределении в следующем разделе.
Предположим, что выбраны следующие пять чисел. из нормального распределения: 2, 3, 5, 6 и 9 и что стандартное отклонение не известно.Первые шаги — вычислить образец среднее и дисперсия:
M = 5
с 2 = 7,5Следующим шагом является оценка стандартной ошибки среднего. Если мы знали дисперсию населения, мы могли бы использовать следующие формула:
Вместо этого мы вычисляем оценку стандартной ошибки (s M ):
= 1,225Следующий шаг — найти значение t.В виде из таблицы 1 видно, что значение 95% -ного интервала для df = N — 1 = 4 равно 2,776. Затем вычисляется доверительный интервал. так же, как и при σ M . Единственный Отличия в том, что s M и t скорее чем σ M и Z.
Нижний предел = 5 — (2,776) (1,225) = 1,60
Верхний предел = 5 + (2,776) (1,225) = 8,40В более общем плане формула 95% достоверности интервал в среднем:
Нижний предел = M — (t CL ) (s M )
Верхний предел = M + (t CL ) (s M )где M — выборочное среднее, т CL t для желаемого уровня достоверности (0.95 в приведенном выше примере), и s M — оцененная стандартная ошибка. среднего.
Закончим разбором Струпа Данные. В частности, мы вычислим доверительный интервал по среднему баллу разницы. Напомним, что 47 субъектов назвали цвет чернил, которыми были написаны слова. Названия противоречили друг другу чтобы, например, они назвали цвет чернил слова «синий» написано красными чернилами.В правильный ответ — сказать «красный» и игнорировать факт что слово «синий». Во втором случае испытуемые называли цвет чернил цветных прямоугольников.
Таблица 2. Время отклика в секундах для 10 испытуемых.
Именование цветного прямоугольника Вмешательство Разница 17 38 21 год 15 58 43 год 18 35 год 17 20 39 19 18 33 15 20 32 12 20 45 25 19 52 33 17 31 год 14 21 год 29 8 Таблица 2 показывает разницу во времени между интерференцией. и условия цветового обозначения 10 из 47 испытуемых.Среднее разница во времени для всех 47 испытуемых составляет 16,362 секунды, а стандартное отклонение составляет 7,470 секунды. Стандартная ошибка среднее — 1,090. Таблица t показывает критическое значение t для 47 — 1 = 46 степеней свободы составляет 2,013 (для 95% доверительного интервала). Поэтому уверенность интервал вычисляется следующим образом:
Нижний предел = 16,362 — (2,013) (1,090) = 14,17
Верхний предел = 16.362 + (2,013) (1,090) = 18,56Следовательно, интерференционный эффект (разность) для всего население, вероятно, будет между 14,168 и 18,555 секунд.
Обязательно поместите файл данных в каталог по умолчанию.
Файл данныхdata = read.csv (file = «stroop.csv»)
data $ diff = data $ interfer-data $ colors
t.test (data $ diff)
[1] 14.16842 18.55498
attr (, «conf.level»)
[1] 0.95Пожалуйста, ответьте на вопросы:
отзыв1.3.5.2. Пределы уверенности для среднего
1. Исследовательский анализ данных
1.3. Методы EDA
1.3.5. Количественные методы
1.3.5.2.
Пределы уверенности для среднего
Назначение:
Интервальная оценка среднегоПределы уверенности для среднего (Снедекор и Кокран, 1989 г.) являются интервальной оценкой для иметь в виду.Интервальные оценки часто желательны, потому что оценка среднего варьируется от образца к образцу. Вместо единственная оценка среднего, доверительный интервал генерирует нижний и верхний предел среднего. Интервал оценка дает представление о степени неопределенности в нашей оценке истинного среднего. Чем уже интервал, тем точнее наша оценка. Пределы уверенности выражаются в единицах уверенности. коэффициент.Хотя выбор коэффициента уверенности несколько произвольно, на практике интервалы 90%, 95% и 99% часто используются, причем наиболее часто используются 95%.
В качестве технического примечания 95% доверительный интервал составляет , а не . означают, что существует 95% вероятность того, что интервал содержит истинное среднее. Интервал, вычисленный из заданного образец либо содержит истинное среднее значение, либо его нет. Вместо, уровень доверия связан с методом вычисление интервала.Коэффициент достоверности просто пропорция образцов заданного размера, которая может ожидается, что он будет содержать истинное среднее значение. То есть на 95% доверительный интервал, если собрано много образцов и рассчитан доверительный интервал, в конечном итоге около 95% из них интервалы будут содержать истинное среднее значение.
Определение: доверительный интервал Пределы уверенности определяются как: - \ [\ bar {Y} \ pm t_ {1 — \ alpha / 2, \, N-1} \, \, \ frac {s} {\ sqrt {N}} \]
Из формулы видно, что ширина интервала контролируется двумя факторами:
- По мере увеличения N интервал сужается от
в
\ (\ sqrt {N} \) срок.
То есть один из способов получить более точные оценки для среднее — увеличить размер выборки.
- Чем больше стандартное отклонение выборки, тем больше доверительный интервал.Это просто означает эти зашумленные данные, т. е. данные с большим стандартом отклонение, будут генерировать более широкие интервалы, чем данные с меньшим стандартным отклонением.
Определение: проверка гипотез Чтобы проверить, имеет ли среднее значение генеральной совокупности конкретное значение, \ (\ mu_ {0} \), против двусторонней альтернативы, что она не имеет значения \ (\ mu_ {0} \), доверительный интервал преобразуется в форму проверки гипотез.Испытание представляет собой одноэлементное испытание t и определяется как: H 0 : \ (\ mu = \ mu_ {0} \) H a : \ (\ му \ neq \ му_ {0} \) Статистика теста: \ (T = (\ bar {Y} — \ mu_ {0}) / (s / \ sqrt {N}) \)
где \ (\ bar {Y} \), N и s определены выше.Уровень значимости: α . Наиболее часто используемое значение для α составляет 0,05. Критический регион: Отвергните нулевую гипотезу о том, что среднее значение является заданным. стоимость, \ (\ mu_ {0} \), если - \ (Т <т _ {\ альфа / 2, \, N-1} \)
- \ (Т> t_ {1 — \ alpha / 2, \, N-1} \)
Пример доверительного интервала Мы создали 95% двусторонний доверительный интервал для ZARR13.DAT набор данных на основе следующей информации. N = 195 СРЕДНЕЕ = 9,261460 СТАНДАРТНОЕ ОТКЛОНЕНИЕ = 0,022789 т 1-0,025, N -1 = 1,9723 НИЖНИЙ ПРЕДЕЛ = 9,261460 - 1,9723 * 0,022789 / √195
Таким образом, 95% доверительный интервал для среднего составляет (9,258242, 9,264679).
ВЕРХНИЙ ПРЕДЕЛ = 9,261460 + 1,9723 * 0,022789 / √195Пример t-теста Мы провели двухстороннее однопроходное испытание t с использованием ZARR13.Набор данных DAT для проверки нулевой гипотезы о том, что среднее значение генеральной совокупности равно 5. H 0 : μ = 5 H a : μ ≠ 5 Статистика теста: T = 2611,284 Степени свободы: ν = 194 Уровень значимости: α = 0,05 Критическое значение: t 1- α /2, ν = 1,9723 Критическая область: Отклонить H 0 если | T | > 1,9723
Мы отвергаем нулевые гипотезы для нашего двустороннего t -теста, потому что абсолютное значение тестовой статистики больше критического стоимость.Если бы мы выполняли верхний односторонний тест, критический значение будет t 1- α, ν = 1,6527, и мы все равно отвергнет нулевую гипотезу.
Доверительный интервал является альтернативой проверке гипотез. Если доверительный интервал содержит 5, то H 0 не может быть отклонен. В нашем примере доверительный интервал (9,258242, 9,264679) не соответствует содержат 5, что означает, что среднее значение генеральной совокупности не равно 5 на 0,05 уровень значимости.
В общем, есть три возможных альтернативных гипотезы и Области отбраковки для одновыборочного т -теста:
Альтернативная гипотеза Область отклонения H a : μ ≠ μ 0 | T | > т 1- α /2, ν H a : μ> μ 0 T > t 1- α, ν H a : μ 0 T t α, ν Области отклонения для трех возможных альтернативных гипотез с использованием данные нашего примера показаны на следующих графиках.
вопросов Пределы достоверности среднего могут использоваться для ответа на следующие вопросы. вопросов: - Какая разумная оценка среднего?
- Насколько вариативны оценки среднего?
- Соответствует ли заданное целевое значение доверительной вероятности? пределы?
Связанные методы Двухвыборка т -Тест Доверительные интервалы для других оценщиков местоположения, таких как медиана или среднее значение, как правило, являются математически сложными или трудноразрешимый.Для этих случаев доверительные интервалы могут можно получить с помощью бутстрапа.
Пример использования Данные теплового расходомера. Программное обеспечение Пределы достоверности для среднего и однократного теста t составляют: доступны практически во всех статистических программное обеспечение. Оба кода Dataplot и код R можно использовать для генерации анализы в этом разделе.Эти скрипты используют Файл данных ZARR13.DAT. Доверительный интервал — обзор
Формула Клоппера – Пирсона дает более консервативное значение, когда наблюдаются очень низкие значения (вставка 15.3 D.N.A.). В настоящее время подход Клоппера-Пирсона поддерживается в руководствах по мтДНК SWGDAM 2013 (SWGDAM 2013) и SWGDAM Y-STR 2014 (SWGDAM 2014).
D.N.A. ВСТАВКА 15.395% ИНТЕРВАЛЫ УВЕРЕННОСТИ ВЕРХНЕЙ ГРАНИЦЫ С ИСПОЛЬЗОВАНИЕМ НОРМАЛЬНЫХ ПОДХОДОВ И ПОДХОДОВ КЛОППЕРА – ПИРСОНА
Источники: Clopper, C.J., & amp; Пирсон, Э. (1934). Использование доверительных или реперных пределов, проиллюстрированных в случае бинома. Биометрика, 26, 404–413; Холланд, M.M., & amp; Парсонс, Т. (1999). Анализ последовательности митохондриальной ДНК — проверка и использование в судебной медицине. Forensic Science Review, 11, 21–50; Уилсон, Э. (1927). Вероятный вывод, закон последовательности и статистический вывод. Журнал Американской статистической ассоциации, 22 , 209–212; HaploCALc_1.0 Таблица Excel любезно предоставлена Стивеном П. Майерсом, Министерство юстиции Калифорнии; http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval и http://en.wikipedia.org/wiki/Confidence_interval.Если гаплотип Y-STR (или последовательность мтДНК) не обнаружен в базе данных размера N, 95% доверительный интервал равен. Это значение очень близко к 3 / N, которое использовалось в D.N.A. Вставка 15.2 пример расчетов. Верхнюю границу 95% доверительного интервала можно установить для частоты профиля, используя:
, где частота ( p ) определяется из количества наблюдений ( x ) в базе данных, содержащей N профилей.Этот «нормальный» интервал аппроксимации является самой простой формулой для расчета и широко используется (см. Holland & amp; Parsons, 1999; Tully et al. 2001), но, как известно, создает проблемы в ситуациях с небольшими размерами выборки или очень небольшим количеством наблюдений.
Формула Клоппера – Пирсона, названная в честь авторов статьи, описывающей ее в 1934 году, обеспечивает более консервативное значение для доверительных интервалов, когда в базе данных гаплотипов наблюдаются очень низкие значения. Формула для верхнего 95% доверительного предела с использованием Clopper-Pearson:
, где N = размер базы данных, x = количество наблюдений гаплотипа в базе данных, k = 0, 1, 2, 3… x наблюдения, и p = частота гаплотипа, при которой ожидается, что x или меньше наблюдений будут происходить в 5% случаев.Эта кумулятивная формула биномиального распределения решена для p с помощью последовательной литературы и, следовательно, требует использования компьютерной программы. В приведенных ниже примерах использовалась таблица Excel от Стивена Майерса (Министерство юстиции Калифорнии).
Значения счета Частота Нормальный Клоппер-Пирсон (см. Блок ДНК 15.2) p = x / N % уверенность95% доверительный интервал YHRD 9 локусов: 634 /125148 0.507% 0,540% 0,541% YHRD 12 локусов: 52 /83280 0,0624% 0,0767% 0,0787% US Y-STR 17 локусов: 2 2 2 23169 0,00863% 0,0187% 0,0272% Обратите внимание, что при большом количестве наблюдений, например 634 из 125 148 в базе данных, почти нет разницы между нормальным подходом и подходом Клоппера – Пирсона. .Однако нормальный метод менее консервативен (т.е. обеспечивает более редкую частоту), когда частота гаплотипа низкая, например, 2 из 23 169 (0,0187% против 0,0272%). Хотя есть различия в этих расчетах, повторная оценка методом Клоппера – Пирсона не изменит внезапно отчетный результат на порядки величины или, вероятно, существенно не изменит результат отчета.
В марте 2010 г. база данных Y-STR США изменила расчет 95% доверительного интервала на метод Клоппера – Пирсона.YHRD также рассчитывает доверительные интервалы с использованием метода Клоппера-Пирсона. EMPOP использует подход Уилсона (Wilson 1927), который дает результат, аналогичный методу Клоппера – Пирсона, для расчета 95% доверительных интервалов.
Доверительный интервал
Статистики используют доверительный интервал для описания степени неопределенности связанный с выборочной оценкой совокупности параметр.
Как интерпретировать доверительные интервалы
Предположим, что 90% доверительный интервал утверждает, что среднее значение по совокупности больше 100 и меньше 200.Как бы вы интерпретировали это утверждение?
Некоторые думают, что с вероятностью 90% Среднее значение популяции находится между 100 и 200. Это неверно. Как и любое население параметр, среднее значение по совокупности является константой, а не случайная переменная. Это не меняется. В вероятность того, что константа попадает в любой заданный диапазон всегда 0,00 или 1,00.
уровень уверенности описывает неопределенность, связанную с с методом отбора проб . Предположим, мы использовали тот же метод выборки, чтобы выбрать разные выборки и для вычисления другой интервальной оценки для каждого образца.Некоторые интервальные оценки будут включать истинное население параметр, а некоторые нет. Уровень достоверности 90% означает что мы ожидаем, что 90% интервальных оценок будут включать показатель численности населения; уровень достоверности 95% означает, что 95% интервалов будут включать параметр; и так далее.
Требования к данным доверительного интервала
Чтобы выразить доверительный интервал, вам понадобятся три части Информация.
Учитывая эти входные данные, диапазон доверительного интервала составляет определяется статистикой выборки + Погрешность .И неопределенность, связанная с доверительный интервал определяется доверительным уровнем.
Часто предел погрешности не указывается; вы должны рассчитать это. Ранее мы описывали как вычислить погрешность.
Как построить доверительный интервал
Есть четыре шага для построения доверительного интервала.
- Определите образец статистики. Выберите статистику (например, среднее значение выборки, пропорция выборки), которые вы будете использовать для оценить параметр популяции.
- Выберите уровень достоверности. Как мы отметили в предыдущем разделе, уровень достоверности описывает неопределенность выборки метод. Часто исследователи выбирают уверенность 90%, 95% или 99%. уровни; но можно использовать любой процент.
- Найдите погрешность. Если вы работаете над домашним заданием
проблема или тестовый вопрос, может быть указана погрешность.
Однако часто вам необходимо вычислить погрешность,
на основе одного из следующих уравнений.
Предел погрешности = Критическое значение * Стандартное отклонение статистики
Предел погрешности = Критическое значение * Стандартная ошибка статистики
Для руководства см. как вычислить погрешность. - Укажите доверительный интервал. Неопределенность обозначается
по уровню уверенности. И диапазон уверенности
интервал определяется следующим уравнением.
Доверительный интервал = образец статистики + Допустимая погрешность
В примере задачи в следующем разделе применяются четыре вышеуказанных шага. для построения 95% доверительного интервала для среднего балла. Следующий несколько уроков обсуждают эту тему более подробно.
Калькулятор размера выборки
Как вы уже догадались, четыре шага, необходимые для определения достоверности interval может включать в себя множество трудоемких вычислений.Stat Trek’s Калькулятор размера выборки сделает эту работу за вас — быстро, легко и безошибочный. Помимо построения доверительного интервала, калькулятор создает сводный отчет, в котором перечислены основные результаты и аналитическая документация. техники. Всякий раз, когда вам нужно построить доверительный интервал, рассмотрите с помощью калькулятора размера выборки. В калькулятор бесплатный. Его можно найти в Stat Trek. главное меню на вкладке Stat Tools. Или вы можете нажать кнопку ниже.
Калькулятор размера выборкиПроверьте свое понимание
Задача 1
Предположим, мы хотим оценить средний вес взрослого мужчины в Округ Декалб, Джорджия.Мы выбираем случайную выборку из 1000 мужчин из население 1000000 человек и взвесьте их. Мы находим, что средний человек в нашей выборке весит 180 фунтов, и стандартное отклонение образец — 30 фунтов. Что такое 95% доверительный интервал.
(A) 180 + 1,86
(B) 180 + 3,0
(C) 180 + 5,88
(D) 180 + 30
(E) Ничего из вышеперечисленногоРешение
Правильный ответ (А). Чтобы указать доверительный интервал, работаем через четыре шага ниже.
- Определите образец статистики. Поскольку мы пытаемся оценить средний вес в популяции, выбираем средний вес в нашей выборке (180) в качестве выборочной статистики.
- Выберите уровень достоверности. В этом случае уровень достоверности определяется для нас в задаче. Мы работаем с 95% уровень уверенности.
- Найдите погрешность. Ранее мы описывали
как вычислить погрешность.
Ключевые шаги показаны ниже.
- Найдите стандартную ошибку.Стандартная ошибка (SE)
Среднее значение:
SE = s / sqrt (n)
SE = 30 / sqrt (1000) = 30 / 31,62 = 0,95
- Найдите критическое значение. Критическое значение — это коэффициент, используемый для
вычислить погрешность. Чтобы выразить критическую ценность
как
t оценка
(t *), выполните следующие действия.
- Вычислить альфа (α):
α = 1 — (уровень достоверности / 100) = 0,05
- Найти критическую вероятность (p *):
p * = 1 — α / 2 = 1 — 0,05 / 2 = 0,975
- Найдите
степени свободы (df):
df = n — 1 = 1000-1 = 999
- Критическое значение статистика t, имеющая 999 степеней свободы и совокупная вероятность равно 0.975. t Калькулятор распределения, мы находим, что критическое значение составляет 1,96.
- Вычислить альфа (α):
- Найдите стандартную ошибку.Стандартная ошибка (SE)
Среднее значение: