Условия статистической значимости различий в простейшем двух-выборочном «поперечном» когортном исследовании с редкими событиями. Связь с распределением Фишера–Снедекора

Научная статья
DOI:
https://doi.org/10.60797/BMED.2026.8.2
EDN:
JKBAFA
Предложена:
04.12.2025
Принята:
03.03.2026
Опубликована:
26.03.2026
Выпуск: № 1 (8), 2026
Правообладатель: авторы. Лицензия: Attribution 4.0 International (CC BY 4.0)
12
1
XML
PDF

Аннотация

Для проведения «поперечного» эпидемиологического исследования редкой профессиональной заболеваемости с использованием четырехпольных таблиц сопряженности были определены условия статистической значимости различий в сравниваемых группах работников. Обнаружено, что статистически значимый рост заболеваемости в экспонированной группе при соответствующем планировании исследования может быть выявлен при любом количестве редких наблюдений, за исключением нулевого. Надежная регистрация данных возможна даже при отсутствии «случаев» в контрольной группе.

С целью повышения инструментальной точности оценки вероятностных показателей предлагается применение байесовской процедуры оценки в сочетании с использованием непрерывных распределений, сопряженных с распределениями Пуассона. Данное усовершенствование обусловлено необходимостью устранения противоречия между непрерывностью величин показателей заболеваемости и дискретностью наблюдаемых данных, характерного для традиционных методов анализа таблиц сопряженности. Внедрение предложенного подхода позволяет получить более точные оценки и минимизировать их смещение.

Установлено, что отношение неизвестных величин относительной заболеваемости (HR) в исследуемой и контрольной группах может рассматриваться как случайная величина, подчиняющаяся распределению Фишера–Снедекора. Последнее хорошо изучено в теории вероятностей, имеет подробные таблицы и является удобным для проведения вычислений. В частности, так называемое байесовское p-значение является полным функциональным аналогом p-значения Фишера при исследовании редких событий. Благодаря указанным свойствам предложенная методика может быть продуктивной для ретроспективного расследования профессиональных заболеваний на предприятиях Российской Федерации.

1. Введение

Распространенной эпидемиологической мерой связи «фактор – эффект» является отношение показателей риска (hazard ratio,

formula
). Такая метрика применяется при сравнении интенсивностей возникновения проблем со здоровьем в двух независимых группах за короткий период наблюдения при «поперечном» исследовании. Ближайший аналог показателя
formula
— это относительный риск таблиц сопряженности 2×2. Однако, в отличие от классических таблиц сопряжённости, определяется он не отношением величин исследуемых вероятностей, а отношением годовых показателей интенсивности наступления специфических событий в исследуемой группе
к аналогичному показателю
той же проблемы со здоровьем в референтной группе. Следуя принципу частотной статистики «...learning by experience...» («учиться на опыте»,
), традиционно центральное значение показателя
оценивается непосредственно в соответствии со сложившейся практикой
как отношение точечных частотных оценок

formula
(1)

где операндами являются результаты наблюдений, структура которых представлена в таблице 1.

Таблица 1 - Структура результатов наблюдения при «поперечном» однофакторном исследовании заболеваемости

Случаи заболевания

Человеко-годы наблюдения

​Экспонированная группа

(фактор риска есть)

​m1

​ A1

Интактная группа

(фактора риска нет)

​m0

​A0

При этом интенсивность в каждой возрастной страте определяется как отношение приращения числа «случаев» в ней к приращению человеко-лет наблюдения за некоторый период, достаточно малый настолько, чтобы изменение интенсивности за счет изменения возраста давало бы вклад в

formula
меньший, чем за счёт влияния исследуемого фактора риска
. Период наблюдения при изучении хронических или отдаленных профессиональных заболеваний обычно имеет длительность от 1 до 5 лет, а в качестве возрастной группы выбирают такую, для которой контролируемый эффект от воздействия фактора риска встречается чаще. Такой дизайн производственно-эпидемиологического исследования, с одной стороны, позволяет снизить на него затраты, а с другой стороны может вынужденно приводить к тому, что изучаемые события обнаруживаются в качестве редких случаев, не подчиняющихся законам больших чисел. В случае изучения профзаболеваний ситуация недостаточности объёма исследуемой выборки только усугубляется в силу того, что действующими «Правилами расследования и учёта случаев профессиональных заболеваний работников»
организациям работодателя и Роспотребнадзора выделяется всего три недели на сбор данных и ретроспективное выяснение связи хронического заболевания с возможным фактором риска. За короткий период наблюдения выборочное исследование почти всегда будет иметь низкую статистическую мощность, а изучаемые специфические события в нём будут редкими.

С метрологической точки зрения, для редких событий измеримую случайную интенсивность

formula
measurand») не следует подменять результатом её оценки
formula
, равно как не следует смешивать понятия доопытного изучаемого значения
formula
и его апостериорную оценку
. Более того, особое значение приобретает корректная оценка статистической значимости различий
formula
и
formula
по наблюдаемым редким дискретным событиям
formula
и
formula
. Часто использующееся вероятностное их описание на основе непрерывных нормальных аппроксимаций влечёт большие погрешности, вследствие чего результаты эпидемиологических исследований с малым числом случаев
formula
современными протоколами рандомизированных контролируемых исследований
(в соответствии с правилом Кокрэна) обычно не признаются достаточно надёжными. Например, известный результат сравнения очевидно неоднородных и существенно отличающихся выборок 4/4 против 0/4 с достигнутой априорной оценкой
вероятности их однородности 1/70, (т.е. уровнем значимости гипотезы однородности менее 5%) не следовало бы принимать в качестве количественного обоснования выводов, если пренебречь особенностями статистики редких событий. Поэтому объективно необходима гармонизация процедур в соотнесении дискретного распределения редких отсчётов
formula
и описания априорно ожидаемого непрерывного распределения измеримых интенсивностей
formula
, свойственных поперечному производственно-эпидемиологическому исследованию. И уж во всяком случае требуется отказ от использования традиционных «нормальных» приближений по всякому поводу и без повода, поскольку ни метрика (1), ни традиционные оценки достигнутого уровня значимости различий в выборках
, совершенно не отражают роль действительной формы распределения случайных величин
formula
.

Таким образом, немаловажен вопрос о получении вероятностно-обоснованных непрерывных оценок интенсивности заболеваемости по редким дискретным (однократным) наблюдениям в «поперечном» эпидемиологическом исследовании. Для практики актуален также ответ на сопутствующий вопрос о корректной оценке статистической значимости или незначимости наблюдаемых различий в исследуемой и референсной выборках при их сравнении. Цель статьи в получении ответов на эти вопросы, а также в установлении экстенсивных условий, позволяющих целенаправленно планировать экспертное статистическое исследование при поиске связи хронического заболевания с профессией.

2. Метод исследования

В основу используемого метода должно быть положено понимание принципиальной непрерывности стохастической измеряемой и измеримой непрерывной интенсивности специфических событий

formula
, выступающей в качестве ожидаемой (а значит и неизвестной) причины однократного наблюдения числа случайных реализаций
formula
на базе из
formula
числа человеко-лет наблюдения в наблюдаемой временнόй страте. В связи с этим, известное отношение
formula
не является «определением» интенсивности
formula
. Это всего лишь не самая лучшая выборочная оценка, то есть одна из многих возможных. Найти это множество позволяет понимание того широко известного факта
,
, что число случайных событий
formula
хорошо описывается распределением редких событий распределением Пуассона:

(2)

связывающем неизвестную интенсивность

(как причину) с вероятностями возможных реализаций случайных событий
при многократном повторении. Нас, однако, интересует условное распределение всех возможных оценок величины
formula
при однократной реализации m, которое может быть выражено гамма-распределением (3), которое сопряжено с распределением Пуассона.

(3)

Выражение это является приближенным, но существенно более точным, чем типично используемая нормальная аппроксимация. Согласно теореме Байеса, оно может рассматриваться как распределение возможных апостериорных оценок при условии априорно равномерного ожидания произвольных оценок интенсивности

на положительной полуоси до проведения каких-либо наблюдений. Нетрудно заметить, что типичная оценка
formula
в этом случае является модой гамма-распределения (3) и, в силу заметной асимметрии последнего, не пригодна для обозначения центра всех возможных оценок. Это ясно уже на частном примере нулевого количества событий, поскольку
formula
попадает на край области определения интенсивности при
formula
. Однако, отсутствие «случаев» или их редкость в референсных группах явление достаточно типичное при исследовании профессионального риска, то есть малость величин
– очевидная причина получения смещённых оценок для метрик (1). Их необходимо избегать, отдавая преимущество интервальным, а не точечным оценкам.

Благодаря указанному переосмыслению процедуры оценки интенсивностей, величина hazard ratio (

) должна рассматриваться как новая случайная величина, равная отношению случайных величин
с известными независимыми распределениями. Следуя правилам преобразования распределения вероятностей
, можно найти плотность распределения вероятности (ПРВ) для отношения
:

(4)

или

formula
(5)

где

гамма-функции целочисленных аргументов. Непосредственное сравнение закона (5) с публикацией
позволяет утверждать, что отношение двух гамма-распределенных величин точно подчиняется трехпараметрическому одномерному распределению Фишера-Снедекора, которое хорошо изучено и для которого существуют подробные статистические таблицы. Более того, у ПРВ (5) известна кумулятивная функция распределения (КФР):

(6)

где

,
неполная регуляризованная бета-функция Эйлера. Заметим, что в классической теории вероятности распределение Фишера-Снедекора исторически появляется как результат оценки распределения двух независимых случайных величин типа хи-квадрат, поэтому параметры найденной функции (6) имеют несколько иной вид, значения и порядок следования, чем параметры традиционной кумулятивной КФР Фишера. Природа этого расхождения и сходства точно такая же, как у КФР пары распределений хи-квадрат и гамма.

Практическое исчисление по формуле (6) имеет ощутимые удобства, связанные не только с тем, что она лучше соответствует математической природе «поперечных» эпидемиологических исследований, но также и с тем, что неполная бета-функция хорошо табулирована в популярных вычислительных пакетах программ: MathCAD, Mathematica, MatLab и в языковых библиотеках R, Python. Прямое вычисление неполной бета-функции вместе с обратной ей функцией есть даже в электронных таблицах Excel, например, БЕТА.РАСП(0,5;5;1;1) = 0.03125. То есть вычисление

и её квантилей не представляет в современных условиях каких-либо трудностей, а значит, нет никаких серьёзных вычислительных затрат по оценке положения вероятностного центра отношения
(медианы) на числовой оси, доверительного интервала этой оценки и достигнутого уровня статистической значимости найденных различий интенсивности заболеваемости в двух сравниваемых выборках. В частности, если проверяется гипотеза о наличии повышенного риска
в экспонированной группе по сравнению с референсной, для имеющихся наблюдений нетрудно найти вероятность наступления альтернативных событий
:

(7)

при условии

. Величина
в этом случае имеет смысл так называемого байесовского p-value
. Определение несколько отличается от смысла традиционных p-значений из теорий Карла Пирсона, Роберта Фишера и Пирсона – Неймана, поскольку при выводе (7) не использовалось искусственное понятие «нулевой гипотезы». Искусственность последнего очевидна, поскольку для непрерывного распределения (5) соответствующая вероятность
тождественно обращается в ноль. Тем не менее, если величина
в формуле (7) достаточно мала (меньше порога принятия решения 0.05), её можно использовать в качестве меры достигнутого уровня статистической значимости различий.

3. Пример применения

Чтобы убедиться в продуктивности изложенного подхода к оценке редких наблюдений в эпидемиологических исследованиях, рассмотрим результат исследования влияния экспозиции малыми концентрациями дисульфида углерода (сероуглерод) на рабочих местах на интенсивность заболеваемости ишемической болезнью сердца (ИБС)

. Ситуация с воздействием
особенно интересна тем, что может наблюдаться определенная конкуренция между этим внешним химическим фактором и возрастным фактором возникновения спонтанной ИБС так, что рост заболеваемости при увеличении возраста может сочетаться с одновременным снижением hazard ratio в разных возрастных стратах от
7.05 в группе контактировавших с сероуглеродом от 1 до 3 лет до
0.62 в группе со стажем контакта от 13 до 15 лет. Публикация
интересна для нас по той причине, что её автор Маркку Нурминен один из довольно известных эпидемиологов авторов нескольких методик улучшенной оценки p-значений на основе нормального и пуассоновского законов распределения. Однако это обстоятельство не помогло ему обнаружить статистическую значимость отличий заболеваемости в экспонированных и интактных группах работников. На самом же деле, по крайней мере, для одной пары из пяти рассмотренных возрастных групп, при сравнении страт 7/1021 против 1/1029 по формуле (7) можно найти условную вероятность альтернативы
= 0.019 < 0.05, то есть отличия в заболеваемости были на самом деле статистически значимы (неслучайны). А используя квантили функции (5) можно найти и центральную оценку (медиану), и доверительный интервал:
4.60 (95% CI: 1.08 – 34.80). При этом видно, что точечная оценка Нурминена оказалась почти вдвое завышена (смещена) относительно вероятностного центра распределения всех возможных оценок. Ясно также, что трудности с оценкой p-value были связаны исключительно с редкостью наблюдений случаев в стратах. Например, если бы сопоставлялись страты 70/10210 против 10/10290, можно было бы получить
при практическом сохранении отношения интенсивностей. Таким образом, преимущества рассмотренной методики оценки наблюдений могут быть обнаружены для действительно редких событий и даже для ситуации с нулём случаев в референсной группе, когда метрика (1) заведомо непригодна.

4. Результаты определения условий статистической значимости различий для таблиц 2×2

Величина p-значения в выражении (6) зависит от трёх параметров отсчётов

и отношения
. Это обстоятельство позволяет определить необходимую величину
для любого наперед заданного порога принятия решения о достижении статистической значимости различий заболеваемости для любой пары отсчётов «случаев», а для этих же условий и величину достигнутого отношения заболеваемости
. Результаты такого анализа приведены в таблице 2.

Таблица 2 - Условия достижимости статистической значимости различий заболеваемости для таблиц с редкими событиями

m1

m0

​0

​1

​2

​3

​4

​5

​10

​0

-

0,288/8,38

0,583/6,60

0,897/5,89​

1,22/5,22​

1,24/5,29​

3,20/4,81​

​1

0,026/15,9​

0,157/6,39​

0,331/4,81​

0,521/4,20​

0,719/3,87​

0,920/3,67​

1,95/3,25​

​2

0,017/15,1​

0,108,5,80​

0,233/4,28​

0,372/3,69​

0,518/3,37​

0,668/3,18​

1,44/2,77​

​3

0,013/14,7​

0,083/5,53​

0,181/4,03​

0,291/3,44​

0,407/3,13​

0,527/2,93​

1,15/2,53​

​4

0,010/14,4​

0,067/5,36​

0,148/3,88​

0,239/3,29​

0,336/2,98​

0,436/2,79​

0,958/2,38​

​5

0,0086/14,3​

0,056/5,25​

0,125/3,77​

0,203/3,19

0,286/2,88​

0,372/2,69​

0,824/2,28​

​10

0,0047/13,9​

0,031/5,01​

0,071/3,54​

0,116/2,96​

0,165/2,65​

0,216/2,46​

0,488/2,05​

Примечание: числитель дроби в каждой ячейке таблицы указывает на максимально допустимое отношение числа человеко-лет наблюдения A1/A0 в таблице 2×2, необходимое для достижения границы принятия решения на уровне значимости различий интенсивностей 0.05; знаменатель дроби указывает на минимально возможное отношение интенсивностей заболеваемости, которое можно идентифицировать с уровнем значимости не хуже 0.05 при условии превышения заболеваемости в экспонированной группе; верхняя строка таблицы содержит отсчёты m1 в экспонированной группе; левый столбец содержит отсчёты m0

На основании таблице 2 могут быть сделаны следующие выводы:

1. При любом количестве редких наблюдений заболеваемости, кроме

, существуют условия, при которых может регистрироваться её статистически значимый рост в экспонированной группе.

2. Надёжная регистрация факта повышения заболеваемости возможна даже в том случае, когда в интактной нет ни одного случая болезни. Однако и тогда hazard ratio не обращается в бесконечность, как этого можно было ожидать на основании точечной оценки (1).

3. При наблюдении редких случаев заболевания невозможно идентифицировать статистически значимый рост заболеваемости менее, чем в 2–2,5 раза, то есть невозможно статистически обнаружить влияние вредных факторов, которые характеризовались бы малой или средней силой связи с состоянием здоровья.

Закономерен вопрос, каким образом в подобных исследованиях некоторым эпидемиологам удаётся обнаружить относительные риски на уровне 1,6 (Уайлд и др., 1995

), когда в группе шахтёров по добыче поташа смертность от ишемической болезни сердца была выше среди работающих под землёй по сравнению с работающими на поверхности, или же на уровне 1,6 по частоте астмы у медицинских работников, регулярно использующих на рабочем месте защитные перчатки из порошкового латекса
? Однако публикации
,
уже выходят за рамки простых однофакторных поперечных исследований, поскольку учитывают продолжительность внешнего воздействия факторов и многофакторный характер заболеваний вместе с применением регрессионных моделей, что позволяет принять в анализ существенно большее общее количество случаев заболеваний за счёт расширения и усложнения таблицы сопряженности за пределы размера 2×2. Важно только, чтобы темп увеличения количества страт на стадии дизайна рос медленнее темпа увеличения количества охватываемых случаев, чтобы число последних в отдельных стратах не устремлялось к нулю. Если такой контроль статистического исследования отсутствует, то оценка величины эффекта и оценка факторных трендов может оказаться сильно смещённой и даже недостоверной, как это не раз наблюдалось в работах
,
,
,
, когда общее число страт многократно превосходило общее число «случаев».

5. Обсуждение

Прежде всего, отметим, что с технико-вычислительной точки зрения расчеты по формулам (3, 5, 6, 7) оказались не сложнее традиционного использования формул нормального распределения или распределения хи-квадрат, свойственных сложившимся методам оценки таблиц 2×2.

Однако несомненно и то, что рассмотренная в статье методология многим практикующим эпидемиологам может показаться чрезмерной или претенциозной, несмотря на известные и уже упоминавшиеся недостатки подходов Карла Пирсона, Рональда Фишера, Фрэнка Йейтса и Джозефа Берксона, связанные с необходимостью следовать правилу Кокрэна и искусственно согласовывать математический аппарат описания непрерывных оценок с дискретной природой наблюдений путем введения поправок на непрерывность. Иными словами, чтобы избежать сомнений в преимуществах предлагаемого метода, следует обратить внимание на то, что традиционные методы анализа таблиц сопряженности с 1900 года рассматриваются как прямые методы оценки, не являясь ими. Ряд современных авторов до сих пор утверждает подобное

,
,
без тени сомнения. На самом же деле, идентификация заранее неизвестных параметров или трендов через наблюдаемые величины совершенно другой статистической природы это исключительно косвенные методы идентификации или обратная задача. Косвенный характер ясно виден уже на стадии записи результатов наблюдений в таблицу, поскольку измеряется объективно существующая количественно непрерывная стохастическая величина заболеваемости через случайные реализации дискретных отсчётов так же, как причина измеряется через следствия всегда с некоторой неопределенностью. В нашей работе эта связь явно прописывается в математической модели байесовского распределения (3). С этой точки зрения изложенный метод следует считать не менее точным, как и «точный» перестановочный тест Фишера «exact permutation Fisher test»
. Нужно, однако, понимать, что последний ограничен только консервативной оценкой достигнутого уровня статистической значимости и игнорирует само измерение отношения заболеваемостей. Он нуждается в коррекции на непрерывность, а точным называется только благодаря тому, что не использует аппроксимаций распределения наблюдений.

Доверительные интервалы, определяемые по квантилям КФР (6) в силу байесовской природы ПРВ (3) следует рассматривать в качестве «credible interval» в отличие от оценок «confidence interval» Пирсона. Кроме того, в классических методах анализа таблиц сопряженности центральным положением теории выступало понятие «нулевой гипотезы», в рамках которой расчеты проводились на основе ненаблюдаемого (гипотетического) «нулевого» распределения. Поэтому тесты Пирсона и Фишера фактически являлись тестами проверки однородности двух выборок в таблице сопряженности. В отличие от этого, мы оцениваем значимость расхождения в показателях заболеваемости, поскольку оперируем условными распределениями без использования гипотезы о совпадении. Заметим, что традиционная статистика Пирсона и Фишера избегает явного употребления понятия условной вероятности, несмотря на то, что привязка выводов к гипотетическому понятию «нулевой гипотезы» тоже операция при заданном условии. Наиболее определённо эта идейная установка была выражена Фишером: «...обратная вероятность является ошибкой (возможно единственной ошибкой, которой посвятил себя математический мир)...»

,
. Иными словами, Фишер никогда не рассматривал анализ таблиц сопряженности как обратную задачу идентификации объекта.

Тем не менее, можно показать, что байесовское p-value является естественным количественным аналогом величины p-value Фишера, несмотря на методологические и смысловые различия двух показателей, по крайней мере, для простейшего «поперечного» эпидемиологического исследования, допускающего строгую трактовку отсчётов «случаев» в качестве пуассоновских случайных величин. Чтобы показать это, рассмотрим ранее процитированный пример Нурминена

, где сопоставляются две выборки: 7/1021 против 1/1029. При этом для упрощения математических выкладок ограничимся частным случаем
, мало отличающимся от исходных данных. Тогда переменная
в формуле (7) точно обращается в 1/2. Используя известное рекуррентное тождество
, нетрудно показать, что для наблюдений Нурминена

(8)

где

и
полная бета-функция и число сочетаний из
по
. Таким образом, эту вероятность можно рассматривать как сумму вероятностей потенциального наблюдения конкурирующих случайных таблиц сопряженности, что полностью соответствует протоколам CONSORT-2025, где p-значение представляет собой вероятность того, что наблюдаемая таблица (и её более экстремальные возможные варианты) могли возникнуть случайно, если заболеваемость в выборках на самом деле не различалась («The p-value represents the probability that the observed data (or a more extreme result) could have arisen by chance when the interventions did not truly differ»,
) – при условии сохранения маржинальной суммы случаев для возможных реализаций
с условием
. Процедура (8) отличается от одностороннего точного перестановочного теста
только тем, что Фишер фиксирует маржинальные распределения по строкам и столбцам одновременно, что вызывает в дальнейшем необходимость в перенормировке вероятности. Для «поперечного» исследования такой необходимости нет, и вероятности (8) вычисляются напрямую. Это эквивалентно применению «mid-p» теста Ланкастера
, который построен так же, как и «точный» тест Фишера, но с исправлением консервативности и с корректным введением поправки на непрерывность, отличающейся от многими критикуемой методологии поправок Йейтса. Более того, для достаточно больших (почти бесконечных) сравниваемых выборок половина p-value Фишера, mid-p и байесовское p-value (7) совпадают численно, несколько отличаясь только по смыслу и технике вычисления.

Определенный интерес представляет также сравнение байесовского метода оценивания показателей заболеваемости и их отношения с приближённым score-методом, восходящим к оценкам Вальда

. В основу последнего изначально положено предположение о том, что и показатели заболеваемости, и отношение показателей подчиняются логнормальным распределениям. Это приводит к центральной оценке (1) для
и оценке положения краев доверительного интервала в виде

(9)

где

соответствующий квантиль нормального распределения (1,96 для 95% номинального вероятностного покрытия). Практика показала, что это довольно удобная формула, лучше которой работают только некоторые аппроксимации Нурминена Миттинена и Ньюкома
. Формула (9) не опирается на понятие «нулевой гипотезы», следовательно, она тоже приближается по технике вычисления к байесовскому подходу. Однако, распределение Фишера-Снедекора на самом деле совершенно не совпадает с лог-нормальным распределением. Они по-разному определяют медиану, имеют разное асимптотическое поведение на краях распределения. А для редких отсчётов
формула (9) просто неработоспособна в отличие от универсальной зависимости (6) для «поперечных» выборок.

6. Заключение

Таким образом, для целей «поперечного» эпидемиологического исследования возможной статистической связи профессиональной заболеваемости с единственным производственным фактором предложена байесовская процедура оценки значимости увеличения интенсивности редких событий повышенной заболеваемости на фоне некоторой спонтанной или нулевой заболеваемости при сравнении групп работников. С точки зрения количественного анализа, процедура может быть отнесена к классу «точных», наподобие известного точного перестановочного теста Фишера. Показано, что в описанных условиях все потенциально возможные оценки отношения заболеваемости в группах сравнения подчиняются распределению Фишера-Снедекора, что позволяет уверенно оценивать степень надёжности или ненадёжности окончательных выводов. Предложенная методика статистической оценки редких событий может быть использована для ретроспективного расследования случаев профессиональных заболеваний работников, предусмотренного Правилами

, действующими в Российской Федерации с 1 марта 2023 года.

Метрика статьи

Просмотров:12
Скачиваний:1
Просмотры
Всего:
Просмотров:12