Проводя статистическое исследование, необходимо учитывать, что никакой закономерности может и не быть.
Проводя научный эксперимент, мы анализируем полученную информацию, чтобы иметь возможность выбирать между гипотезами.
К примеру, если вы полагаете, что природа должна вести себя в данной
ситуации таким-то образом, и проводите эксперимент, чтобы это доказать
или опровергнуть, вы ведь хотите иметь возможность заявить, что
экспериментальные данные подтверждают вашу гипотезу, а не чью-либо еще.
Иными словами, мы ожидаем, что данные докажут ту, а не иную зависимость
результатов эксперимента от переменных. В большинстве случаев не
существует единственного «чистого» эксперимента, так что нам приходится
многократно повторять измерения, чтобы получить гарантию достоверности
результата. Поэтому мы часто нуждаемся в статистическом анализе
полученной информации. Часто оказывается, что результат зависит от
множества факторов. В этом случае нам необходимо отделить главные из
них от второстепенных — зерно от шелухи.
Например, когда ученый хочет найти связь между курением и раком
легких, ему не достаточно найти одного курильщика, получившего (или не
получившего) рак легких. Должен быть собран и проанализирован
значительный объем данных, прежде чем этот ученый сможет утверждать,
что между курением и раком легких существует зависимость.
В исследованиях такого рода нулевая гипотеза играет ключевую роль.
Нулевая гипотеза — это, по сути, предположение, что результата —
конечной цели любого исследования — не существует. И как бы далеко ни
зашли ваши поиски взаимосвязи между курением и раком легких, нулевая
гипотеза будет утверждать, что никакой такой взаимосвязи не существует.
Встает вопрос, в какой момент собранных данных станет достаточно, чтобы
отвергнуть это утверждение.
Если говорить о курении и раке легких, то нулевая гипотеза была
исключена уже давно: ни один уважающий себя ученый не прибегнет к ней
сейчас. Но было время, когда просто-напросто не хватало данных, чтобы
ее исключить; и исследователи не могли доказать, что заболеваемость
раком легких среди курящих и некурящих людей не была лишь делом случая.
Только имея большой массив данных и тем самым сводя возможность
случайного результата к минимуму, можно исключить нулевую гипотезу.
В нашем примере приходилось накапливать большое количество данных — ученые скажут «большую выборку», —
чтобы исключить нулевую гипотезу. Но может быть и по-другому. Например,
Тихо Браге, чья многолетняя работа привела к созданию законов Кеплера
о планетарном движении, просто проводил наиболее точные измерения,
которых оказалось достаточно, чтобы отвергнуть нулевую гипотезу и
убедиться в верности результата.
Итак, когда вы в следующий раз будете читать работу, в которой
утверждается о наличие корреляции между заболеванием и его
предполагаемой причиной, спросите себя, действительно ли исследователи
рассмотрели достаточное количество случаев, прежде чем исключить
нулевую гипотезу.