Статьи

Словарь

О журнале

Soulmaths

Вокруг центральной предельной теоремы

Часть Первая:
Муавр, Лаплас и Гальтон

Определение

Центральная предельная теорема – группа утверждений теории вероятностей, описывающих условия, при которых случайная величина, являющаяся суммой достаточно большого числа слабо зависимых случайных величин, каждая из которых вносит малый вклад в общую сумму, оказывается подчинена одному и тому же – нормальному – закону распределения.

Таким образом, центральная предельная теорема, наряду с законом больших чисел подтверждают некий общий принцип, согласно которому совокупное действие большого числа случайных факторов приводит к возникновению некоторой нормы, почти не зависящей от случая.

Так потребление электричества в каждой отдельно взятой квартире многоквартирного дома является случайной величиной, не зависящей от потребления в остальных квартирах, и может изменяться совершенно непредсказуемо. Однако, общедомовое потребление (если только в какой-то из квартир не заняты майнингом криптовалюты, который, как известно, крайне энергозатратен) будет распределено нормально – то есть мы с большой точностью можем предсказать, каким будет потребление в процентном соотношении:

По вертикали на рисунке будет расположено число квартир в доме, а по горизонтали – количество потребления электроэнергии (где μ – это среднее значение, а σ – средняя вариативность потребления по дому).

Блестящим наглядным подтверждением справедливости центральной предельной теоремы является доска Гальтона – устройство, изобретенное и изготовленное англичанином сэром Френсисом Гальтоном в 1873 году:

биномиальных коэффициентов

Скатывающиеся из верхней части доски горошины (отчего у доски есть и другое название – bean machine, от англ. bean – фасоль, горошина) ударяются о расположенные в шахматном порядке колышки, всякий раз после столкновения отскакивая вправо или влево (в идеале – с одинаковой вероятностью). В нижней части доски находятся контейнеры, число которых равно числу колышков в последнем ряду.

Если обозначить через n общее число столкновений горошин с колышками, а через k – число раз, которое горошина отскочила вправо, то общее число путей, которыми горошина может оказаться в k-м контейнере, равно числу способов, которыми можно выбрать из общего числа k предметов. То есть это число сочетаний, которое, как мы уже знаем
(см. здесь), рассчитывается по формуле

При просыпании большого числа горошин сквозь ряды колышков, они собираются в столбики, высота которых тем больше приближается к форме кривой нормального распределения, чем больше общее число горошин.

Отсюда следует, что вероятность оказаться в k-м контейнере равна

Эта формула, вообще говоря, описывает биномиальный закон распределения случайной величины, но вот доска Гальтона наглядно демонстрирует тот фундаментальный факт, что поведение большого числа случайных величин, имеющих биномиальное распределение, очень хорошо приближается нормальным распределением вероятностей.

Читать о биномиальных коэффифиентах:

Читать

Рационализация вычислений

Чтобы не утруждать себя сложными подсчетами вероятностей, можно воспользоваться также уже хорошо знакомым нам треугольником Паскаля

Этот частный случай центральной предельной теоремы имеет название теоремы Муавра-Лапласа. Впервые об этом факте написал живший в Англии француз Абрахам де Муавр в 1733 году, но его идея сильно обогнала время и была совершенно забыта, пока ее не возродил другой француз – Пьер-Симон Лаплас – почти столетием позже, в 1812 году. Однако, по-настоящему важность и глубина центральной предельной теоремы была оценена лишь после работ русского математика Александра Ляпунова, который только в 1901 году дал строгую формулировку и доказательство ее «предельно» общего случая.

и заметить, что число путей, которыми можно оказаться в среднем контейнере, действителньо максимально.

Комментарий

Тут же будет уместно сказать, что описанная нами доска Гальтона может быть использована не только для наглядной демонстрации справедливости центральной предельной теоремы, то и довольно-таки контринтуитивного статистического феномена, известного как регрессия к среднему, открытого тем же Гальтоном.

Занимаясь вопросами наследственности, Гальтон заметил, что средний рост детей, рожденных от высоких родителей, меньше среднего роста у самих родителей в исследуемой им группе. И то же самое он обнаружил у детей, родители которых имели рост ниже среднего – средний рост детей оказывался выше среднего роста родителей.

Другим распространенным примером того же эффекта является знаменитый психологический эксперимент Дэниела Каннемана с пилотами истребителей израильского авианоссца: их инструкторы были убеджены, что наказания за ошибки более действенны, чем поощрения за безупречную посадку на авианосец, поскольку после наказания пилоты улучшали свои показатели, а после поощрения только ухудшали.

Это явление Гамильтон и назвал регрессией к среднему, поскольку величина отклонения от среднего значения у родителей обнаруживала тенденцию возвращаться (регрессировать) к среднему значению у их потомства.

Однако, и в первом, и во втором примере связь исследуемых явлений не является всецело причинно-следственной: рост детей зависит не только от роста их родителей, а успех или неудача при посадке зависит не только от поведения инструктора – и именно потому, что в эти процессы вмешивается случай, мы и наблюдаем пресловутую регрессию к среднему, которая является сугубо вероятностным феноменом.

Увидеть это и помогает доска Гальтона, которую в данном случае нужно применить дважды, и задать нетривиально «перевернутый» вопрос:

Мы видим, что в этом варианте мы просыпаем горошины через два поля колышков, после чего имеем ситуации А и В. И в том, и в другом случае горошины распределились нормально – в этом пока нет ничего удивительного. НО!

Однако, если мы спросим, откуда! выпали горошины, оказавшиеся сейчас в данном контейнере слева, то ответ будет другой: «В среднем, из тех контейнеров, что ближе к середине» (рис. b). И причина этого очевидна из того же рисунка: горошин, находящихся ближе к середине, попросту больше – и соответственно, вероятность какой-то из них отклониться влево выше вероятности отклониться вправо тем немногим, что находились слева.

Если мы теперь зададимся вопросом «Где в среднем окажутся горошины, выпавшие из левого контейнера?», то ответом будет «В среднем в точности под данным контейнером» (рис. а).

Таким образом, если вам что-то сегодня удалось лучше обычного, будьте готовы к тому, что завтра результаты ухудшатся, и ваши компетенции тут совершенно непричем – просто так устроен мир. Как объект математики.

Написать в чат

Есть вопросы по материалу?

Вы можете задать их в нашем специальном чате. Мы поможем разобраться в теме лучше

Понравилась статья?