Математическая статистика для педосексуалов

Отправлено Кирилл Галабурда от 12.06.2016 - 23:11

Наука всё больше влияет на повседневную жизнь, и математическая статистика не исключение. Проведённый в 1998 году группой Брюса Ринда (прочтение фамилии возможно "Райнд" - ред.) сугубо академический метаанализ исследований жизни студентов, переживших в детстве сексуальное злоупотребление, показывает, что половая жизнь у детей безвредна. Морализаторские теории, будто за плотские грехи расплата придёт после взросления, развенчаны. Право ребёнка на личную, в том числе половую жизнь примиряется с заботой о ребёнке. Политика противопедофильного геноцида лишается оправдания.

Такие далёкие выводы Риндовцы не приветствуют, и никому, кроме педосексуалов, правда не нужна. Важно, чтобы педосексуалы понимали метаанализ в тонкостях, умели нужной цифрой заслониться от инсинуаций моралистов. Это требует определённой математической эрудиции, которую надеюсь донести.

Моя статья содержит неполные сведения из теории вероятностей, на базе которых объясняются самые начала корреляционного анализа и теории нормального распределения. Эти две дисциплины соединяются в идею статистических критериев — здание, содержащее ходы в различные методики проверки гипотез о вредности секса. В число этих методик входит анализ путей, ковариационный анализ и анализ контрастов.

Если мои читатели сумеют излазить это здание метаанализа вдоль и поперёк, они получат убежище, где выдержат осаду моралистов. И пускай нравственность будет уничтожена правдой.

1. Генеральная совокупность

Предмет исследования Риндовцев — это взрослые, пережившие в детстве противоправный (с нынешней точки зрения) секс. Естественно, что таких людей жило и будет жить на Земле, скорее всего, бесконечно много. Все те слезливые телезвёзды, разукрашенные рок-фанатки, дискотечные малолетки, похитители папашиной порнухи, свидетели эксгибициониста, подсматривающие за родителями, хранящие семейную тайну, попавшиеся секс-маньякам, опущенные в колонии для несовершеннолетних, обитатели дальневосточных борделей, фавориты вождей, султанов, поэтов и философов, обращённые в шаманы либо допущенные в племя на условиях испытания членом. А сколькие не дожили до изобретения письменности, сколькие будут ещё после нас и сколькие нам современники. Риндовцам интересно, чтó всех объединяет.

Общепризнано: таких объединяют страдания по взрослении. Будто в совокупности переживших в детстве секс ("генеральной совокупности") какое число N человек ни выбери, число страдающих NA удовлетворит уравнение

NAN = 1.

Этого, всё же, нет. И сами педоборцы признаются, что среди переживших в детстве секс попадаются нестрадающие (вследствие семейной поддержки либо несерьёзности секса, либо стрессоустойчивости, либо неумения психологов распознать страдания). Поэтому левая часть уравнения (называется "частотой страданий при условии пережитого сексуального злоупотребления детьми (СЗД)") ничего не показывает.

Однако показывала бы, если бы выбрать как можно больше людей из генеральной совокупности. Тогда величина частоты приближается к величине

PA|x ≠ 0 ≡ Lim(N → ∞)NAN,

характеризующей не NA отобранных человек, а всю бесконечную генеральную совокупность. Эта величина — "вероятность страданий при условии пережитого СЗД".

Помимо страданий A в жизни произвольновыбранного могут наблюдаться другие события вроде проблем в семье B. Но могут и не наблюдаться. Такие события, которых у произвольновыбранного не предскажешь, именуют "случайными". Вероятность наблюдать у произвольновыбранного два события сразу AB или одно без другого A\B выражаются вероятностями

PAB = PAPB и PA\B = PA−PB, (*)

а вероятность PA|B обнаружить A среди тех, у кого наблюдалось B, называется "вероятностью A при условии B".

Вероятность PA|x≠0 страданий при условии СЗД не то же самое, что вероятность PA страданий. Следует учитывать и вероятность PA|B страданий при условии проблем в семье, также вероятность Px≠0|B СЗД при условии проблем в семье. Судить о генеральной совокупности подвергшихся СЗД можно только так.

Для чего нужно каждого произвольновыбранного оценивать определёнными переменными величинами. Переменная СЗД x = 1 ("независимая"), когда противоправный секс у него в детстве был, и x = 0, когда не было. Переменная страданий y ("зависимая") оценивается по количеству баллов, набранных произвольновыбранным при прохождении психологического теста. Переменная проблемности семьи z ("промежуточная") оценивается по какой-то непрерывной шкале. Значения таких величин являются непредсказуемыми, поэтому равенство переменной какому-либо числу — случайное событие. Такие переменные называют "случайными величинами".

Любую случайную величину χ можно характеризовать вероятностью Pχ ≤ χ′ ≡ Φμ(χ′) непревышения какого-то значения χ′. Такая вероятность является числовой функцией от χ′ и называется "функцией распределения вероятностей". Функция распределения способна зависеть от определённого параметра μ, зная который, можно предсказывать вероятности разных значений χ. Крайне важно знать эти параметры для генеральной совокупности переживших в детстве секс.

Математики подсчитали, что, если переменную χ можно выразить через сумму случайных величин намного меньше χ, то она (переменная) подчиняется "нормальному распределению"

Φμ₁;μ₂(χ′) = −∞χ′dχExp[(χ−μ₁)²(2πμ₂)]/2πμ₂²

(смотри Предельные теоремы). Кривая подынтегральной функции похожа на параболу, только формой не чаша, но колокол. Вероятность нормальнораспределённой величине отклониться от середины "колокола" (равная площади меж осью абсцисс и кривой) на ±2μ₂ меньше 0,05 — событие маловероятное.

Каковы бывают значения μ? Генеральную совокупность характеризует общая тенденция и статистика нарушений тенденции. Когда случайные события совокупности характеризуются случайной величиной χ, это показывается "математическим ожиданием величины χ" и "дисперсией величины χ".

Ожидаемое значение χ — это сумма произведений любого возможного χ′-значения величины χ на вероятность того, что χ примет это значение. Когда величина χ непрерывна, вероятность события

χ′<χχ′+dχ′,

согласно (*), равна Φμ(χ′ + dχ′) − Φμ(χ′), отсюда математические ожидание χ эквивалентно

μχ = −∞[Φμ(χ + dχ) − Φμ(χ)]χ.

Дисперсия χ — это всего лишь ожидаемый квадрат отклонения χ от μχ. Гораздо чаще пользуются корнем √μΔ²χ от дисперсии, называемым "среднеквадратичным отклонением χ от μχ". У дисперсии легковыводимые свойства:

μΔ²χ = μχ² − μ²χ, μΔ²(χ + χ′) = μΔ²χ + μΔ²χ′ и: μΔ²(c·χ) = c²·μΔ²χ. (**)

Для нормальнораспределённой величины выходит, что

μχ = μ₁ и μΔ²χ = μ₂.

Таковы характеристики генеральной совокупности подвергшихся СЗД в детстве, и мы попытаемся их выяснить.

2. Статистический отбор

Математическая статистика — искусство судить о целом по его части. Понятно, что среди когда-либо живших людей, подвергшихся СЗД, мы сможем исследовать не всех. Однако мы способны выбрать из генеральной совокупности N человек ("группа исследования") и сравнить с теми, кто не подвергался СЗД ("контрольная группа").

Становится неясно, как выбрать, чтобы исследуемые соответствовали генеральной совокупности (чтобы "выборка была представительна генеральной совокупности"). Виктимологи ведут статистику жалоб психиатру-психологу и статистику уголовных дел. Эти данные не представительны, и вот почему.

Опровергая фрейдистскую теорию детской сексуальности, моралисты рассказывают, якобы Фрейд изучал на душевнобольных детях. А сексуальности душевнобольных у здоровых детей не бывает. Однако сами педоборцы совершают обличаемую ошибку: пытаются страдания взрослых душевнобольных распространить на всех переживших СЗД, даже здоровых. Клинические выборки не представительны.

Что касается криминальной статистики, то сами педоборцы ею не дорожат. Исследования, показавшие, будто СЗД безвредно, виктимологи не признают из-за того, что секс с ребёнком известен полиции лишь один из тысячи. Никто не спорит, что родительский допрос, оперативно-розыскные мероприятия, судебные слушания, внимание прессы ребёнку причиняют психическую травму. Видя страдания жертвы СЗД, судить о том, кто навредил — педофил или педоборцы — трудно.

В исследовании страданий в результате СЗД ни клинические, ни судебные выборки не годятся. Какие же тогда? Первооткрыватель педофильных отношений в науке Фриц Бернард рассылал приглашения к исследованию — кое-кто пооткликался. Хотя такая выборка не показательна в отношении всех переживших СЗД земляков, исследования последователей вышли представительнее.

Куда грандиознее исследование семи выборок, представительных жертвам СЗД отдельно взятой страны (Испании, Британии, США). Брюс Ринд и Филипп Тромович в 1997 году провели метаанализ таких научных работ, показавшие, что половая жизнь безвредна даже в детстве.

Исследования такого рода, хоть и полезны, всё же трудоёмки. Какому-нибудь профессору либо студенту психфака будет удобнее проводить исследования на первокурсниках. И впрямь, научные работы по сексу в детстве среди студентов являются многочисленными — это крупнейшие неклинические выборки. Что даёт основание считать их представительными.

Противники метаанализа Риндовцев утверждают, якобы студенческая выборка не представительна, поскольку наиболее травмированные в учебные заведения не поступают, а поступают одни стрессоустойчивые либо пережившие нестрашные формы секса, да и вообще страдания после СЗД станут видны только после студенческого возраста. Риндовцы возражают, якобы результат общенациональных и студенческих исследований совпал. Поэтому судить о переживших СЗД по студентам оправданно.

3. Исследование студентов

Отобрали N студентов к исследованию СЗД — что дальше? Спрашиваем у каждого в исследуемой группе, имелся ли в детстве противоправный секс (каждый исследователь под этим понимает разное). Кодируем ответы как x = 0, если нет, x = 1, если да ;— получается N результатов:

x₁,x₂,..,xn,..,xN.

Каждому студенту даём психологические тесты — получается какое-то количество y баллов по шкале выраженности того либо другого психопатологического симптома:

y₁,y₂,..,yn,..,yN.

Можем оценить и в какой студенты воспитывались обстановке:

z₁,z₂,..,zn,..,zN.

Что делать с этими данными? Чтобы судить о выборке по её общей тенденции, достаточно знать N − 1 значений, чьё количество — "число степеней свободы". Это значит, что при соблюдении тенденции только N − 1 данных свободны в своих значениях.

Тенденция выражается средним арифметическим ‹x› или ‹y›. Это сумма всех xn или yn, умноженных на какой-то множитель-"вес". Если выискивается среднее на каждого студента, весом является 1N, если среднее на каждую степень свободы — 1(N − 1).

Согласно закону Больших чисел, чем объёмнее выборка, тем ближе среднее к ожидаемому:

Lim (N → ∞)‹x› = μx или Lim (N → ∞)‹y› = μy.

Дисперсия может быть равна только среднему на степень свободы квадрату отклонения от ожидания — но не среднему на студента квадрату отклонения от ожидания.

Посчитали среднее с дисперсиями — что дальше? Как выяснить, насколько вероятно страдать после секса в детстве? Связи между переменными x и y выражаются "коэффициентами корреляции". В метаанализе Ринда популярнее всего коэффициенты Пирсона:

r = ‹ΔxΔy›(√‹Δ²x›‹Δ²y›).

Видно, коэффициент не может превышать 1, и такое значение говорит о том, что x коррелирует с y так же хорошо, как и с самим собой (каждому значению x соответствует лишь одно значение y, что возможно только при линейной функции). r ≈ 0 значило бы, что одна переменная варьирует намного сильнее другой (‹Δy› ≈ 0 ⇒ ‹Δy› ≪ ‹Δx›), то есть, на варьирование переменной страданий варьирование переменной СЗД не влияет — связи между СЗД и страданиями нет. А вот если бы при варьировании независимой переменной зависимая чаще всего ниже среднего (‹Δy› = ‹y − μy› < 0), корреляция вышла бы отрицательной — словно СЗД полезно.

Исследования на студентах показывают r = −0,25…+0,40. Корреляции секс-страдания вышли невысокими, в большинстве случаев пренебрежимо малыми. По слову Брюса Ринда и Филиппа Тромовича, "если проблемы со здоровьем наблюдаются у двух контрольных из ста, среди переживших СЗД это три из ста" (2005).

Если коэффициент корреляции взять в квадрате, получится величина ("коэффициент детерминации"),

r² = ‹ΔxΔy›2(‹Δ²x›‹Δ²y›),

показывающая, чтó остаётся от всей вариации переменных без вариации каждой в отдельности. Коэффициенты детерминации показали, что страдания по взрослении в 9 раз теснее связаны с проблемами в семье, чем с половой жизнью.

4. Исследование исследований

Перед Риндовцами предстали более 54 исследований СЗД на студентах. Авторы каждого смогли проверить около полутысячи студентов, однако все вместе научные работы содержат статистику по 35703. Океаны данных, которые следует обобщить.

В каждом k-том исследовании приводятся Jk коэффициентов корреляции, проверенных для разных категорий студентов, или для разных симптомов, или для разных способов оценки выраженности симптома:

r11, .., r1j₁ .., rk1, .., rkjk, .., rkJk, .., r541, .., r54j₅₉, .., r54J₅₉.

Эти разрозненные данные следует усреднить. Но как? Франц Хилес объясняет: "коэффициент корреляции r не является интервальной переменной: разница между r=+0,1 и r=+0,2 — это не то же самое, что разница между r=+0,8 и r=+0,9". Поэтому сумма таких величин поделённая на их количество не составляет их ожидаемого значения.

Рекомендуется поэтому среднить не эти величины, а "Фишеровские ζ-преобразования" таких величин:

.., ζ1j₁ ≡ ½Ln[(1+r1j₁)(1−r1j₁)], .., ζkjk ≡ ½Ln[(1+rkjk)(1−rkjk)], .., ζ54j₅₄ ≡ ½Ln[(1+r54j₅₄)(1−r54j₅₄)], ..,

получая либо средние для каждого с исследований:

‹ζ›1 = ½Ln[(1+r₁)(1−r₁)], .., ‹ζ›k = ½Ln[(1+rk)(1−rk)], .., ‹ζ›₅₄ = ½Ln[(1+r₅₄)(1−r₅₄)],

либо среднее по всем 54 исследованиям

ζu = ½Ln[(1+0,09)(1−0,09)],

с которого Риндовцы заключают, якобы секс в детстве со страданиями по взрослении коррелирует на ru = +0,09. Связь между сексом и страданиями, хоть имеется, но слабая.

5. Основная гипотеза

Математическая статистика не сводится к исчислению средних. Следует оценивать и то, насколько среднее соответствует матожиданию. Задача математической статистики — выяснение функции распределения Φμ(r) любой величины r в генеральной совокупности. Функция распределения задаётся некоторым параметром μ. Пускай по выборкам из генеральной совокупности получили 54 значения величины r:

r1, .., rk, .., r54. (***)

Внутри выборки параметр μ оценивается величиной u(r1, .., rk, .., r54). Такая оценка может быть адекватной, но может и не быть. Отличается ("смещена") ли наша оценка от μ?

В лучшем случае и да, и нет. Дело в том, что наши данные (***) — неполные, способны быть распределены как по функции Φμ(r), так и по Φμ′(r), Φμ″(r), Φμ‴(r) и много какой ещё. С убавлением или дополнением имеющихся данных одни распределения в генеральной совокупности кажутся более, другие — менее вероятными. Мы допускаем только такие, чья вероятность не ниже наперёд заданного числа α. Риндовцы часто берут α ≡ 0,05, и заявляют: пускай с вероятностью на "уровне" не ниже 0,05 в генеральной совокупности величина r распределена по одной с функций {Φμ(r), Φμ′(r), Φμ″(r), Φμ‴(r),..}.

Такое заявление называют "основной гипотезой" H₀. Если выборочные данные (***) внушают недоверие к ней, то принимаем одну с "альтернативных гипотез" H₁, H₂,.. Такое недоверие возможно даже тогда, когда основная гипотеза справедлива, но не подтверждается опытом по чистому невезению — в этом случае совершаем "ошибку первого рода". Вероятность которой Pu(.., rk, ..) ∉ {μ, μ′, μ″, μ‴,..}H = α.

Насколько правдоподобнее предпочесть альтернативную гипотезу основной, решается по разнообразным критериям. Иногда основную гипотезу отклоняют из-за того только, что во ("доверительном") множестве {μ, μ′, μ″, μ‴,..} преобладают неотрицательные числа ("односторонний критерий знаков"). Но чаще значительность ("значимость") отклонения опыта от основной гипотезы выясняется по некоторой величине с изначально известным распределением (например, нормальным распределением). Если значение величины, соответствующее (***), маловероятно, гипотезу отклоняем.

У нас основной гипотезой будет утверждение, будто на страдания студента влияет всё что угодно, кроме противоправного секса в детстве.

6. Альтернативная гипотеза: Согласие данных

Будь основная гипотеза верна, каждое с исследований сообщало бы коэффициенты

r1, .., rk, .., r54

корреляции СЗД - страдания противоречивые: H₀ = (r ∈ [−1,00; +1,00]). Альтернативная гипотеза: какие исследования на студентах ни проводи, все сходятся.

Оценка среднего ru = +0,09 таких коэффициентов корреляции вписывается в исследованиям соответствующее доверительное множество [+0,08; +0,11]. Что в интервале нигде нет отрицательных или нулевых значений, говорит об определённом согласии: будто бы между сексом в детстве и страданиями по взрослении корреляция неотрицательна, согласны почти все.

Но во-первых, не все (в одном исследовании приводится коэффициент корреляции −0,25), а, во-вторых, на взаимное несогласие данных указывает особый критерий χ²(54 − 1). Это сумма квадратов независимых случайных величин, одинаково и нормально распределённых по функции Φ0,±1. К примеру, выборочная дисперсия объёмов Nk наших 54 выборок на каждого студента при соблюдении основной гипотезы:

χ²(54 − 1) ≈ ∑(k ≤ 54)(∣Nk − Nα∣²(Nα)).

Распределение такой величины будет интегралом от функции, чей график убывает поближе к оси абсцисс — это значит, что чем больше χ², тем превысить это значение маловероятнее. (При некоторых числах степеней свободы график ещё и возрастает у нуля — в этой ситуации χ² маловероятно быть и маленькой. Поэтому статистические критерии различают "одно-" и "двусторонние".) Для тех, кто запутался: из основной гипотезы должно было следовать, что все значения rk равновероятны, даже отрицательные, поэтому

μNk ≈ NPrk ∈ [+0,08; +0,11]r ∈ [−1,00; +1,00] = Nα.

Вышло значение χ²(54 − 1) = 78 в пять раз менее вероятное, чем ошибка первого рода. Чтобы критерий согласия был удовлетворителен, Риндовцы проигнорировали значения коэффициентов корреляции +0,36, +0,40 и −0,25. Это совсем оправданно: средний коэффициент корреляции (Фишеровский) — сумма значений коэффициента, помноженных на уменьшающие веса; такая сумма имеет нормальное распределение, поэтому вероятность ‹ζ›-ке отклониться матожидания на ±2√μΔ²‹ζ› — около 0,05. Крайние значения маловероятны, без них критерий χ²(54 − 3 − 1) показывает согласие данных.

Итак, все коэффициенты корреляции, кроме невалидных и маловероятных, показывают, что между сексом в детстве и страданиями по взрослении связь есть и слабая.

7. Альтернативная гипотеза: Секс хуже, чем семейное насилие

Тот факт, что между сексом в детстве и страданиями по взрослении связь есть, ещё не значит, якобы страдания вызываются сексом. Корреляция возможна не только в причинно-следственной связи. Если количество священников коррелирует с количеством преступлений, то вовсе не потому, что религия провоцирует преступления, но потому, что с увеличением численности населения (промежуточная переменная) город имеет и воров, и священников больше.

Учитывая виктимологические теории, будто половой близостью дети пытаются добиться от взрослого недополученную дома любовь-заботу-внимание; будто половая жизнь свидетельствует о запущенности ребёнка; также принимая во внимание наказания ребёнку со стороны родителей за любую попытку вести половую жизнь, основную гипотезу мы сформулируем иначе: в страданиях по взрослении виноват не секс, а обстановка в семье ребёнка. Альтернативная гипотеза: лучше получить ремня, чем оргазм.

Оценивали гипотезы Риндовцы не сами, только ссылались на чужие работы. В которых эти гипотезы проверяли анализом путей, анализом дисперсий, анализом регрессионных коэффициентов. Рассмотрю по порядку. Для краткости методы опишу терминами русскоязычной математики без разжёвывания.

В методике Сьюэла Райта (1934) переменные представлены вершинами ориентированного графа; связь между переменными представлена путём с ребром не более чем одним; предполагаемое причинно-следственное влияние переменной на переменную представлено дугой, когда влияние односторонне, — ребром, когда взаимно. Любому пути между переменными соответствует уравнивание варьирования переменной конечной вершины пути с линейной комбинацией вариаций прочих переменных пути. Основная гипотеза говорит, якобы вершина переменной страдания достижима обязательно с вершины промежуточных переменных обстановки в семье:

Δy = γyzΔz + γyxΔx.

Альтернативная гипотеза — что необязáтельно, лишь бы достижима с вершины переменной СЗД. Линейную комбинацию лучше переделать для отношения вариации к соответствующему среднеквадратичному отклонению:

Δy‹Δ²y› = (γyz‹Δ²z›‹Δ²y›)Δz‹Δ²z› + (γyx‹Δ²x›‹Δ²y›)Δx‹Δ²x›. (****)

Числители выражений в скобках имеют смысл среднеквадратичного отклонения зависимой переменной при постоянстве всех промежуточных и независимых переменных, кроме одной:

γyz‹Δ²z› = √‹Δ²y›x = Const и: γyx‹Δ²x› = √‹Δ²y›z = Const.

Уравнение (****) можно домножить на значения вариаций независимой переменной Δx и усреднить — поскольку сумма средних является средним суммы, получится:

r = (‹Δ²y›x = Const‹Δ²y›)⋅ρ + (‹Δ²y›z = Const‹Δ²y›),

где r — коэффициент корреляции между сексом и страданиями, ρ — коэффициент корреляции между проблемами в семье и сексом в детстве. Так, зная коэффициенты корреляции между всеми независимыми, зависимыми и промежуточными переменными (Риндовцы, к примеру, посчитали коэффициенты корреляции секс-страдания, секс-семья, семья-страдания соответственно +0,09; +0,13; +0,29 — семейные проблемы явно вреднее половой жизни), подсчитывая опытно среднеквадратичные отклонения зависимой переменной при фиксировании тех или других независимых или промежуточных переменных — по методу Сьюэлла Райта можно судить о правдоподобности статистических гипотез. Эта метода позволила в 1988 году показать, что корреляции между инцестом у девочек и страданиями по взрослении статистически незначимы без учёта обстановки в семье.

С методикой Сьюэлла Райта всё, теперь изучим ковариационный анализ. Ковариационный анализ распадается на дисперсионный анализ и регрессионный анализ. Первый подразумевает разбиение исследуемых студентов на подгруппу имевших в детстве секс без проблем в семье, подгруппу терпевших от родителей побои, подгруппу игнорированных в детстве, подгруппу оскорбляемых родителями, подгруппу педагогически запущенных в детстве, подгруппу выросших в бедности — все J подобных подгрупп. В каждой j-й подгруппе свои значения переменной страданий:

y11, .., yn1, .., yN1, .., y1j, .., ynj, .., yNj, .., y1J, .., ynJ, .., yNJ,

которые можно усреднить:

‹y›1, .., ‹y›j, .., ‹y›J,

что варьирование переменной страданий

Δynj = [(j ≤ J) (ynj − ‹y›j)] + [(j ≤ J) (‹y›j − ‹y›)]

складывается с варьирования средних под влиянием семейных обстановок и варьирования страданий в той либо другой семейной обстановке. Из-за (**) и того, что

(n ≤ N)[ynj − ‹y›j] = [∑(n ≤ N)ynj] − N‹y›j = [∑(n ≤ N)ynj] − N(n ≤ N)ynjN = 0,

дисперсия переменной страданий на каждую степень свободы

‹Δ²y› = ‹Δ²y∣j = Const› + ‹Δ²‹y››

распадается на внутриподгрупповую и межподгрупповую (для соблюдения первой дисперсии степеней свободы значений Δ²y∣j = Const будет NJ − J, для соблюдения второй дисперсии степеней свободы значений Δ²‹y› будет J − 1). В силу нормальности распределения величин дисперсии соотносятся между собой как [χ²(J − 1)/(J − 1)][χ²(JN − J)/(JN − J)] — критерий Фишера, который удостоверяет нашу основную гипотезу.

Помимо дисперсий взаимоотношения между переменными моделируют уравнениями регрессии вроде линейной:

‹y› ≡ β₁z + β₀,

где коэффициенты

β₁ = R‹Δ²y›‹Δ²z› и β₀ = ‹y› − R‹z›‹Δ²y›‹Δ²z›

определяются с опытных данных (R — коэффициент корреляции меж обстановкой в семье и страданиями по взрослении). Если опытные данные не позволяют утверждать линейной зависимости между семейной обстановкой и страданиями после секса, тогда, действительно, вместо z может стоять x. Но вышло, что проблемы в семье переносятся тяжелее секса. Благодаря ковариационному анализу стало возможным не менее четверти, а то и все коэффициенты корреляции секс-страдания сделать статистически незначимыми. Поэтому семейная жизнь вреднее половой.

8. Коэффициенты корреляции как зависимые переменные

Риндовцы видели, как оценивали статистическую значимость связи секса в детстве со страданиями по взрослении предшественники, но вклад в эту связь со стороны промежуточной переменной проверяли также сами.

Пускай в метаанализируемых исследованиях сообщаются значения промежуточной переменной для каждой j-й категории студентов:

z1, .., zj, .., zJ,

и Пирсоновские коэффициенты корреляции секс-страдания:

r11, .., r1j, .., r1J, .., rk1, .., rkj, .., rkJ, .., rK1, .., rKj, .., rKJ,

которые можно преобразовать по-Фишеровски:

ζ11, .., ζ1j, .., ζ1J, .., ζk1, .., ζkj, .., ζkJ, .., ζK1, .., ζKj, .., ζKJ

и усреднить:

‹ζ›1, .., ‹ζ›j, .., ‹ζ›J.

Как узнать, насколько на такие средние повлияли значения промежуточной переменной? Способа два.

Один именуется методом контрастов. Альтернативную гипотезу формулируем как:

c1‹ζ›1 + … + cj‹ζ›j + … + cJ‹ζ›J ≡ 0 при c1 + … + cj + … + cJ = 0.

В случае J = 2 это значило бы, что для разных z коэффициенты корреляции ‹ζ› выходили б одинаковыми (c₁‹ζ›₁ + c₂‹ζ›₂ = ‹ζ›₁ − ‹ζ›₂ = 0), поэтому промежуточная переменная z не влияет ни на что. Основная гипотеза — что ни через какие c-веса сумму нулю не приравнять.

Поскольку (**),

‹Δ²∑(j ≤ J)cj‹ζ›j› = [(j ≤ J)cj²K]‹Δ²‹ζ›∣j = Const› —

по аналогии с дисперсионным анализом альтернативную гипотезу отбрасываем, если

∣∑c‹ζ›∣‹Δ²∑c‹ζ›› > √J − 1[χ²(J − 1)/(J−1)]/[χ²(K(J − 1))/(K(J − 1))] Φ = 1 − α.

Помимо анализа контрастов есть ещё методика, не имеющая русского названия. Промежуточную переменную соединяют с коэффициентами корреляции регрессионным соотношением

β₁z + β₀

и смотрят, отклонение коэффициента от линии регрессии ‹ζ› − (β₁z + β₀) коррелирует ли с промежуточной переменной z. Согласно (*) и (**), Пирсоновский коэффициент корреляции между z и ‹ζ› − (β₁z + β₀) равен Пирсоновскому коэффициенту корреляции между z и ‹ζ›. Такие коэффициенты показывают, насколько влияет промежуточная переменная на связь между сексом в детстве и страданиями по взрослении.

Этими способами Риндовцы показали, в частности, что промежуточная переменная наличия коитуса при СЗД ни на что не влияет, зато влияет переменная степени желательности секса ребёнком. Отсюда секс по взаимному желанию безвреден.

Заключение

Вот и закончен экскурс в статистические премудрости. Кто понимает всё сказанное в этой статье, тот сможет изучить метаанализ Риндовцев самостоятельно. Можно винить в педофильности Брюса Ринда, но никак не бесстрастные числа. Можно заставить Американскую психологическую ассоциацию отречься от Брюса Ринда, но нельзя величину χ² заставить быть большой. Можно запретить Скотту Лилиенфельду писать о Брюсе Ринде, но нельзя запретить Центральную Предельную теорему.

Не только здравый смысл, не только повседневный опыт у нас и наших предков, не только поведение животных, не только фантазии психоаналитиков и выкладки с Института Кинси, не только положительные отзывы Феллини либо Вирджинии По, но также математическая статистика свидетельствует: секс у ребёнка даже со взрослыми безвреден. Это истина, которая нас делает свободными.