пятница, 29 января 2016 г.

Математика и Статистика на службе Теории Заговора

Рассуждения на тему Теории Заговора, это больше для личного блога. Но если при этом используется математика и статистика, то можно и в данном блоге.
Несколько дней назад новостные ленты пестрели сообщениями о том что британский физик (хорошо что не "британский ученый") с помощью математики и статистики доказал, что заговоров не существует. Аналогичные посты начались и на хабре и в ФБ. И под моим скептическим комментарием 
Для таких любителей теорий заговоров как я, данная статья - чистый подарок. А если бы мой студенты в качестве лабы по мат.статистике принес настолько качественную работу, То свою честную тройку он бы получил за количество листов "обраток" которые он принес, ну и за старание в подборе источников  :)
вдруг появился другой, говорящий что:
Обычное дело при параноидном бреде. Обьяснять бесполезно - нужны уколы 
Так как я никогда не скрывал, что у меня паранойя, то отнесу высказывание на свой счет и попытаюсь развернуто на него ответить. Если кому интересно - прошу под кат.
Тем кому лень читать всю публикацию на английском предлагаю ее "локализованный" вариант: https://geektimes.ru/post/269988/
Оригинал же, можно найти тут: http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0147905

Итак. При первом взгляде у нас есть достаточно добротно проделанная работа. 62 источника, если брать привычное ВАКовское форматирование (А4, 14 шрифт, 1.5 интервал) то мы получаем 37 страниц текста (ну или 26, если без списка источников). 4 рисунка, 4 таблицы, 9 формул.
Титанический труд... Для студенческой лабораторки, отчет по которой рано или поздно попадет в "обратки", и будет использован по назначению (напечатают что-то еще с другой стороны). При желании можно даже дотянуть до курсового, или защитить кандидатскую (ну только под требования ВАКа немножко водой разбавив и описав еще более наукоемким стилем.

Вот почему у меня все так хорошо начиналось применительно к данной статье, а потом скатилось до оскорблений? Давайте попробуем разобраться.
Что будет, если из статьи убрать всю патетику и подойти к ней строго математически и используя минимальные навыки по мат.статистике и анализу даных.

1. Если обобщить, то автор утверждает, что по теории вероятности, если заговор существует то он рано или поздно будет раскрыт. И чем больше человек участвует в заговоре - тем выше вероятность его раскрытия и тем быстрее он раскроется.  Все логично за исключением пары дополнений. Не все заговоры, как и не любая секретная информация всегда становится доступной общественности и в итоге "раскрывается" (это первая проблема в размышлениях) и вторая заключается в том, что не смотря на повышение вероятности, скорость раскрытия, как и сам факт случается не всегда (а только если рассмотреть бесконечное множество заговоров, и то с учетом тех, про которые никто и не узнал что они были и тех что были, но не раскрылись). Как говорил один очень хороший человек: 
вероятность падения кирпича на голову человеку - составляет 1/100000, но если кому-то на голову упал кирпич, то во первых для него вероятность равна единице... а во вторых ему все равно, какая была вероятность.

Или разговор самого себя с самим собой ( в варианте 20, 40 и 60 лет). В исполнении БГУ:
60: -С сегодняшнего дня у тебя любимая цифра не пять а восемь, а потом три раза подряд на зеро.
20: -Три раза подряд, ну так не бывает!
60: этот (40) тоже раньше так думал.



Итого одно деление на ноль в доказательстве что 2+2=5 автор закопал.
(Дословные цитаты из статьи и их перевод вставлю, если кому-то не хватит моего обобщения (такого же своевольного как и у автора) и ему захочется более строгого подхода)
2. Автор в качестве мат. модели для расчета времени ожидания даты раскрытия информации выбирает распределение Пуассона. (1 2)
Ну выбрал и выбрал. Кстати, а почему его?
Кто вообще сказал, что данная функция обязана быть строго кумулятивной?
Если говорят о нормальных статистических исследованиях, то по хорошему обычно выбирают несколько моделей, находят для них параметры на выборке из имеющихся данных, а потом на оставшихся (которые не участвовали в выборке) проверяют применимость выбранных методов. Тем самым выбирая наилучшую мат. модель, и при этом указывая пределы ее работоспособности и уровень статистической погрешности.
Но в рамках статьи используется только одна модель. Может конечно были/будут еще публикации. Но по списку литературы - не заметно ранее опубликованных работ. А по тону статьи не заметно, что автор собирается проводить доп. исследования.
 The theory presented here might be useful in counteracting the potentially deleterious consequences of bogus and anti-science narratives, and examining the hypothetical conditions under which sustainable conspiracy might be possible.
Еще одно деление на ноль. И так по каждому дальнейшему пункту.

3. Исходная выборка на базе которой проводится определение параметров мат модели происходит на базе АЖ ТРЕХ ПРИМЕРОВ!!!! 
тут я хотел добавить комментарий, но они все какие-то мало литературные. Разве что "Афигеть дайте два" (с)
Вот скажите, почему "тупые" военные артиллеристы и стрелки проводят сотни и тысячи экспериментов до получения минимум десятка однотипных точек (а по хорошему сотни), а при развенчании теории заговора используется аж три! У нас что всего три секрета/"заговора" в мире существовало? Или на вероятность раскрытия информации влияет меньше параметров чем на характеристики выстрел?
Почему даже в соревнованиях биатлонисты и прочие стрелки делают по несколько подходов, а на большинстве соревнований присутствует несколько судей, и результаты всегда осредняются? Причем это несколько обычно больше трех?

Может потому что артелеристы хотят попадать куда надо, а на соревнованиях хотят выбрать лучшего, а не доказать что куда попали - туда и стреляли, а победит вот этот (почему потом судьями подтасуем)?...

Что характерно, но выводы делаются в последствие для четырех других случаев... В общем "Не Серега, а Ваня. Не выиграл, а проиграл... а так - все верно" (с) 

Как по мне то абсолютно с таким же успехом можно воспользоваться методами "функционального анализа и интегрального исчисления". Рассматриваем вопрос существуют ли "Лунный заговор" и другие. Пойдем от противного. Предположим что "Лунного заговора" на существует потому что не существует заговоров вообще. Проверяем. Благодаря автору заметки узнаем, что заговоры существовали. Следовательно наше предположение - опровергнуто. Лунный заговор есть. поздравляю :)

4. Рассмотрим более внимательно использованные автором реперные точки.
пример 1 и 3 и для 30 тыс. участников и для  500 у нас раскрытие заговора за 6 лет. Ура, константы определили выдохнули, обрадовались... а теперь вдыхаем: 6.7 тыс. человек - 25 лет.
Как-то данные плохо стыкуются между собой. Впрочем такое в статистике бывает. И обычно есть такой подход, благодаря которому просто выкидывают экстремальные точки, которые ухудшают статистику и искажают среднюю картину. Вот только вопрос. Из данных трех точек, какие являются экстремальными? Как по мне - так все.

Оценки "погрешности" , т.е. сравнения полученной им статистической функции и исходных данных, я как-то пропустил.

5. Нет ни одного определения что считать критерием раскрытия заговора (т.е. его подтверждения) Что простите странновато. И я в данном случае не про цифровое значение, а про перечень фактов, условий и пр.

6. Графики приводятся постоянно в разных масштабах, что "несколько" затрудняет их анализ.  Как и отсутствие отмеченных точек о которых шла речь. Впрочем их анализ, не стыкуется с им же приведенными данными. Так на графике 2a хорошо заметно что по прошествии 5 лет вероятность раскрытия заговора 98-99%. А в таблице значится 3.68 года до раскрытия. При этом в 3.68 вероятность по моим прикидкам где-то 0.92 (а в тексте сказано, что 0.95)
Ну ладно, будем считать что у меня просто кривой глазомер, а там все правильно на графиках.  Но такие графики  я называю "фотошоп в руках инженера". В том плане, что на них можно показать почти что угодно.

7. Не учитываются исходная известность события. Не учитывается скорость распространения информации. С точки зрения автора это константа и для 1930 и для 1960 и для 1970, и для 2000 и для текущей ситуации. Не учитывается сложность/возможность получения доступа к скрываемой информации третьими лицами, не учитывается сложность/возможность копирования информации людьми имеющими к ней доступ для предоставления доказательной базы. Не учитывается сложность подделки и проверки информации. Не учитывается методы борьбы с распространением правды путем создания информационного шума, в котором вся правда просто потеряется.

8. Не учитывается смертность. Ой вру, есть там один график в котором описано, что будет если государство будет мочить всех вовлеченных (при этом фактор запугивания и его различное влияние на людей с различным психотипом не учитывается). А простая смертность - не учитывается и отсюда получаются веселые сроки типа 100 лет. При этом не учитывается изменение числа не только уменьшение числа, но и его увеличение (частичное раскрытие информации или передача одним человеком данных другому).

9. При подсчете количества людей вовлеченных в какую-то тайну автор факты (явно сознательно искажает) существенно увеличивая численность вовлеченных людей добавляя всех сотрудников. 
Рассмотрю только один пример.
Неужели среди 411 тысяч сотрудников НАСА, о которых говорит автор не было ни уборщиков, ни людей занимающихся другими проектами? Вот все 411 тысяч участвовали в "лунном заговоре". Хм.. а почему он сюда не прибавил правительство? Оно видимо не в курсе. НАСА видимо тупо попилило бабло и скрыло это от своего начальства (не скрывая от последнего уборщика...) А чужие разведки почему сюда не добавляют? Они что проехали мимо этого праздника жизни и ничерта не знают?  В общем цифры как по мне притянуты за уши.
Если верить его расчетам, то о лунном заговоре при таком числе вовлеченных должны были узнать еще до того как идея о лунном заговоре возникла в мозгах заговорщиков...

Самое интересное, что 21 июля 1969 года состоялась высадка на Луну (не знаю брать в кавычки термин состоялась или нет, но в рамках данной публикации это не суть важно), а 8 декабря 1969 года в газете The New York Time публикуется материал в котором рассматривается (пусть с намеком на юмор) данная ситуация с точки зрения что никто никуда не летал. Потом в течение очень короткого времени подобные публикации и даже книги выходят в США и начинаются телепередачи. Причем они уже не всегда содержат юмористическую ноту, а претендуют на то, что они соответствуют фактам. Там же приводятся не только исследования но и интервью и пр.
Так вот у меня вопрос. С одной стороны мы видим подтверждение теории уважаемого автора. Не прошло и пол года, а уже во всю пошли раскрытия заговора. Но с другой он утверждает, что никаких раскрытий нет (не ссылаясь на них, а просто утверждая что их нет). Т.е. это все фуфло, а не раскрытия, а раз это не раскрытия а фуфло, то значит до сих пор заговор не раскрыт, а значит заговора нет.

Эм... Мне кажется данная логика несколько странной.
Что интересно, дабы добавить веса своим расчетам (по другому я эти телодвижения назвать не могу) автор приводит вилку количества людей, допуская что их может быть меньше. И приводя такие данные. При этом он пишет что данные дескать неполные. Но блин.. Ссылки приводит не всегда на конкретные страницы где указаны взятые им данные, а на страницы с которых можно попасть на страницы где данные указаны. Ну ладно. Но цифры несколько не совпадают.
Для примера относительно CDC [ссылка 47] автор пишет 15 тыс. сотрудников. А на странице 
указано 14. Ну ладно, разница небольшая и может за то время пока он готовил - она поменялась. Но опять же. Вряд ли компания приводя статистику забыла про обслуживающий персонал. 

Возвращаясь к количеству людей. Возьмем вопрос прививки. Среди моих знакомых докторов (которых достаточно много) процент людей которые рекомендуют не прививаться приблизительно равен проценту которые говорят что прививаться обязательно надо. Причем первых даже чуть больше. И есть еще где-то половина от любой из этих групп, которые либо считают из бесполезными, либо "знают" и негативные и положительные "истории" болезней. Да, елки палки, среди врачей есть как минимум треть несущих (с моей точки зрения) ахинею про прану, чакры, сыроедение и пр. Почему ахинею? потому что стоит начать их заваливать вопросами, как они начинают путаться в показаниях. Ну они "так видят". К чему я это. Количество людей занятых в области здравоохранения существенно превышает число врачей. Т.е. людей непосредственно занимающихся лечением. Среди этих врачей 2/5 являются сторонниками теории заговора и 2/5  - противниками. (грубо и приблизительно, чисто для понимания). При этом и среди тех и других есть еще некоторое число неадекватов (ну хотя бы в данном вопросе). 
И если есть какой-то заговор, то даже оставшееся число в 2/5 (забудем про неадекватов) далеко не факт что в него посвящены. Скорее распределение по Парето, или других товарищей (80/20, 99/1). Так вот по моим прикидкам получается, что если заговор и есть, то в него получается посвящено где-то процентов 7 от общего числа врачей (2/5 это 40%, минус неадекваты = 35%, применяем принцип Парето = 35*0,2=7%). Что если учесть общее число сотрудников системы здравоохранения составляет и того меньше - около 3%. 


Возьмем самые таблицу зависимости количества вовлеченных и срока до раскрытия тайны.
Если составить функцию тренда (срок(в годах) = 12 284*(кол-во людей)^-0.996.
Отсюда получается что для первого исходного случая с 30 тыс. людей срок 0,4 года (против 6 лет). Для случая с 6.7 тыс. людей =11.9 лет (против 25), для 500 = 25 с копейками (против 6). Итого погрешность расчетов от -19,2..20,1. Не многовато ли?

Возвращаясь к Лунной миссии. Если применить те же подходы (а кто нам мешает так вольно поступать, если сам автор поступал не менее вольно) мы получим число вовлеченных в таинство около 12 тыс. человек. Отсюда получается что если никого не убивать и не запугивать тайна проживет 1 год +/- 20 лет. Если посмотреть на количество информации которое было опубликовано за это время. Можно с достаточной долей вероятности утверждать, что возможно заговор давно был раскрыт. Как в той фразе: конец света наступил, но мы его не заметили.

Впрочем, на наличие Лунного заговора мне как-то плевать. Я просто не пойму с чего вроде бы умные люди, на основе, в общем-то филькиной грамоты, как раз в стиле "британских ученых",  делает радостные утверждения, что все сторонники теории заговора - тупые. По моему верить в чушь, типа данной статьи (тем более ее не читая) не менее тупо. Потому что лично с моей точки зрения (кою я изложил выше) этот документ и годится как раз только для подтверждения того, что "Государство и корпорации нас обманывают", ну или для использования в качестве "обороток". Но не более.
Ладно, как Вы уже наверное поняли из вышенаписанного бреда, я ярый почитатель теории о жидо-массонских заговорах, и просто жить не могу без своей любимой паранои. Исключительно по этой причине я наезжаю на высоконаучную статью, которая все объясняет и не более. Ну а на последок я напомню великое изречение: "есть ложь, наглая ложь и статистика" и пойду одевать алюминиевую шапочку, "ну вы понЕли" (с).

Ну а Вы как думаете?
Related Posts Plugin for WordPress, Blogger...
Rambler's Top100