Не та форма графика и странное облако. Изучили фото протоколов на платформе «Зубр» и нашли аномалии
Обычно, если во время выборов голоса посчитаны правильно, явка и результаты связаны определенными математическими законами, а форма графиков позволяет судить о правдивости и прозрачности результатов голосования. TUT.BY использовал фото протоколов с участков по выборам президента, собранные платформой «Зубр», построил графики и обнаружил аномалии.
Недавно мы опубликовали результаты исследования профессора кафедры биостатистики американской школы общественного здравоохранения Джонса Хопкинса, который проанализировал оцифрованные данные из фотокопий протоколов участковых избирательных комиссий, собираемые платформой «Зубр», и нашел статистические аномалии. Теперь мы решили изучить информацию самостоятельно, при помощи статистики и графиков, и вот что у нас получилось.
Как можно изучить достоверность подсчета голосов при помощи графика?
Как статистика помогает определить, были ли голоса посчитаны верно? Рассмотрим теоретический пример. Предположим, явка на выборах составила 69,5%. Объединим участки с явкой от 69,0 до 69,9% в группу и для простоты обозначим ее как 69%. Сумма голосов на этих участках будет самой большой. Также много голосов будет на участках с явкой 68 и 70%, чуть меньше на участках с явкой 67 и 71% и так далее.
Чем больше разница между средней явкой и явкой на участках, допустим, попавших в диапазон 38,0−38,99, тем меньше сумма проголосовавших на участках с такой явкой. С этим проще разобраться, если посмотреть на график:
В идеале, если выборы прошли «по правилам», зависимость явки на участках от количества голосов должна иметь форму колокола.
В некоторых странах кривая никогда не принимает эту форму из-за глобального разделения внутри страны. Например, запад и восток исторически голосуют совершенно по-разному. В Беларуси такого разделения нет, а значит, нет и причины, по которой форма кривой для нашей страны должна быть другой.
Вот так, например, распределились голоса в первом туре выборов президента Польши 28 июня 2020 года:
Форма кривой — почти идеальный колокол, то есть, голоса подсчитали честно.
Картина практически не меняется, если разложить общее количество голосов по кандидатам. Пропорции сохраняются вне зависимости от явки на участках. Это говорит о том, что голосование проходило без нарушений закона.
Хорошо, а как выглядит график по итогом выборов в Беларуси?
После последних выборов в Беларуси волонтеры платформы «Зубр» собрали доступные фотографии протоколов и оцифровали их. Мы использовали 1291 протокол из этой подборки и построили графики, аналогичные тем, что приведены выше.
На этих 1291 участках проголосовало более 1,8 миллиона человек из 5,8 миллиона, принявших участие в выборах. Это 31,5% от всех избирателей.
Вот как выглядит распределение сумм голосов по участкам с разной явкой за Александра Лукашенко и Светлану Тихановскую:
Как видно, форма кривых совсем не напоминает колокол.
Стоит обратить внимание и на две аномалии. Одна — пик на участках с явкой 65−68%: его там быть не должно, так как это очень далеко от средней явки в 84,4% по версии ЦИК.
Вторая странность — что данный пик сформировали минские участки: результаты в одном городе не должны быть настолько похожими.
На графике ниже мы изобразили все доступные минские участки и явку на каждом из них (каждая точка — отдельный участок). Вот так выглядит явка на 406 из 687 участках города:
На большинстве участков столицы явка — в очень узком диапазоне (обратите внимание на получившуюся линию в районе 60%), что довольно подозрительно. Также, судя по данным, разброс явки зависит от района города, чего быть не должно.
К примеру, в Заводском и Ленинском районах явка на большинстве участков находится в диапазоне 60−67% (начало графика). Зато в Первомайском и Октябрьском районах (центральная часть графика) явка на большинстве участков настолько похожа, что выстраивается в прямую линию.
Еще одна странность — довольно большое количество участков с очень высокой явкой под 95−100%. Для сравнения, вот так голосовали во втором туре выборов президента Польши в Варшаве:
Видно, что разброс результатов явки намного шире, а участков с подозрительно высоким значением практически нет.
А есть еще способ изучить итоговые данные по участкам?
Да, есть — построить график зависимости явки на каждом участке от результата кандидата. Полученное облако точек должно располагаться кучно вокруг среднего значения явки и результата.
Это видно на графике ниже, на нем более 27 тысяч участков Польши (каждая точка — отдельный участок) в зависимости от результата победителя тех выборов Анджея Дуды и явки на том или ином участке.
Видно, что центр облака точек расположен где-то в районе пересечения средней явки по стране и итогового результата Дуды, как и должно быть согласно статистике.
Совершенно другая картина получается, если нанести аналогичным образом белорусские участки, для которых доступны протоколы, в зависимости от явки на них и результата Александра Лукашенко:
Участки не концентрируются вокруг пересечения средней явки и итогового результата Лукашенко. Также видно аномальное скопление точек, обведенное пунктирной линией. В основном там минские участки. Как уже говорилось выше, довольно странно, что многие из них оказались настолько близки по явке и по результату.
На этом графике представлены только 1291 из 5767 участков страны. Возможно, если бы у нас были данные по всем, картина выглядела бы более правдоподобной. Однако в таком случае результаты на остальных участках должны значительно отличаться от собранных. Большинство из них должны быть с результатом за Лукашенко в районе 90%. Это маловероятно.
В целом, результаты по данным собранных протоколов выглядят как минимум подозрительно.
Источник данных: система онлайн-мониторинга избирательного процесса в Республике Беларусь zubr.in
Методология взята из материала «Колокол, пила, топор» проекта «Важные истории»