Методы анализа
Распределения УИК по электоральным показателям
Изучение экстремальных результатов
Сравнение голосования с КОИБ и без них
Сравнительный анализ протоколов
Метод Собянина-Суховольского
Большой вклад в развитие методов анализа электоральной статистики внесли А.А. Собянин и В.Г. Суховольский своей книгой «Демократия, ограниченная фальсификациями», изданной в 1995 году. В этой книге были предложены два метода анализа электоральной статистики.
Один из методов основан на предположении, что число голосов, полученных кандидатами, должно подчиняться «закону Ципфа». Это утверждение, в общем случае плохо подтверждается российской статистикой, и в дальнейшем этот метод был практически забыт.
Другая модель, основанная на предположении, что распределение голосов между кандидатами статистически не зависит от явки, получила широкое распространение и часто используется. Например, на этой модели основано объемное сравнительное исследование российских и украинских выборов – Кунов А., Мягков М., Ситников А., Шакин Д. Россия и Украина: нерегулярные результаты регулярных выборов. М., 2005.
Метод исследования честности выборов, основанный на этой модели, мы называем «методом Собянина-Суховольского». Он достаточно прост и нагляден и заключается в вычислении двух интегральных показателей для точек на декартовой плоскости. Каждая точка характеризует одну избирательную комиссию, имеет абсциссу равную явке в этой комиссии, и ординату равную доле голосов, полученных данным претендентом (вычисленную от общего числа избирателей). Облако точек может быть интерполировано прямой линией, линейный коэффициент которой мы называем «ПДИ», а свободный член – «СРЛ» (названия не самые удачные – «поддержка дополнительных избирателей» и «смещение регрессионной линии», но они вошли в обиход).
Заметим, что для хорошей интерполяции требуется достаточно много точек, причем точки могут характеризовать как участковые комиссии, так и комиссии более высокого уровня – территориальные (для федеральных и крупных региональных выборов) и региональные (для федеральных выборов). Ниже приведен пример графического использования метода Собянина-Суховольского для выборов депутатов Госдумы в 2007 году в Москве. На этом графике изображены точки, соответствующие 121-ной территориальной комиссии города Москвы.

Модель Собянина-Суховольского утверждает, что ПДИ должно быть приближенно равно доле голосов, которую набрал претендент (от числа избирателей, принявших участие в голосовании), а СРЛ не должно сильно отличаться от нуля. Вот пример образцового графика (выборы мэра Магнитогорска 14.03.10):

Недобровольное голосование и «вбросы» за определенного претендента смещают график таким образом, что ПДИ становится больше чем процент голосов, набранный претендентом, а СРЛ отклоняется в сторону отрицательных значений. При этом ПДИ других претендентов, наоборот, становится существенно меньше, чем набранный ими процент голосов. Конечно, такой анализ не позволяет сделать однозначных выводов о фальсификации, но позволяет усомниться в честности голосования и подсчета и заставляет более внимательно отнестись к информации с избирательных участков. Кроме того, не исследован вопрос, насколько большими должны быть отклонения, чтобы вызывать подозрения. Мы обычно считаем, что озабоченность должны вызывать отклонения по ПДИ или СРЛ, которые превышают 10% (или 0,1 в абсолютном выражении).
Например, график по выборам 13.03.11 в Дагестане вызывает сильные подозрения (точки соответствуют участковым комиссиям Республики Дагестан):

Приведем очень выразительный пример: графики Собянина-Суховольского, для всех прошедших ранее в России президентских выборов. Поскольку данные по выборам Президента 1991, 1996 и 2000 годов в открытом доступе имеются только по региональным комиссиям, именно они и были использованы для построения таких графиков:

Этот график показывает, что выборы 90-х годов существенно отличаются от выборов двухтысячных.
Конечно, при использовании метода Собянина-Суховольского совершенно не обязательно строить графики: достаточно вычислять только коэффициенты ПДИ и СРЛ, что в Excel можно делать, например, с помощью функции ЛИНЕЙН.
Например, для выборов Президента России 2008 года по данным официальной электоральной статистики можно получить такую таблицу, дающую основания для первичной оценки честности выборов в разных регионах России:
| Медведев | Медведев | ||||||
|---|---|---|---|---|---|---|---|
| % | ПДИ | СРЛ | % | ПДИ | СРЛ | ||
| Адыгея | 70% | 112% | -28% | Калужская область | 65% | 95% | -19% |
| Республика Алтай | 74% | 109% | -27% | Кемеровская область | 70% | 95% | -19% |
| Башкортостан | 88% | 152% | -58% | Кировская область | 76% | 101% | -18% |
| Бурятия | 71% | 99% | -20% | Костромская область | 62% | 74% | -7% |
| Дагестан | 92% | 115% | -21% | Курганская область | 65% | 73% | -5% |
| Ингушетия | 92% | 130% | -36% | Курская область | 64% | 93% | -19% |
| Кабардино-Балкария | 89% | 124% | -33% | Ленинградская область | 70% | 84% | -9% |
| Калмыкия | 72% | 115% | -29% | Липецкая область | 66% | 126% | -46% |
| Карачаево-Черкессия | 90% | 143% | -48% | Магаданская область | 63% | 80% | -11% |
| Карелия | 67% | 62% | 4% | Московская область | 70% | 95% | -17% |
| Коми | 72% | 92% | -15% | Мурманская область | 65% | 50% | 10% |
| Марий Эл | 77% | 163% | -71% | Нижегородская область | 62% | 85% | -15% |
| Мордовия | 90% | 183% | -85% | Новгородская область | 66% | 89% | -14% |
| Саха-Якутия | 68% | 86% | -12% | Новосибирская область | 62% | 70% | -5% |
| С. Осетия | 73% | 92% | -14% | Омская область | 63% | 89% | -21% |
| Татарстан | 79% | 170% | -75% | Оренбургская область | 61% | 78% | -12% |
| Тува | 89% | 118% | -23% | Орловская область | 66% | 124% | -43% |
| Удмуртия | 70% | 104% | -21% | Пензенская область | 71% | 111% | -30% |
| Хакассия | 60% | 72% | -7% | Псковская область | 70% | 113% | -29% |
| Чечня | 89% | 118% | -27% | Ростовская область | 77% | 118% | -29% |
| Чувашия | 66% | 116% | -37% | Рязанская область | 61% | 87% | -15% |
| Алтайский край | 60% | 64% | -2% | Самарская область | 64% | 87% | -14% |
| Забайкальский край | 66% | 83% | -13% | Саратовская область | 76% | 115% | -30% |
| Камчатский край | 69% | 67% | 1% | Сахалинская область | 64% | 58% | 3% |
| Краснодарский край | 75% | 110% | -32% | Свердловская область | 69% | 81% | -7% |
| Красноярский край | 62% | 68% | -4% | Смоленская область | 59% | 92% | -21% |
| Пермский край | 67% | 82% | -8% | Тамбовская область | 72% | 106% | -26% |
| Приморский край | 64% | 104% | -27% | Тверская область | 68% | 98% | -19% |
| Ставропольский край | 65% | 88% | -16% | Томская область | 64% | 87% | -13% |
| Хабаровский край | 64% | 77% | -10% | Тульская область | 68% | 89% | -15% |
| Амурская область | 64% | 84% | -14% | Тюменская область | 79% | 176% | -81% |
| Архангельская область | 67% | 66% | 2% | Ульяновская область | 67% | 98% | -19% |
| Астраханская область | 75% | 94% | -13% | Челябинская область | 66% | 86% | -13% |
| Белгородская область | 69% | 126% | -45% | Ярославская область | 63% | 80% | -9% |
| Брянская область | 62% | 96% | -22% | Москва | 71% | 96% | -17% |
| Владимирская область | 64% | 76% | -6% | Санкт-Петербург | 72% | 81% | -7% |
| Волгоградская область | 62% | 67% | -3% | Еврейская АО | 67% | 101% | -23% |
| Вологодская область | 69% | 88% | -12% | Ненецкий АО | 62% | 75% | -7% |
| Воронежская область | 66% | 108% | -30% | Ханты-Мансийский АО | 67% | 82% | -12% |
| Ивановская область | 65% | 72% | -4% | Чукотский АО | 81% | 137% | -50% |
| Иркутская область | 61% | 87% | -16% | Ямало-Ненецкий АО | 84% | 157% | -67% |
| Калининградская область | 62% | 58% | 3% | Зарубежная территория | 85% | 85% | -3% |
Исходные данные для этой таблицы расположены на 2750 страницах разных региональных комиссий. Сайт stat.golos.org позволяет скачать все эти данные автоматически.
Распределения УИК по электоральным показателям
Если имеются данные по большому числу избирательных комиссий, то эмпирическое распределение комиссий по какому-нибудь электоральному показателю может оказаться достаточно гладким. Более того, оно должно быть достаточно устойчиво во времени, если, конечно, в стране не происходит каких-либо катаклизмов.
Например, график распределения всего числа УИК (около 96 тысяч) по показателю явки на федеральных выборах 2007 года выглядит так:

Резкий всплеск на правом конце графика объясняется тем, что в малых по численности избирателей комиссиях явка часто бывает стопроцентной. Более полезной бывает картинка, на которой изображено не число комиссий, а общая численность избирателей в комиссиях с данной явкой (для тех же выборов, что и на предыдущей картинке):

Если число комиссий не очень велико, график будет иметь «пилообразный» вид. Для сглаживания графика и рассмотрения его «без деталей» можно использовать разные виды интерполяции, например, линейную фильтрацию или приближение полиномом:

Временная динамика распределений списочного числа избирателей по разным электоральным показателям – очень показательна для российских выборов двухтысячных годов. Приведем три примера.
Трансформацию распределения по явке в масштабах России характеризует следующий график:

А вот графики распределений списочного состава избирателей по явке на шести выборах в городе Москве:

Глядя на эти графики можно с уверенностью утверждать, что в 2008 и 2009 годах в столице нашей Родины Москве происходили чудовищные фальсификации в день голосования (хотя я обычно не употребляю столь громких эпитетов).
Еще один пример: трансформация распределения числа УИК по проценту досрочного голосования и голосования на дому на выборах в Сочи. Можно заметить, что с этими распределениями происходили превращения, тесно увязанные с повышением интереса власти к городу.

Интерес представляют распределения и по другим показателям: по проценту голосования за кандидатов, по проценту голосования по открепительным удостоверениям, по проценту недействительных бюллетеней.
Сергей Шпилькин применяет для расчета фальсификаций распределение числа избирателей, голосовавших за того или иного претендента, по показателю явки.
Изучение экстремальных результатов
Имея полную информацию из протоколов УИК, можно быстро искать экстремальные результаты – максимумы и минимумы электоральных показателей. Например, таких, как абсолютные и относительные значения голосования на дому и по открепительным, недействительных и унесенных бюллетеней, времени голосования на дому и т.д.
Когда, например, обнаруживается, что избирательная комиссия смогла обслужить 500 избирателей на дому, или что из комиссии избиратели унесли 200 бюллетеней, это вызывает серьезные подозрения. А такие и даже более абсурдные значения иногда встречаются на наших выборах (см. «Курс аномальной электоральной статистики (рекорды и награды московских выборов)»).
Приведем пример из только что процитированной статьи: «В 54-х (из приблизительно 3300) УИК доля унесенных бюллетеней была более 10%. В пяти УИК доля унесенных бюллетеней была выше 20%. В УИК №66 Красносельского района «унос» составил 26,6%; это означает, что каждый четвертый избиратель «прихватил» бюллетень с собой».
Сравнение голосования с КОИБ и без них
Если имеются сведения о том, на каких участках были установлены КОИБ (комплексы обработки избирательных бюллетеней), то можно проводить сравнительный анализ результатов голосования с КОИБ и без них, рассчитывая отдельно для каждой из этих двух категорий явку, результаты претендентов, а также другие электоральные показатели. Ниже приведена диаграмма, характеризующая сравнение электоральных показателей на выборах депутатов Госдумы в 2007 году в городе Москве. На этом рисунке показана разность результатов между участками без КОИБов и с ними.

Заметим, что к такому анализу следует относиться с осторожностью, поскольку бывает, что КОИБы устанавливают именно на тех территориях, где проживает наиболее грамотная часть населения.
Сравнительный анализ протоколов
Если на выборах производится голосования по двум или более видам бюллетеней, то чрезвычайно интересным является сравнение протоколов одной и той же участковой комиссии по разным видам голосования. Данные в протоколах по разным видам голосования связаны друг с другом, однако проверка такой связи, в отличие от проверки контрольных соотношений одного протокола, не предусмотрена законом. Иногда местные организаторы выборов проверяют эти связи по собственной инициативе, но чаще этого не делается.
Сравнение протоколов показывает, что наши участковые избирательные комиссии зачастую плохо понимают и выполняют закон.
Следует отметить, что такое сравнение имеет смысл проводить только для «открытых» участков, поскольку оно основано на сравнении данных из списков избирателей, а на закрытых участках, как показывает опыт, эти списки составляют «кто во что горазд». На «открытых» участках список избирателей един для всех видов голосования, но на «закрытых» участках (больницы, СИЗО, другие места временного пребывания избирателей) это бывает и не так.
К сожалению, данные протоколов УИК, публикуемые на сайтах, не содержат информацию о том, какие участки являются закрытыми. Кроме того, при сравнении протоколов малые участки интересуют нас в меньшей степени, чем большие. Поэтому сравнительный анализ протоколов рекомендуется проводить только для избирательных участков с общей численностью избирателей (указанной в первой строке протокола) более 1000.
Сравнительный анализ заключается в исследовании двух величин, которые можно получить, сравнивая два протокола одной и той же УИК по разным видам бюллетеней (будем условно называть их первым и вторым протоколом).
Первая величина – разность D=SP-SO, где SP- разница по первому протоколу между общим числом избирателей на момент окончания голосования (первая строка) и числом избирателей, проголосовавших по открепительному удостоверению (строка 11в протокола), а SO – аналогичная разница, вычисленная по второму протоколу.
Величина SP – это число избирателей, которые имеют право получить бюллетень по единому округу, на основании того, что они имеют место жительства на данном избирательном участке (либо были внесены в этот список на основании п.17 ст.17 Федерального закона «Об основных гарантиях избирательных прав и права на участие в референдуме граждан Российской Федерации»). Если список избирателей для голосования по первому и второму видам бюллетеней един, то величина SO – то же самое число. Поэтому величина D в этом случае должна быть равна нулю. Отклонение ее от нуля может объясняться либо неточностями подсчета, либо ошибками при перенесении данных из протокола в ГАС «Выборы», либо специфическим пониманием упомянутого пункта 17 статьи 17 (включение избирателей с временным пребыванием только в один из списков). Поэтому интересным показателем качества работы УИК является распределение величины D.
Вторая величина – разность d=VP-VO, где VP- разница по первому протоколу между общим числом избирателей, принявших участие в выборах (сумма строк протокола, в которых указано количество бюллетеней, выданных досрочно, в помещении для голосования и вне помещения для голосования) и числом избирателей, проголосовавших по открепительному удостоверению (строка 11в протокола), а VO – аналогичная разница, вычисленная по второму протоколу. Эта разница равна числу избирателей, которые получили бюллетени на основании того, что они имеют место жительства на данном участке (либо были внесены в этот список на основании п.17 ст.17 Федерального закона «Об основных гарантиях избирательных прав и права на участие в референдуме граждан Российской Федерации»). Если предположить, что такие избиратели, получали по два бюллетеня (а отказ от одного из двух бюллетеней – чрезвычайно редкое явление), то количество таких избирателей должно быть равно по обоим протоколам, то есть величина d должна быть равна нулю.
Если, например, распределение величины D имеет «размытый» вид, как на следующем рисунке, то это указывает либо на неквалифицированность большого числа УИК, либо на фальсификации.

Более подробно ознакомиться с результатами подобного рода сравнительного анализа можно в работах «Бесконтрольные соотношения протоколов избирательных комиссий» и «Курс аномальной электоральной статистики (рекорды и награды московских выборов)».