?

Log in

No account? Create an account
Mic's Journal
 
[Most Recent Entries] [Calendar View] [Friends View]

Wednesday, December 7th, 2011

Time Event
8:47p
выборы-1
Российского всплеска интереса к политике и выборам, произошедшего в последний год, мало кто ожидал. Ладно, я из-за границы привычно дисконтировал ЖЖшное недовольство, но, видимо, для властей уровень гражданской активности был неожиданен. Интерес этот вовсе не следствие фальсификаций прошлых выходных: например, куча народу, раньше политикой не интересовавшихся, записывались в наблюдатели заранее.

По многим признакам, все больше напоминает самый конец 80х, когда протест против КПСС уже оформлялся организационно, но никакой вменяемой и популярной альтернативы не было. Значит, если не задушат, впереди веселая первая половина 90х, причем не через несколько лет, а уже в 2012.

Задним числом, такой всплеск активности можно объяснять многими способами. Мировой кризис Россию стороной не обошел, так что стабильный быстрый экономический рост властям трудно ставить себе в заслугу, как они делали с 1999. Социальные медиа стали гораздо более мощным средством организации. Коррупция не столько усилилась, сколько институционализировалась и это многим показалось чересчур. Подросли мальчики, завидовавшие отцам, строившим баррикады в 91.

Я эти выборы пропустил, как пропускал с первых путинских президентских, потому что манипуляции казались чрезмерными. К тому же, как и на более ранних выборах, не было никаких приемлемых партий, чтобы голосовать позитивно, а не методом исключения. Но за последние 3 дня я эту позицию пересмотрел - сейчас я бы голосовал за Яблоко, чего не делал ни разу. Совершенно независимо от их программы, то, как они организовали систему наблюдателей на этих выборах, перевешивает и левацкую программу и прошлый раскол либеральных партий.

Интересный вопрос про "настоящие" результаты выборов, которые я тут уже пообсуждал в других журналах - про это напишу отдельно.



10:56p
выборы-2
Понятно, что фальсификации были масштабными. Вопрос в том, как оценить их масштаб и "настоящий" расклад. "Настоящесть" тут бывает разная, потому что нарушения не сводятся к вбросам бюллетеней, а грань между социальным контролем в малых группах и фальсификацией результатов бывает довольно тонкая. Если ограничиться "вбросами", то есть манипуляциями на этапе изменения количества и содержания бюллетеней, или на разных этапах подсчета голосов, то есть следующие способы оценки фальсификаций/восстановления настоящих результатов, в порядке нормальности способа.

1. Официальный, через наблюдателей и судебную систему. Этот способ хорош тем, что работает "снизу вверх" от конкретной манипуляции. Плох он тем, что жалобы или даже отчеты наблюдателей (пока) разрозненны и не систематизированы, а на судебную систему (пока?) надежды особой нет. Забавно, что прошедшая в Думу "оппозиционная" "Справедливая Россия" никакой активности на партийном уровне не проявила, даже когда у нее отбирали много голосов. А зато Яблоко, которому, видимо, и на честных выборах особо преодоление барьера не светило, вложило много сил в подготовку наблюдателей. Уже за это я им готов простить все прошлые глупости и в следующий раз проголосовать.

2. Опросы, предварительные и выходящих с голосования. Поле социологических опросов зачистили вскоре после судебного, так что особой веры им нет. Однако исчезнувший полл ФОМ может быть интересен.

3. Статистические методы. Пока что я видел в применении к эти выборам три подхода: (а)корреляция явки и доли голосов от всех зарегистрированных за Единую Россию (ЕР); (б) бимодальность совместного распределения тех же переменных; (в) анализ последних цифр - периодичность гистограммы доли голосов проголосовавших за ЕР. Еще естественен был бы подход (г) с анализом первых цифр законом Бедфорда, но он плохо работает со сложными распределениями.

(а) Корреляция. Описана, например, тут: http://www.cmi.univ-mrs.fr/~ashen/elections.pdf Облака для ЕР и других партий, действительно, выглядят по-разному. Проблема с этим подходом - в том, что неясно, как различить вбросы от наличия группы "стопроцентников" ((С) filin) - группы избирателей, которая 1) голосует за ЕР 2) дисциплинированно ходит на выбоы 3) сильно неравномерно распределена по участкам. Поверить в то, что российское население достаточно кластеризовано, чтобы разные распределения не сходились к нормальному, вполне можно. Наличие в стране ведомственных домов, воинских частей, заводов, где голосование может быть сильно концентрированным, вполне правдоподобно. Российское общество достаточно поляризовано, чтобы воспроизводить разные паттерны из стран с расовыми проблемами, а распределения на американских выборах часто сильно бимодальны из-за расово сегрегированных районов. Понятно, что часть корреляции вызвана вбросами, но оценить, какая именно часть - сложно.

(б) бимодальность. Вобщем, схожий феномен с корреляцией, еще один способ описать аномальную зависимость между явкой и голосованием за ЕР. Плюс в том, что heatmap - красивая картинка ;) Минус в том, что, в отличие от корреляции, мне неясно, ни какая модель стоит за картинкой, ни как статистически устанавливается бимодальность в отличие от других гипотез о совместном распределении.

(в) последние цифры. Часто и явка и доля голосов за ЕР слишком круглые - делятся на 10 или 5. Это мне представляется очень убедительным аргументом в пользу фальсификаций. Анализ нужно было бы проводит поаккуратнее, исключая маленькие участки, так чтобы в одну ячейку гистограммы попадало в среднем хотя бы по два-три человека. То есть, с шагом в 0.5% надо бы смотреть только на участки с более, чем 400-600 голосов. Иначе, при большом количестве маленьких участков, некоторые точки будут аномально проваливаться или выпячиваться. Например на участках с менее, чем 200 голосующих, не может быть никакой группы людей которая бы составила долю от 49.5% до 49.99999% (против отсутствия соответсвующей дроби не поможет никакая избирательная технология), а вот группы в ровно 50% есть на половине этих участков (тех, где число голосующих четное).

Недостаток этого подхода - в том, что он позволяет быть практически уверенным в наличии фальсификации, но не позволяет оценить ее масштабы - на круглую цифру в 75% можно переправить и 74% и 24%. По крайней мере, возможна разумная консервативная нижняя оценка эффекта фальсификаций - если считать, что переправляли до ближайших 5%. Это дает довольно низкую оценку в 2.5% от лишней плотности, то есть, доли процента. Чуть менее консервативная оценка сделает область, с которой "округляли", функцией всплеска плотности. Это даст более высокую оценку фальсификации, поскольку пик на 50% очень высок и в него должны были округлять с полосы процентов в 20-30. Даже в этом случае, общий эффект, думаю, будет невысок (конкретное число надо считать по данным, а не по картинке).

Другой схожий тест, который было бы осмысленно провести - это повторение двух последних цифр в числе голосов за каждую партию. В случае "случайного" числа голосов или честных выборов, вероятность этого должна быть 10% (для участков с числом голосов за сотню). Когда люди число голосов сочиняют и стараются придумать его "послучайнее", эта вероятность оказывается ниже. Данные выложены тут, но я не уверен, что у меня до этого скоро дойдут руки, так что дарю идею ;)

(г) Еще один стандартный статистический прием, который используется для обнаружения манипуляции в данных - это закон Бедфорда для первых цифр в наборе чисел. Про его применимость к результатам выборов есть сильные сомнения, однако российские участки достаточно неравномерны по размеру, чтобы хотя бы на вторую цифру стоило посмотреть.

Самыми эффективными будут комбинации подходов, например, сочетание 1, 3а, и 3в позволит проверить эффективность корреляционного подхода на участках, где нам известен результат от наблюдателей или только участках с круглыми результатами. Правда, наличие наблюдателей может быть коррелировано с отсутствием группы стопроцентников на участке, так что первый тест весьма косвенный. Еще можно комбинировать 2 и 3 через анализ поправочных коэффициентов опросов, правда для последних предвыборных и экзит поллов я их не видел.


<< Previous Day 2011/12/07
[Calendar]
Next Day >>
My Website   About LiveJournal.com