?

Log in

No account? Create an account
Mic's Journal
 
[Most Recent Entries] [Calendar View] [Friends View]

Thursday, October 15th, 2009

Time Event
5:03p
Как надо рисовать регрессии
В комментариях к предыдущему посту, vvagr дал ссылку на доклад Илларионова двухлетней давности, как раз про корреляцию явки на выборы и голосов "кандидата власти": http://www.iea.ru/article/polit_svoboda/26-12-07.ppt

В докладе он прямо таки определяет индекс честности выборов как эту самую корреляцию. По этому индексу, например, американские выборы 2004 и второй тур украинских выборов 2004 идеально честные, с корреляциями от -7% до +5%, то есть, без зависимости между явкой и процентом кадидата власти. Картинки там такие:
Америка-2004Collapse )



Украинская картинка называется "2-й раунд, 31 октября 2004 г.", что несколько запутывает, потому что выборы 2004 прошли в три раунда (много кандидатов 31.10, Ющенко против Януковича 21.11 и переголосование после Майдана 26.12). Официальные данные лежат тут и из них видно, что точки на слайде больше всего похожи на второй раунд от 21.11.

Интересно, однако, не это. А то, что, хотя по илларионовскому индексу честности эти выборы просто образцовые, не хуже американских, посмотрев на картинку чтуь внимательнее можно заметить, что точки лежат полумесяцем. В тех областях, где победил Ющенко, есть сильная положительная корреляция между явкой и его процентом голосов; такая же корреляция есть в тех областях, где победил Янукович, между явкой и голосами за Януковича.

Наверное, Илларионов как-то комментировал это устно на докладе, но на слайдах это отражения не нашло. Использование в такой ситуации регрессии по всей выборке либо бессмысленно, либо грубая манипуляция: в расколотой стране выборы могут иметь индекс фальсификации сколь угодно низкий при полном жульничестве на всех участках.

Официальные данные по ссылке выше лежат в формате, который мой Эксель читает напрямую, так что посчитать корреляции корректно несложно. Получилось довольно забавно. Во втором раунде для "голубых" областей R^2 высокое, 0.75, для "оранжевых" оно пониже, но тоже немаленькое 0.50. В третьем раунде "голубое" R^2 слегка вырастает до 0.80, зато "оранжевое" его почти догоняет, дойдя тоже до 0.75. То есть, если считать жульнической победу Януковича во втором туре, то победа Ющенко в третьем туре жульническая ровно настолько же (с точностью до третьего знака ;) Украинские значения R^2 по победителям совершенно огромные: 0.75 соответствует корреляции аж в 87%.

Две картинки с правильными регрессиями для второго и третьего раунда украинских выборовCollapse )

Вобщем, мне из этого кажется, что корреляция между явкой и голосами победителя бывает и просто от мобилизации электората, а не от вброса. Ну или наблюдатели ОБСЕ врут про честность выборов ;)


<< Previous Day 2009/10/15
[Calendar]
Next Day >>
My Website   About LiveJournal.com