?

Log in

No account? Create an account
Mic's Journal
 
[Most Recent Entries] [Calendar View] [Friends View]

Wednesday, January 31st, 2018

Time Event
8:12p
прогрессивный регрессионный анализ
Интересная дискуссия @SlateStarCodex про алгоритмическую справедливость - то есть, про то, что делать, когда статистический анализ поддерживает точку зрения, возможно, популярную, но которая не вполне в русле линии партии и правительства. Где-то мы это обсуждали (с ikadell?) но сейчас ссылок не найду. Оказывается, человечество изобрело для таких проблем целую отдельную науку, algorithmic fairness.

Там обсуждаются статьи про анализ американского алгоритма досрочного выпуска заключенных, но те же проблемы возникают, например, и при автоматизации выдачи кредитов или продаже страховок. И вполне могут возникнуть в будущем и вообще в любых областях, включая найм на работу или инвестиции в акции.

Формализуется проблема, видимо, примерно так. Пусть мы принимаем решение о выдаче чего-то хорошего претендентам. Выдача этого хорошего 1) приятна получателю и/или нам 2) стоит нам ресурсов 3) стоимость для нас зависит от будущих событий и при выдаче точно неизвестна. Очевидно, нам хочется как-то предсказать эти будушие события и выдавать не всем претендентам, чтобы стоимость для нас была пониже. Будем называть это хорошее - кредитом, хотя исходная дискуссия и не про них. Во большинстве случаев речь идет если и не о буквальном кредите, то о кредите доверия претендентам. Стандартный подход для алгоритма принятия таких решений - минимизировать вероятность двух видов ошибок, 1 рода - выдачи кредита тому, кто его не вернет и 2 рода - невыдачи кредита тому, кто его вернет. Довольно легко уменьшить одну из этих вероятностей, увеличивая другую, так что обычно стараются найти компромисс, например, минимизировать одну из них при зафиксированной другой.

Про каждого претендента мы можем собрать информацию про некоторое количество признаков, у нас есть некоторый контроль над тем какие признаки мы собираем. Среди всех доступных признаков, есть заранее известный набор "защищенных" признаков и их значений. Если наш алгоритм в явном виде снижает вероятность выдачи кредита из-за того, что у претендента защищенное значение такого признака, то алгоритм, по определению, несправедлив. Например "негр" - защищенное значение признака раса и алгоритм, который, при всех прочих равных наблюдаемых признаках, не дает кредит негру, но дает белому, заведомо несправедлив. Избежать таких несправедливостей легко и просто, например, заведомо достаточно просто исключить защищенные признаки из нашего списка признаков. Если бы определении справедливости сводилось бы к этому, проблема была бы трививальной. Однако, алгоритмы считаются несправедливыми и во многих других случаях. По поводу этих других случаев, четкого консенсуса, видимо, нет.
Read more...Collapse )

<< Previous Day 2018/01/31
[Calendar]
Next Day >>
My Website   About LiveJournal.com