Category: it

Category was added automatically. Read all entries about "it".

child pic

Очередное фиаско машинного обучения

алгоритмы не проявляют социальной сознательности и делают неполиткорректный вывод, что негры чаще ругаются нехорошими словами ("offensive language") в твиттере, чем белые (via birdwatcher, oригиналы исследований тут и тут.) Примечательно, что в первой работе проблематичным сочли уже сам вывод, что черные могут чаще сквернословить, независимо от его фактической верности. Авторы второй, хотя бы, посадили специально обученных исследователей, которые знали, какой расы пишущий твит, и правильно понимали, что неграм так ругаться можно, не классифицировали их твиты как оскорбительные, и поэтому смогли показать, что алгоритм ошибается и дискриминирует негров.

Вообще, страшная наивность со стороны исследователей надеяться, что слепые к расе и прочим защищенным признакам пишущего алгоритмы могут определять offensive или hate speech так, чтобы это удовлетворяло современное американское общество. Стандарты позволенного поведения явно сформулированы так, что специальному набору привилегированных групп позволяется куда больше, чем простым людям.

При этом для не слепых к защищенным признакам алгоритмов задача довольно проста и даже не требует особого машинного обучения для вполне приличной точности. Дело в том, что семантическая система сейчас радикально упрощена по сравнению с табу в другие времена и в других обществах. Например, в Советском Союзе 70х можно было вылететь с работы и/или получить разные неприятности за выкрик, скажем, "Да здравствует фашизм!", но просто за употребление просто слова "фашизм", или любого другого, в подходящем контексте, санкций не следовало ни для кого. А сейчас страшное "n-word", аналогичное русскому "негр", настолько запретно, что административное расследование начинается даже из-за употребления слова в максимально санитизированном академическом контексте, когда профессор с неправильным цветом кожи цитирует черного корифея. Мне как-то не приходит в голову, когда в предыдущий раз в европейской культуре был такой запрет на слова в реальности, а не в фантазийном контексте (типа "неназываемого" Вольдеморта.) В любом случае, задачу алгоритмической классификации это радикально упрощает, просто нужно сначала явно сообщать алгоритму, что именно разрешено автору высказывания в текущей социально-политической ситуации и в соответствии с его набором расовых и половых признаков.
child pic

DAO "theft"

http://www.bloomberg.com/view/articles/2016-06-17/blockchain-company-s-smart-contracts-were-dumb
Интересный комментарий к текущему скандалу с блокчейн фондом DAO.

Романтики безгосударственного капитализма сначала написали

The terms of The DAO Creation are set forth in the smart contract code existing on the Ethereum blockchain at 0xbb9bc244d798123fde783fcc1c72d3bb8c189413. Nothing in this explanation of terms or in any other document or communication may modify or add any additional obligations or guarantees beyond those set forth in The DAO’s code. Any and all explanatory terms or descriptions are merely offered for educational purposes and do not supercede or modify the express terms of The DAO’s code set forth on the blockchain.


Но как только кто-то понял их умный контракт лучше, чем они сами понимали, и увел у них денег, то они сразу решили грохнуть не только сам этот умный контракт, но и всю систему умных контрактов. То есть, код в блокчейне кодом, ни как только влиятельные люди могут денег потерять, сразу без всякого суда и кодекса конкретные куски криптоденег объявляются несуществующими. На очереди теперь сотворение куска криптоденег мимо протокола (hard fork.)

Интересно, сколько раз им надо будет в такое вляпаться, чтобы понять, зачем нужны законы, суды, центральный клиринг, центральный банк итд.
child pic

...только нажимать кнопки и расставлять галки в чекбоксах

Радикально неверный подход к организации относительно нетривиальной работы проповедуется в замечательном журнале infowatch: Вот поэтому, с точки зрения рисков, встроенные языки программирования – зло. Нельзя давать работникам писать программы. Их надо загнать в жёсткие рамки интерфейсов. Только нажимать кнопки и расставлять галки в чекбоксах. Любые команды, любой программный код – опасны для вашего бизнеса.

Написать хорошее стабильное программное обеспечение и посадить работников им управлять через красивые дружественные к пользователю интерфейсы - вполне можно. Сделать это обеспечение достаточно гибким - трудно в быстро меняющихся областях, но можно, хотя уже и заметно труднее и дороже. Некоторые работники, раньше писавшие скрипты, будут довольны, другие заскучают и разбегутся - это не беда, можно нанять новых, тем более, что чтобы галки расставлять их найти несложно. Среднесрочно операционные риски и потери при такой организации часто заметно снижаются.

Проблемы появляются когда заметное число старых работников уходит на пенсию/выгоняется/уходит в топ-менеджеры. Новые, которые галки расставляют, уже гораздо хуже понимают как там все за фасадом красивого окошка устроено. Вот как это происходит на самолетах:

It’s quite possible that Bonin had never flown an airplane in alternate law, or understood its lack of restrictions. According to Camilleri, not one of US Airway’s 17 Airbus 330s has ever been in alternate law. Therefore, Bonin may have assumed that the stall warning was spurious because he didn’t realize that the plane could remove its own restrictions against stalling and, indeed, had done so.

В финансах регулярно происходит тоже самое, только развитие более быстрое и цикл работников еще короче. Вот поэтому с точки зрения катастрофических рисков расстановка галок в чекбоксах - зло. Только Python, только хардкор!;)


child pic

Гугль закрывает RSS аггрегатор reader.google.com

На мой взгляд, довольно грубо нарушая тем самым свой давешний принцип "do not be evil". Создают кучу неудобств и читателям, и многим блогам, ради более агрессивного продвижения своего бессмысленного google+.

Теперь надо бы постепенно подыскать замену gmail - через несколько лет запросто могут отключить или попытаться агрессивно монетизировать. Хорошо, что у меня адрес на отдельном своем домене и на gmail только форвард.

Впрочем, если они прикроют gmail, то волна гнева может и регуляцию принести, на манер водопровода ;)

child pic

О тщете криптографии

Вот так обычно и бывает:

1 October 2012: 10. Как вы гарантируете, что мои личные данные не попадут в руки злоумышленников, или, еще хуже, государства?
Мы добиваемся этого единственным возможным способом — мы вообще не храним персональные данные ни в каком виде. Сразу после регистрации, каждый избиратель представляется в базе данных ЦВК с помощью уникального кода, который вычисляется по его ФИО и дате рождения, но восстановить исходные персональные данные избирателя с помощью этого кода невозможно. 
Сервера, на которых проводится голосования, размещены в современных датацентрах за пределами России, и снабжены надежными системами защиты от DDoS-атак. 


24 October 2012: мы скриптом прогнали все имеющиеся у нас в базе телефоны через функцию "восстановление пароля" на сайте МММ, что позволило нам достоверно определить, на какие из номеров телефонов, присутствующих в нашей базе, зарегистрированы личные кабинеты участников их системы). 

То есть, все телефоны зарегистрировавшихся для голосования в КС были скриптом залиты на сервер МММ, которых естественно считать противником или на службе у противника:() уж проще было все данные о регистрирующихся публиковать открыто с самого начала.


child pic

little bobby tables

На некоем сайте, дерущем грабительские рыночные цены за разные билеты, сегодня очень смешно пишутся названия опер, типа "L elisir d amore". Вчера вечером все было написано правильно, "L'elisir d'amore", зато при попытке зарезервивать билет на этот самый эликсир выдавалось сообщение об синтаксической ошибке SQL рядом со словом elisir.

Умелые люди могли бы написать оперу про маленького Bobby Tables с подходящим названием и окупить постановку за счет этого сайта ;)