?

Log in

No account? Create an account

Не кинокритик. Не палеонтолог.

фев. 25, 2018

04:39 pm - Об Байеса - 1.5

Продолжение-пояснение, начало здесь.

Я обещал, что эта часть будет последней, почитав комментарии к предыдущей, я понял, что вас обманул. Придётся сделать промежуточные разъяснения, потому что начало поняли не все, включая людей, в интеллектуальных способностях которых я абсолютно не сомневаюсь.

Drinking game: drink when anyone says the word "очевидно"Свернуть )

фев. 18, 2018

11:33 pm - Об Байеса - 1

Как-то давным-давно я пообещал одному коллеге рассказать, почему верить современным рационалистам (e.g. Элиезеру Юдковскому) стоит с большой осторожностью, и почему я считаю многие из их построений граничащими с мошенничеством. К сожалению, природа данного вопроса такова, что потребуется текст немалых размеров. И я решил, раз уж все равно писать, сразу немного причесать его и выложить на всеобщее обозрение. Это первая часть, вводная.

Тема, интересующая нас, высокоабстрактна и граничит с философией и формальной логикой, так что если кому станет скучно, я предупредил.

Общая структура моего аргумента такова. Современные рационалисты несут на своих знаменах формулу Байеса и употребляют слово "байесианство". Пропаганда соответствующих методов мышления и методов корректировки когнитивных ошибок является важной частью их деятельности. Существует, однако же, класс ситуаций, в которых байесовский подход абсолютно, вопиюще неприменим и, по зловещему совпадению, этот класс ситуаций тесно связан со смежными интересами (в том числе денежными) многих современных рационалистов, включая некоторых лидеров движения.
Под катом вы узнаете, почему Гарри Поттер никогда...Свернуть )

янв. 20, 2018

05:29 pm - Продвижение с KIC8462852 или как я продолжил искать инопланетян и в процессе нашёл людей.

Буквы в блог пишутся быстро, но небесные тела обращаются годами, и астрономы спешить не привыкли.
Начало истории можно прочитать здесь. Теперь уже известно, что некоторые предположения, изложенные в том тексте, неверны, но это нормально.
В прошлом году мы с соавторами доделали первую статью про частичное решение этой загадки и на прошлой неделе она вышла в записках Королевского Астрономического Общества. Решение частичное, поэтому ответа на вопрос "инопланетяне или нет" статья не содержит, хотя, на мой взгляд, и делает гипотезу астроинженерных сооружений чуть менее вероятной. Но вообще  только в прошлом году я как следует прочувствовал принцип "Any Sufficiently Advanced Civilization is Indistinguishable from Nature" (это самостоятельное утверждение, а не вариант третьего закона Кларка, хотя, конечно, форма с него скопирована). Теперь мы практически уверены в том, как выглядит по крайней мере одно из тел, обращающихся вокруг звезды KIC8462852, выглядит оно необычно, но всё же похоже на вполне естественные объекты. Мы не знаем, как такая конфигурация могла бы возникнуть естественным образом, но не уверены и в обратном.

Упрощая, мы установили, что часть непонятных затмений с очень высокой точностью объясняется гигантской планетой-недозвездой (как минимум в 15 раз тяжелее Юпитера), окруженной системой исполинских колец. Традиционно в астрономии считалось, что кольца такого размера неустойчивы и за пределом Роша быстро (по астрономическим масштабам) конденсируются в луны. По какой-то причине для нашей звезды это не так, что означает, что некие катаклизмы соответствующих масштабов либо мешают лунам образоваться, либо постоянно генерируют новое вещество для колец. Из-за этого сообщество даже окрестило один из вариантов нашей гипотезы Lovecraftian system ("Лавкрафтова система").

Готовые астроинженерные сооружения выглядели бы не так, но вот процесс их создания как-то так и должен быть устроен, и не очень понятно, как быстро отличить постройку Dyson swarm от масштабных выбросов вещества другой природы. Законы тяготения и, соответственно, возможные орбиты, не отличают искусственного от естественного, так что нечто подобное мы наблюдали были и в случае, если бы некто разбирал планету-гигант или её луны "на кирпичи".

Остальные подробности и соображения я тут записывать не буду, а то это займёт у меня большую часть дня, но чисто человеческие выводы хочу записать, поскольку они имеют собственное значение, возможно, даже большее.

1) Не боги горшки обжигают. И я, и два моих соавтора не профессионалы (правда, Bruce Gary много лет работал радиоастрономом, в том числе в JPL, но он давно на пенсии).
2) Человеческая жизнь обладает очень высокой потенциальной плотностью. Может показаться, что на эту деятельность, не имеющую прямого отношения к остальной моей жизни, я должен был потратить гигантские ресурсы, и от этого пострадала или моя работа, или семейная жизнь, или здоровье. На самом деле на всё про всё ушло несколько разрозненных выходных, в общей сложности, может, часов тридцать. Это эквивалент просмотра пары сезонов "Игры Престолов" (которую я так и не посмотрел, возможно, и из-за этого).
3) Английский язык это единственное средство международного общения и огромное преимущество, если хочешь добиться хоть чего-нибудь. Быть носителем этого языка в качестве родного -- огромная фора. К этому можно относиться с сожалением или нейтрально, но это факт.
4) Абсолютным ресурсом является взаимное доверие и чистые помыслы. Моего первого соавтора зовут Мохаммед (этот факт он везде, кроме официальных документов, скрывает, предпочитая называть себя Рафик), и мы находимся в абсолютно разных культурных контекстах. Первоначально это обстоятельство вызывало у меня заметное, хоть и неопределенное, беспокойство. Но мне даже не очень за это стыдно, потому что он, в свою очередь, узнав, что я из России, первым делом попросил меня подписать формальный NDA :) Тем не менее, эти глупости мы преодолели очень быстро, поскольку оба не интересуемся индексами цитируемости, вопросами приоритета, и, конечно, не имеем в этой истории каких-то денежных интересов. Это позволило нам интегрировать третьего соавтора мгновенно и в итоге привело к появлению в ноосфере пусть и небольшого, но принципиально нового куска знания.
5) Человеческая жизнь не кончается ни в 30, ни в 40, и пока ты жив, ты что-то можешь. Одному их моих соавторов за 60, второму вообще под 80 лет. Я узнал об этом совершенно случайно (мы знакомы только по переписке) и ближе к концу работ.
6) Синергия это здорово. Я умею писать программы, R. Bourne обладает огромной астрономической эрудицией и способен аккуратно и въедливо генерировать гипотезы и дорабатывать численные результаты до достижения "физичности", а B. Gary фантастически хороший наблюдатель, обладает необходимой аппаратурой и, что также немаловажно, знает, как принято писать и печатать статьи в этой области. По одиночке мы едва ли что-то сделали бы.

Вообще, я уверен, если бы все в мире доверяли друг другу и были чисты помыслами, за жизнь одного поколения можно было бы построить хоть коммунизм, хоть либертарианство, хоть царство Божие, и они не так уж отличались бы друг от друга. Жаль, что это не так, но стоит пытаться поддерживать хотя бы островки такого поведения и хотя бы иногда.

авг. 13, 2017

10:00 am - Пусть сверху повисит

Пожалуйста, прочитайте название журнала перед тем, как просить совет насчет репертуара видеосалона. Я - не он. Спасибо.

Для тех, кто пришел по ссылке из списка ЖЖ-науки: и это тоже какая-то ошибка. Я не биолог и даже не ученый.
В палеонтологи меня записали, видимо, за пост про тиранозавров (хотя в нем ясно сказано обратное). Ну или, может быть, за один из этих:
http://plakhov.livejournal.com/104586.html
http://plakhov.livejournal.com/103042.html
http://plakhov.livejournal.com/100670.html
Может быть, какой-нибудь из них вам даже понравится.

Но вообще-то учился я на мехмате МГУ, кандидатскую защищал по 05.13.11, работаю в Яндексе, занимаюсь качеством поиска (чем-то средним между программированием, матстатистикой и лингвистикой). До этого несколько лет делал компьютерные игры (в Nival Interactive и в паре куда менее известных компаний), хорошие. Увлекаюсь чем попало всем сразу, читаю много умных книг (не настолько много, как некоторые), иногда пишу сюда что-нибудь научно-популярное.

На всякий случай: статью на "Мембране" про искусственный интеллект, собравшую 15 тысяч комментариев, писал я, но было это почти 10 лет назад, и сейчас она кажется мне наивной и неполной; не нужно по ней судить о чем бы то ни было.

Добавлено 21 февраля 2014 года: нет, в Яндексе не вносят изменения в результаты поиска по политическим мотивам, не скрывают от народов важные новости, не манипулируют в пользу Путина или Ктулху баллами пробок и темами дня в блогах и т.д. и т.п. Если бы тут так делали, я бы тут не работал. Нет, от меня не скрывают, и да, я уверен. Вносить секретные изменения в поиск втайне от меня и моих коллег технически не особенно реально. Если вам кажется, что что-то такое происходит, это, скорее всего, когнитивное искажение (вот такое: Гугл показывает Страшную Новость, а Яндекс - нет? Цензура! Яндекс показывает Страшную Новость, а Гугл нет? Ну мало ли). Подробнее конкретные случаи можем обсуждать в комментариях к этой записи.

авг. 5, 2017

02:57 pm - На Марс

Внезапно стало интересно, а что там у Маска?
Раньше я (с чужих слов, наверняка очень упрощенно и во многом неверно) представлял себе ситуацию со SpaceX так:
  - гордиться компании, несомненно, есть чем: в космос совсем не все умеют летать, прогресс прогрессом, но за пятьдесят лет первая космическая ничуть не уменьшилась и физическая реальность менее упрямой не стала
  - успехи эти вовсе не с нуля достигнуты и тем более не являются заслугой гения лично Маска. Говорят об индульгенциях и привилегиях (в исходном значении этого слова, от privus и lex): нарушения компанией патентов никого не интересуют, секретная документация на аналогичные гос.технологии в случае необходимости оказывается легко доступна, некоторые инфраструктурные вещи и нормативные акты возникают как бы для всех, но фактически специально под Маска и т.п. Говорят также о чудовищных условиях работы: 70-часовая рабочая неделя, оплата ниже рынка, общее ощущение "винтика в машине", тотальное разделение работников и бенефициаров
  - Маск, тем не менее, не только бизнесмен, политик и публичная фигура, но и компетентный и талантливый инженер. Думаю я так не потому, что что-то о нем такое знаю, а потому что видел hi-tech организации, руководимые людьми, плохо представлявшими, что именно под капотом, и не очень хотевшими об этом думать. They, если выражаться по-интернетовски, cannot into space совершенно точно
  - при этом PR у SpaceX сильно более громкий, нежели реальные достижения (например, многоразовыми первыми ступенями обещали уменьшить стоимость вывода на орбиту чуть ли не в десятки раз, сейчас споры ведутся вокруг того, а жизнеспособная ли это коммерчески технология в принципе; на МКС все как летали на "Союзах", так и продолжают, на условную Луну SpaceX пока очень рано, не говоря уж о Марсе, ну и т.п.)
  - при этом, повторюсь, прогресс какой-то, несомненно, есть. Для космоса, где технологии восьмидесятых считаются новыми, куда новые поколения не очень-то смотрят в целом, и давно уже не идут массово работать лучшие из лучших в частности, это само по себе круто.
Всё так или я всё переврал? Что-нибудь за последнюю пару лет в этом смысле изменилось?

Tags:

фев. 20, 2017

11:14 pm - KIC 8462852 опять

Скажите, а совершенно случайно кто-нибудь из вас или ваших знакомых в ближайшие два-три ночи не наблюдает за сабжем? Можно будет узнать у вас/у них, что там -- хотя бы на уровне "да или нет", и если да, то когда началось-закончилось? Мы тут неожиданно выяснили, что у нас, конечно же, в самый подходящий момент может ничего не оказаться, кроме наблюдений AAVSO :(

июл. 15, 2016

02:09 pm - Встреча

Если вы всерьез занимаетесь программированием, живёте в Москве, и хотите посоциализироваться, заходите вот сюда:
https://events.yandex.ru/events/meetings/04-aug-2016/

Это 4 августа (будний день), с семи вечера. Бесплатно, но с предварительным отсевом на этапе регистрации.
Там будет мини-конференция, где коллеги что-нибудь расскажут, но это, наверное, не главное. Главное, что, если хорошо пойдет, это имеет некоторые шансы превратиться во что-то вроде цехового клуба "для своих" с хорошим отбором на входе, а участие в таких штуках дорогого стоит.

июн. 25, 2016

03:15 pm - Очень серьезное про инопланетян с KIC 8462852

Я тут решил поиграть в астродетектива и попробовать понять, что всё-таки творится со звездой KIC 8462852. Это очень интересная загадка: найдено какое-то явление, уникальное в масштабах известной Вселенной, все имеющиеся данные доступны, буквально можно скачать и что-то начинать делать, даже не будучи профессионалом, но ничего похожего на решение вот уже несколько лет нет. Я посмотрел на данные, что-то интересное, как мне кажется, смог понять, и сейчас расскажу, что. Это не полная разгадка, конечно же, а всего лишь некоторое продвижение по самой волшебной и загадочной ветке размышлений. Конкретнее, вопрос такой: если вокруг ЧЗХ-звезды все-таки вращаются искусственные мегасооружения, то что мы уже сейчас можем сказать об их размерах, форме и орбитах? Достаточно ли это "реалистично" будет выглядеть, будет ли результат такого подсчета скорее в пользу астроинженерной гипотезы, или скорее против неё? Этим вопросом профессиональные астрономы почти не занимаются, несолидно, а обывателей типа меня он как раз интересует сильнее всего.
И получается, что у них по ТРИ ноги!Свернуть )

Tags:

апр. 5, 2016

03:58 pm - У нас есть ТАКИЕ приборы \\ Но мы вам о них не расскажем

Неожиданно для себя обнаружил, что могу оставить нетривиальный комментарий о скандале с панамскими оффшорами, хотя не разбираюсь в сути вопроса примерно ни на бит.

https://www.reddit.com/r/MachineLearning/comments/4d7t1h/panama_papers_dataset/

Q: I'm looking hard online, and I can't find the panama papers for download. But journalists across the world have access to it. Anyone have any idea how to obtain it?

It's a few terabytes, which seems intimidating, but it takes about a day to process petabytes on AWS. To find the names of people involved, we would need to run a PoS tagger in a map job. Might not take all that long to find names in 11.6mil files.

It's also possible to dump it all into AWS elastic search, and make it more easily searchable.

It feels to me like this is the kind of problem big data was made to solve... and something like this is too precious to be left to journalists alone.

A: Data is likely not going to be released unmodified


Там есть обсуждение, чем это может быть вызвано, но, так или иначе, фактическая сторона дела простая: на данные посмотреть нельзя, к ним есть доступ только у выделенных журналистов, в свою очередь, получивших их из неизвестного им источника. Данные не структурированные, поэтому работа с ними требует нетривиальной софтверной обработки (как минимум, OCR и named entity recognition) и анализа, качество проведения и того, и другого проверить извне невозможно. Такое положение дел, скорее всего, навсегда.

Я сейчас очень постараюсь сформулировать свои выводы политически нейтрально, не поддаваясь предубеждениям.
Так вот, из всего этого следует вот что:
1) любое позитивное утверждение об этом скандале (например: такие-то люди контролируют такие-то деньги таким-то способом) можно рассматривать как повод начать независимую проверку этого утверждения, и как источник информации о том, куда стоило бы при этом смотреть. Я не могу представить себе доводов, согласно которым расследованию на основе данных, имеющих такую природу, следовало бы доверять как есть. Даже если принять, что мы абсолютно верим сотрудникам СМИ, их производившим. Можно также делать какие-то выводы из того факта, что проверка после некоторого подобного позитивного утверждения не начинается.
2) негативные утверждения об этом скандале (например: о таких-то людях в связи с этим скандалом не упоминают) можно интерпретировать таким количеством способов, что они почти лишены смысла.

Ещё можно сделать один нетривиальный мини-вывод: если известный человек обладает распространенной фамилией, например, Джонсон, Иванов, О'Брайен или Санчес, то шансы, что мы узнаем о нём что-то благодаря этому сливу, очень малы.

Tags:

мар. 28, 2016

10:08 am - Tay, Гитлер и все-все-все

В прессе и в ЖЖ обсуждается интересная сплетня: мол, твиттер-бота Майкрософтовского производства злые пользователи за сутки научили ругаться матом выдавать расистские твиты, хвалить Гитлера и Холокост, и даже агитировать за Трампа (вот это особенно ужасно!)

Пикантности добавляет то, что высказывания Taи были для бота крайне осмысленными и довольно смешными (тип юмора специфический, но не уникальный, такого много, например, на 4chan-е или на Луркморе). В общем, Скайнет пробудился, но вместо ядерной войны занялся shitposting'ом.

Историю СМИ переводят, пересказывают или перепечатывают друг у друга, поэтому, хотя все описывают произошедшее примерно одинаково, скорее всего, дело было совсем не так. Я сейчас расскажу, как на самом деле был устроен Tay и в чём главная интрига. Я свечку не держал, но понимаю, как сделать силами двух стажеров систему, которую опишу ниже, и совсем не понимаю, как сделать тот Strong AI, который описывался в прессе. При этом мой вариант все наблюдаемые события объясняет без привлечения дополнительных сущностей.

Итак, Тая представляла собой машиннообученный классификатор, который по паре твитов "вопрос - ответ" (или "твит - реакция") предсказывает, сколько лайков и ретвитов получит второй твит в паре. Кроме этого у неё была очень большая база исторических твитов реальных людей. Получив вопрос, Taя собирала из предложений, доступных в этой базе, лучший ответ согласно этому классификатору (ну или не собирала из предложений, а "генерировала" какой-нибудь обученной на ней рекуррентной сеткой, это не так важно) и постила от своего имени.

Никакие пользователи за сутки её ничему не учили, я вообще не думаю, что там присутствовало какое-то онлайн-обучение. Никаких политических взглядов у неё не было и быть не могло. Все неполиткорректные твиты уже были в её базе с самого начала, злым анонимусам оставалось открыть возможность их провоцировать.

Главная интрига всей истории с моей точки зрения состоит в том, рассчитывал PR Майкрософта на такое развитие событий, или оно застало их врасплох. Т.е. умысел это был с их стороны или некомпетентность. Я склоняюсь к первому, потому что история разлетелась очень широко, а для имиджа MS оказалась, скорее, приятной (вот какие большие огурцы продаются в наших магазинах).

Navigate: (Previous 10 Entries)