Не кинокритик. Не палеонтолог. (plakhov) wrote,
Не кинокритик. Не палеонтолог.
plakhov

Categories:

Об Байеса - 1.5

Продолжение-пояснение, начало здесь.

Я обещал, что эта часть будет последней, почитав комментарии к предыдущей, я понял, что вас обманул. Придётся сделать промежуточные разъяснения, потому что начало поняли не все, включая людей, в интеллектуальных способностях которых я абсолютно не сомневаюсь.

Аргумент букмекерской вилки (мой перевод словосочетания Dutch book argument) решает следующую задачу. Язык теории вероятностей на практике применяется не только для описания событий, относящихся к будущему, ещё не произошедших, но и для описания текущего состояния мира. Возможность использовать утверждения вида "с такой-то вероятностью мир устроен так-то" принципиальна для многих работающих и респектабельных методов, от байесовских методов в медицинской статистике до логистической регрессии. Хотелось бы иметь обоснование того, почему "так можно", о каких величинах мы на самом деле при этом говорим и какое отношение они имеют к классическим вероятностям a la Колмогоров. Хотя бы для того, чтобы разобраться, а в каких же ситуациях "так нельзя", ради чего я, собственно, эти заметки и пишу.

В комментариях к первой части есть повторяющаяся тема: читатели считают, что применимость теории вероятностей на практике тесно связана с многомировой интерпретацией или, по крайней мере, на это прозрачно намекают. Я понимаю их идею так: вероятность это "просто" доля тех миров в мультивселенной, в которых событие произошло. Для них фреквентистский подход в многомировой интерпретации является лучшим оправданием применимости теории вероятностей к реальной жизни, нежели байесовский в моём изложении.

Подумав обо всём этом, я понимаю эмоциональную привлекательность такой точки зрения. Идея, что "вероятности" объективны и, хотя бы теоретически, поддаются строгому измерению, действительно, может показаться более сильной, нежели идея, что они субъективны. А аргумент, в ходе которого субъекты должны заключать какие-то там пари, ещё и выглядит искусственным (по крайней мере, на первый взгляд). Кроме того, идея "мультивселенной" очень наглядна, визуальна и много раз проиллюстрирована Голливудом и прочими медиа. "В конце концов, это просто красиво". Я с такой точкой зрения, тем не менее, абсолютно не согласен сразу по многим причинам.

Во-первых, существование "мультивселенной" в таком представлении (бесконечное множество слегка отличающихся параллельно существующих миров) вообще не является доказанным утверждением. В частности, многомировая интерпретация квантовой теории на самом деле выглядит совершенно иначе и гораздо сложнее, чем в Футураме. На эту тему сложно писать, не погружаясь в формулы, но, вкратце, в ней даже нет никаких вероятностей, вместо них есть "амплитуды", комплексные числа. В "вероятности" они превращаются только в копенгагенской интерпретации, которая как раз предполагает их зависимость от некоторого субъекта-наблюдателя. Если кому-то интересно в этом разобраться детально, я очень рекомендую Скотта Ааронсона. Начать можно, например, отсюда. Или, если мультики вам нравятся больше, то, в отличие от Футурамы, "Рик и Морти" в s2e01 справились с задачей гораздо, гораздо лучше!

Во-вторых, требуя, чтобы вероятности были объективными величинами, мы запрещаем себе задавать многие интересные вопросы, например, "с какой вероятностью Икс жулик". Действительно, сам Икс знает это совершенно определенно, то есть для него эта вероятность или 0, или 1. Если вероятности объективны, то это означает, что и для остальных наблюдателей она должна оказаться той же самой. Идея, из которой следует, что любой, например, кредитный скоринг никак фундаментально не обоснован и по является не более чем карго-культом, мне кажется чересчур уж смелой (мне не кажется смелой идея, что это действительно так иногда, в некоторых организациях).

В-третьих, хуже того, в целом лишаются смысла утверждения "объект принадлежит к интересующему нас классу с вероятностью p". В машинном обучении и так немало математизированных приёмов, которые мы применяем только потому, что они работают, а не потому, что умеем строго их обосновать (многие виды регуляризации, например). Усугублять эту проблему, признав непонятно как работающей магией примерно все применяемые на практике методы классификации, это уж как-то совсем смело.

В-четвертых, давайте разберём, что означают утверждения о вероятностях, которые всё-таки имеют смысл говорить в фреквентистской мультивселенной. Например, точный смысл утверждения "жизнь на поверхности Марса в настоящее время маловероятна", если я правильно понимаю оппонентов, оказывается сложной условной частотой: доля тех Марсов, на которых есть жизнь, среди всех Марсов во всех возможных мирах, в которых есть мы и есть Марс, выглядящий с точки зрения землян в точности так же, как наш. Мне кажется очевидным, что эта вероятность далека по смыслу от той величины, которая на самом деле имеется в виду теми, кто подобное предложение произнесёт. Мне также кажется очевидным, что как-то оперировать с подобными величинами человечеству пока что совершенно не под силу чисто вычислительно, и на практике никто этим, конечно, не занимается.

В-пятых, наконец, если вас всё это не убедило, я скажу ещё одну вещь: ну и что :) Даже если "многомировые вероятности" после всего сказанного по-прежнему кажутся вам жизнеспособной концепцией, это никак не отменяет того, что аргумент букмекерской вилки является совершенно другим, никак на это не опирающимся и никак ему не противоречащим, объясненим того, почему теорвер так хорошо работает на практике.
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 26 comments