Основные элементы графа причинности
Познакомимся теперь с основными способами построения схем причинно-следственных связей, (причинно-следственных диаграмм, графов причинности). Напомним, что эти диаграммы строятся при решении проблем для отображения экспертных знаний и догадок (гипотез), путём логического анализа, и не основываются на предварительно собранных данных. Мы можем использовать их далее для организации сбора данных, для построения прогнозов, включая ответы на контрфактические вопросы, для принятия решений о каком-то действии, либо когда мы просто хотим создать хорошее объяснение и убедить в нём другого агента.
Граф причинности — ациклический направленный граф*.*
События в нём представлены узлами графа (квадратиками с подписями). Подписи событий могут быть сформулированы в форме факторов — они выглядят как обобщенные события:
Например:
«Время перед телевизором» значит «Некто проводит время перед телевизором»
«Ожирение» значит «Некто страдает ожирением»
Стрелочки между событиями – это связи причина-следствие, стрелочка идёт от причины к следствию. «Направленный граф» означает именно это – что у каждой связи есть направление.
События в графе причинности расположены последовательно, и если пойти по стрелочкам, то нельзя вернуться к тому событию, от которого ты начал. В графе причинности нет циклов, он «ациклический».
Мы видим граф с двумя узлами-событиями, который показывает, что существует причинно- следственная связь между событиями. Событие*«*Человек проводит время перед телевизором», как мы предполагаем, является причиной для следствия *«*Этот человек страдает ожирением».
Медиатор****ы
Причинно-следственная связь между двумя событиями должна подтверждаться данными собранными при наблюдениях и в экспериментах. Но мы уже обсуждали, что лучшие объяснения – это те, где механизм причинно-следственной связи показан явно. Это значит, что связь между причиной и следствием должна быть «очевидна» на релевантном уровне подробности, и с учётом сделанных допущений. Если механизм связи не ясен из построенного графа, то его можно улучшить стандартным способом – развернуть объяснение.
Для этого мы используем возможность вставить новое событие между причиной и следствием. Это событие должно быть более понятным следствием исходной причины, и одновременно более понятной причиной для исходного следствия. То есть это – событие-механизм, с помощью которого реализуется связь. Как мы обсуждали, если мы не можем объяснить механизм связи, то возможно связи и нет. Если мы не знаем, как это работает, то, возможно, это и не работает.
Событие, которое мы ставим между причиной и следствием, мы назовём медиатором (М) https😕/ru.wikipedia.org/wiki/Медиация_в_статистике.
На нашем графе причина — много времени, проводимого перед телевизором; следствие — ожирение.
Для подтверждения нашей исходной гипотезы мы вставляем в граф медиатор (промежуточное событие, объясняющее механизм получившейся связи). Им может быть недостаток физической активности.
Но мы можем предположить, что связь существует ровно в обратном направлении – человек с излишним весом ограничен в своих активностях, поэтому проводит много времени дома, и делать ему особо нечего, кроме как смотреть телевизор.
Теперь мы можем проверить, подтверждаются ли наши гипотезы о влиянии медиаторов.
Например, если мы обнаружим, что люди с лишним весом прекрасно находят себе занятия за пределами своего дома – это аргумент в пользу того, что верна именно наша исходная гипотеза.
Мы также можем предположить другой медиатор, и даже цепочку медиаторов.
Например: человек проводит много времени перед телевизором, поэтому человек часто натыкается на страшные новости, поэтому у человека стресс, поэтому он начинает много есть, поэтому человек толстеет. То есть дело может быть совсем не в физической активности.
Медиатор необходимо искать для каждой причинно-следственной связи, кроме тех, в которых связь очевидна.
Например, на тело в пустоте действует сила притяжения – поэтому тело движется в направлении действия этой силы*.* Тут трудно уже придумать событие-модератор, с учётом допущений (мы в мире с ньютоновской механикой) – связь очевидна.
Искажающие факторы
Событие, которое является причиной и для причины, и для следствия — искажающий фактор (ИФ). Ещё одно название для этого – спутывающая переменная, https😕/ru.wikipedia.org/wiki/Спутывающая_переменная)
На графе приведён новый узел - искажающий фактор: уровень образования родителей.
Если уровень образования родителей высокий, то (1) у человека меньше шансов подсесть на смотрение телевизора; (2) у человека больше шансов приобрести здоровые пищевые привычки, тем самым у него меньше риск ожирения.
Если он низкий, то наоборот.
Если мы примем это объяснение, то связь между просмотром телевизора и ожирением превратится в ассоциацию, между этими событиями не будет причинно-следственной связи. Оба события будут следствием третьего, скрытого от нас при непосредственном наблюдении.
Для дальнейшего прояснения механизма связи между искажающим фактором и событиями, на которые он влияет, тоже можно попробовать вставить медиаторы, ведь по отношению к событиям, на которые он влияет, искажающий фактор — это причина. Медиаторы (механизмы влияния) искажающего события на каждое событие исходной цепочки получатся, скорее всего, разными.
Например*😗
«У родителей низкий уровень образования»::ИФ — «они много работают на тяжёлой работе»::М — «у них не хватает времени на занятия с ребёнком»::М – «они подсаживают его смотреть телевизор»
«У родителей низкий уровень образования»::ИФ — «они не знают основ детской диетологии»::М — «у ребёнка вырабатывается привычка к мусорной еде»::М – «у ребёнка высокий риск ожирения»
Обнаружение искажающего фактора порождает сомнение в гипотезе о причинно-следственной связи между исходными событиями. Мы уже не можем утверждать, что изучаемая причинная связь реально существует, и мы возвращаемся к вопросу о вмешательстве: если мы оставим неизменными все остальные факторы и будем менять причину в нашей исходной гипотезе – будет ли меняться следствие?
Если физически убрать телевизор из дома человека, исключить другие сидячие развлечения, и лишить его доступа к другим источникам плохих новостей – похудеет ли он?
Коллайдер
Событие, которое является следствием и для события-причины, и для события-следствия — называется коллайдер (К),https😕/ru.wikipedia.org/wiki/Коллайдер_(статистика).
Например:
Если человек проводит много времени перед телевизором, то есть риск развития у него самоповреждающего поведения.
И если человек страдает ожирением, то есть риск развития у него самоповреждающегоповедени*,* независимо от того, сколько времени он проводит перед телевизором!
Между событиями и получившимся коллайдером также хорошо бы разместить медиаторы, если мы хотим пояснить механизм появления там причинно-следственных связей.
«Человек проводит много времени перед телевизором» — «Человек плохо социализируется»::М — «У человека развивается самоповреждающее поведение»::К.
«Человек страдает ожирением» — «Человек стесняется других»::М— «Человек плохо социализируется»::М — «У человека развивается самоповреждающее поведение»::К.
В этом примере мы можем обнаружить даже два коллайдера, следующих в цепочке один за другим.
Обнаружение в графе причин и следствий нового коллайдера не влияет на то, как связаны сформулированные в нашей гипотезе причина и следствие. Это лишь еще одно следствие. Но вот обнаружение того, что наше следствие само по себе является коллайдером исходной причины и ещё какого-то события – заставляет нас включить это событие в модель как возможную альтернативную причину, и далее планировать наблюдения и эксперименты с учётом присутствия в графе ещё одного пути (вспомните, что мы уже обсуждали такой механизм, когда говорили о типах причин).
Например, если бы мы изучали причинно-следственную связь между просмотром телевизора и склонностью к самоповреждающему поведению, обнаружение ожирения как второй возможной причины самоповреждающего поведения превращает его в коллайдер, и мы уже не можем планировать сбор информации без учёта этого фактора ожирения.
А то, что эти две возможные причины (время у телевизора и ожирение) могут ещё и находиться в причинно-следственной связи между собой – ещё усложняет анализ нашего графа.