Критический рационализм Поппера
И вот тут мы уже можем поговорить о том, как устроено познание/исследования/learning —не один результат размышления, выдержавший критику экспериментом, а в целом получение новых знаний на Земле. Раньше это была «наука»/science, занималось ей «науковедение» по-русски, эпистемология/epistemology по-английски (на основе греческого корня). Ещё по-русски говорили о гносеологии, где кроме научных знаний в число получаемых знаний в гносеологии включались художественные и религиозные знания, но акцент делался не на самих знаниях, а на «познании» научном, художественном, религиозном — а что там является итогом познания (то есть что является знаниями), было не так важно. В эпистемологии, наоборот, результат познания был важен, и таким результатом в современной эпистемологии являются знания в виде «паутины объяснений» (web of explanations, как это называет David Deutsch в своих работах: тесно перепутанный и постоянно меняющийся и улучшающийся набор самых разных объяснений, опирающихся друг на друга).
Эти знания/объяснения получает интеллект отдельных учёных, отдельных научных коллективов, всего научного сообщества Земли. Соответственно, индивидуальное и коллективное мышление для практики познания/исследований — это научное мышление, и мы должны понимать, что оно базируется на всех предыдущих трансдисциплинах. То есть научное мышление опирается на объяснения/теории того, что такое объяснения (контрфактуальность в обсуждении причин и следствий), предполагает логичное мышление (мышление по правилам логики), и так далее до самого основания интеллект-стека, где собранность и понятизация.
Особенность текущего момента в том, что исследованиями (мышлением в ходе создания объяснений) занимаются все, это составная часть интеллекта. Раньше исследованиями (осознанным выдвижением догадок/гипотез по потенциальной модели/теории/объяснению, постановкой экспериментов, улучшением объяснений) занимались только учёные. Теперь — и инженеры изучают свои системы в их окружении (например, выдвигают гипотезы по объяснениям сбоев в работе), и предприниматели выдвигают рыночные гипотезы и проводят эксперименты (например, А|B тестирование), и многие другие. Это всё исследования, это всё научное мышление, часть познания. Только теперь этим занимаются практически все люди, столкнувшиеся с чем-то новым. И, конечно, исследованиями начинают заниматься компьютеры с их универсальными алгоритмами/машинным интеллектом. А если принять современные неантропоцентричные безмасштабные теории эволюции (линии работ групп Виталия Ванчурина, Karl Friston и Chris Fields), то познаёт/learn вся Вселенная, и это многоуровневый эволюционный процесс, который происходит на разных системных уровнях пространственных/физических объектов и масштабов времени. И на каких-то уровнях агенты достигают такой сложности, что им становится доступно получение писанных объяснений. В писанных объяснениях единицы знания меняются в ходе эволюции примерно так же, как гены/genes — реплицируются на разных носителях и иногда мутируют, их по аналогии назвали мемами/memes. Эти объяснения могут кодировать особенности искусственно создаваемых агентами-создателями экземпляров каких-то технических систем (техно-феном) примерно так же, как геном[1] кодирует особенности фенома[2]. В области техники мы наблюдаем техно-эволюцию, где онтогенез — это производство[3], а филогенез — это работа инженеров-проектировщиков и архитекторов[4].
Текущий SoTA по познанию/исследованиям — это критический рационализм Поппера, дополненный мыслью про то, что эволюция познания связана не с бесконечным развитием каких-то идей/теорий/моделей о мире, но идей/теорий/моделей, являющихся объяснениями.
Тем самым современная логика исследовательского научного и инженерного мышления — это контрфактуальная логика рассуждений о причинах и следствиях, основанная на планировании каких-то действий (предсказаниях) и вычислениях взаимозависимости этих причин и следствий.
Познание/learn/исследования/research (и научное, и инженерное — этому правильней было бы говорить research and development, R&D), которое базируется на современном критическом рационализме Поппера, оказывается устроено очень контринтуитивно. Например, нельзя доказать**/подтвердить** какую-то теорию/объяснение, но легко можно опровергнуть/фальсифицировать двумя способами**😗*
- Критически: показав логическое противоречие — проблему**.**
- Прагматически: создав техническую систему и показав худшее соответствие предсказания теории эксперименту, чем у альтернативной теории**.**
Следствия такого подхода тоже нетривиальны. Так, это означает, что эксперимент бесполезен, если нет альтернативной теории-конкурента, которая является непротиворечивой. Почему важен эксперимент? Потому как он связывает модели с физическим миром. Эксперимент проводится в конечном итоге (иногда по цепочке наук) в физическом мире, мысленных экспериментов не хватит. Эксперимент идёт по физическим законам нашего мира/мультиверса, в этом его ценность. Это подробно обсуждается в уже упоминавшихся книгах Дэвида Дойча.
Предметом естественных наук являются объяснения поведения физических/материальных объектов в их взаимодействии на разных системных уровнях (уровнях крупности, уровнях частей-целых в материальном мире, мире физических тел и полей). Фильтрация плохих объяснений (опровержение гипотез, но не доказательство их верности!) в конечном итоге идёт проведением физического эксперимента (теория, которая плохо предсказывает результаты эксперимента, уменьшает свой вес в SoTA набора теорий данной науки). Объяснения включают в себя возможность предсказаний (предсказания не главное, если у вас хорошее объяснение — вы предскажете, а если есть предсказание без объяснения, то будут проблемы). Разные объяснения даются на разных системных уровнях и несводимы друг ко другу (эта несводимость называется эмерджентностью: на каждом системном уровне от взаимодействия частей появляются новые объекты внимания и их новые свойства, и описание делается в других понятиях). Химия, биология — вполне себе такие науки более высоких системных уровней по сравнению с физикой элементарных частиц или даже атомов.
Всё запутывается ещё сильнее, если учесть рассуждения не в классической логике «свидетельств», а байесовской логике и тем более дополненной байесовской логике, снимающей многие противоречия, возникающие в силу излишней формализации. Экспериментальная проверка тоже не так проста: речь идёт об измерениях, которые можно провести с ошибками, они должны быть воспроизводимы, то есть явление должно быть массовым, а теория приводить к относительно простым вычислениям, измерение не должно тонуть в шуме. Проблемы «доказательной медицины» и «доказательного образования», кризис невоспроизводимости экспериментов в психологии — всё это показывает, что познание устроено не так просто, как «придумай догадку, докажи её непротиворечивость огромному числу уже проверенных догадок, а затем покажи, что опираясь на эту догадку можно предсказать мир лучше, чем на основании уже известных других догадок**—** и твою догадку примут всерьёз как основание к действию».
Исследовательское/научное мышление тем самым требует, чтобы у нас были не просто объяснения, но опровергаемые/фальсифицируемые/критикуемые объяснения. Если какое-то объяснение нельзя фальсифицировать, то оно «ненаучно», не является результатом познания/исследований (например, объяснение «на всё воля господня, и сегодня господь решил, что будет вот так»). Рассуждения на базе пословиц (мы приводили пример из текста Алана Кея про пословицы против длинных цепочек рассуждений, вспомните его) тоже «ненаучны».
Критический рационализм[5] — это как раз идея, что все теории должны быть прокритикованы, в итоге выживет лучшая, но и эта лучшая погибнет, когда придумают теорию, ещё лучше объясняющую поведение мира.
Рационализм сводится к тому, что критика должна быть логична/аналитична (рацио — это «деление», анализ), а сама логика (модели и рассуждения о моделях) привязана к реальности (адекватность, все рассуждения в теории так или иначе должны быть заземлены, критерием выигрыша у других теорий/объяснений будет эксперимент — тезис прагматицизма).
При критическом рационализме знание (совокупность теорий/объяснений, опирающихся друг на друга) перестаёт быть чёрно-белым, состоящим из «заведомо верных» и «заведомо неверных» теорий. В знании в любой момент его развития (помним, что непрерывно идёт эволюция знаний) появляется множество оттенков соответствия теорий реальности, обширные зоны серого: ни одна теория точно не описывает реальность, всегда есть какая-то невязка. Ни одна теория не является универсальным объяснением, ни одна теория не «заведомо верна». Но некоторые теории объясняют лучше, и специально сконструированные эксперименты (хотя ничего не мешает взять какие-то уже проводившиеся замеры, если знаете, какие из них корректно брать в качестве результатов эксперимента) показывают разницу в предсказаниях конкурирующих объяснений — и некоторые теории оказываются предсказывающими лучше, а некоторые хуже. Те, которые предсказывают хуже, считаются опровергнутыми. Которые лучше — SoTA, «пока не опровергнутыми» (особый акцент на «пока», ибо в какой-то момент будут опровергнуты и они), и их надо «брать всерьёз», то есть использовать для планирования действий по изменению мира.
Выражение «экстраординарные заявления требуют экстраординарных доказательств» теперь можно ещё и количественно оценивать, используя вычисления вероятности (помним: байесовской и дополненной байесовской/квантовоподобной). Фальсифицируемость (возможность опровержения) объяснений/теорий/моделей в знании важна, причём понимание, что же это такое, после причинной революции 21 века существенно изменилось, и продолжает меняться даже сейчас: мало того, что речь идёт о вероятностном знании, ещё и вероятность оказывается квантовоподобной!
Критический рационализм как вариант эпистемологии был в 21 веке существенно улучшен, стал более строгим и точным объяснением происходящего как в научных исследованиях, так и в познании/исследованиях в целом. Помним, что отнюдь не все исследователи работают в научных организациях, не все программисты работают в IT-отрасли, это всё обычная часть жизни, не требующая полной профессиональной погружённости. Чтобы что-то исследовать, нужно просто занять роль исследователя в текущем рабочем проекте, необязательно работать учёным в научном учреждении, можно быть и инженером. Инженера мы при этом понимаем как роль агента, создающего системы, изменяющие мир к лучшему, ведущие к «спасению», уменьшению «неприятного байесовского сюрприза».
Любое ли исследование должно проводиться, должны ли финансироваться любые проявления любопытства (то есть финансироваться создание новых догадок или smart mutations к уже имеющимся наборам догадок, финансироваться проведение экспериментов по опровержению тех или иных догадок)?
Ответ тут такой, что если по итогам этого исследования не идёт попытки изменения мира к лучшему, то этого исследования можно было бы и не делать, ведь шанс изменения мира к лучшему случайной мутацией ничтожен, в отличие от целенаправленного изменения мира «умной мутацией». Прагматицизм как отсылка к выходу мышления в деятельность, связи с реальностью изменения мира, применим и тут. Если исследователю-учёному или исследователю-инженеру что-то «любопытненько», и он пытается это выяснять, тратя свои собственные ресурсы и пытаясь прихватить на это ресурсы окружающих, то это не означает ещё полноценного и продуктивного участия в мировом процессе бесконечного развития. Наука и тем более инженерия так же целенаправленна, и так же служат «спасению», как и вся остальная деятельность. Исследователь не может сказать «я художник, я так вижу», от него всё равно требуется указание целей его исследований — и эти цели будут оценены так же, как любые другие: насколько вероятно они ведут к «спасению», к изменению жизни к лучшему в ходе дарвиновской и техно-эволюции. Если маловероятно, но выгода может быть большая — можно проинвестировать ресурсы, если маловероятно и выгода небольшая — ресурсы не надо инвестировать. Обычная теория принятия решений, только по поводу познания.
Чисто аналитическая/исследовательская/познавательная (создание моделей) деятельность оказывается в современном мире всегда подчинённой синтетической деятельности по созданию систем, то есть инженерной деятельности по изменению мира к лучшему. Анализ, понимание, любая мыслительная работа по моделированию (описанию важных черт чего бы то ни было) подчинена целям этого описания: в зависимости от выбора целей, то есть того, что мы хотим изменить в мире (в конечном итоге — изменить обязательно в физическом мире!) мы строим разные описания, получаем и применяем разные знания.
При этом очень похоже, что «какова реальность» (как устроен мир) нас интересует только с точки зрения выживания в ней, сохранения жизни. Это подтверждается даже компьютерными экспериментами: агенты, у которых была не «модель реальности, какова она есть», а только модель избранных свойств реальности, важных для выживания, процветали в экспериментах, а агенты с «настоящими моделями реальности» выживали хуже[6]!. По словам Дональда Хоффмана, всё что делается в ходе эволюции (в том числе того, что происходит на всей Земле, мы ведь часть эволюции), на что обращается внимание — это просто разные способы иметь побольше детей! И даже если на первый взгляд это не так, то через некоторое время о полезности того или сего утверждается только в том случае, если удаётся протянуть цепочку причинности к увеличению числа разумных жизней во Вселенной, и часто даже антропоцентрично добавляют, «и чтобы эти разумные жизни были нашего вида!». Хотя ксенофобия и расизм и не очень популярны, но «роботам себя не отдадим» — это ведь вариант ровно такого антропоцентричного отношения к эволюции: «пусть твой вид вымрет сегодня, а мой вид завтра». Вариант «зелёных» не лучше, «пусть твой вид не вымрет, хотя мой вид будет страдать и перестанет расти». Чтобы грамотно стратегировать (ставить цели по изменению себя и мира), нужно понимать и идеи эволюции/бесконечного развития, и идеи прагматицизма, и владеть «научным мышлением» как мышлением по практикам интеллект-стека, применяемых в рамках трансдисциплины познания/исследований.
Judea Pearl всё время описывает допрос природы с пристрастием как основной предмет своего рассмотрения при разработке практики создания объяснений — выдвижение содержательных гипотез, подтверждение данными эксперимента. Математизация понятия «причины», понятия «механизм», понятия «необходимость» и «достаточность» в связи с «причинами» — это всё необходимые составляющие исследовательского мышления в науке. Но это же составляющие исследовательского мышления в инженерии (проверка гипотез о работоспособности, или о возможных поломках), составляющие мышления визионера (проверка рыночных гипотез), составляющие медицинского мышления (где врачи тоже делают предположения о причинах болезни пациентов), правоохраны (делаются предположения о виновности подозреваемых). Дисциплина практики познания/исследований как создания SoTA объяснений/теорий/моделей — это трансдисциплина, она применима повсеместно, как и любая трансдисциплина интеллект-стека.
Человеческая интуиция базируется не на статистической логике (а хоть и байесовской, ступенька «ассоциации» в лестнице причинности), а причинной логике. Эта причинная логика оказывается не столько байесовской, сколько дополненной байесовской (квантовоподобность!). Причинная логика продуктивна только в сочетании с онтологическими посылками о природе предметной области: какие типы объектов с их отношениями как меняются в ходе взаимодействия, что из этих изменений является причиной, а что следствиями, как они описываются математическими объектами и отношениями (или объектами с операциями по их созданию в конструктивной онтологии).
Так что причинные рассуждения (causal reasoning/inference) и исследовательское мышление как использование научного подхода (подход: отработанные в науке приёмы мышления, переносимые далее в другие дисциплины) в самых разных сферах деятельности мы включаем в интеллект-стек в обязательном порядке.
Как строить исследования в целом (не разовое проведение эксперимента, а выдвижение догадок/гипотез, критика их нерациональности, проведение экспериментов для фальсификации/опровержения худших, возможность выдвижения более универсальных и лучше объясняющих догадок/гипотез по текущим проблемам и бесконечное развитие знания, состоящего из выживших в ходе критики объяснений и цивилизации как совокупности агентов с их инструментами) — это нужно знать каждому человеку, разбирающемуся с новыми проблемами.
Практики всего остального интеллект-стека дают основания и объекты для познания/исследований, поставляют проблемы для познания/исследований, помогают рассуждениям в познании/исследованиях, организуют работы по познанию/исследованиям, помогают в планировании и инженерии экспериментов, используют результаты исследований.
И наоборот: знания/объяснения/теории практики познания/исследований (сейчас — современного критического рационализма попперианской эпистемологии) помогают всем остальным практикам интеллект-стека. Интеллект-стек — это решётка/lattice знаний, а не строго упорядоченный стек практик. Мы упрощаем сам интеллект-стек главным образом для целей планирования образования: в целом, чтобы обсуждать исследования, уже нужно разбираться в онтологии (которая отнюдь не самая нижняя трансдисциплина в стеке), логике, нужно разбираться в том, как устроены объяснения. Но в жизни все дисциплины интеллект-стека перемешаны между собой и используются «по потребности» и по факту неразделимо (в ходе нейросетевого квантовоподобного «интуитивного», а не последовательного классического «строго логического» рассуждения).
Data scientists, которые ведут себя как «учёные», то есть «выдвигают гипотезы, проверяют их на больших массивах данных, извлекают эти гипотезы из больших массивов данных», должны осознать, что они те самые исследователи («учёные», scientists!). Они профессионально должны знать (это тоже знание!): что может статистика (это первый уровень обсуждения причинности: ассоциации между явлениями), а что она сама не может (так, для составления графа причинности требуется привлечение специалистов в данной предметной области, которые дадут гипотезу о том, как в ней связаны причины и следствия), как затем нужно планировать эксперимент (и это уже не работа с данными!), как нужно относиться к неизбежной разнице между результатами их работы как учёных (предсказательные модели, дающие какие-то предсказания) и измерениями в реальной жизни.
Системные инженеры, проводящие испытания, тоже должны понимать пределы чисто статистической обработки итогов этих испытаний. Они «экспериментаторы», так что в этой части своей практики — те же исследователи.
И операционные менеджеры, которые оценивают причины отклонений, цитируя Дёминга-Шухарта[7], должны тоже понимать ограничения своих статистических по факту расчётов. Они тоже исследователи, задают вопросы к природе отклонений — и поэтому должны понимать, как состыковать свои знания в статистике со своими знаниями предметной области, где они считают отклонения.
Исследования как трансдисциплина оказывается общей для всех проектов: один раз выучишь, много раз задействуешь. Но это не означает, что уже сегодня можно что-то исследовать, выучившись на каких-то курсах по причинному обновлению/causal inference (разобравшись в том, как устроены объяснения, «причинные рассуждения», предыдущий уровень интеллект-стека).
Курсы causal inference как часть математического образования есть уже во многих университетах — революция причинности шла тридцать лет, с 90-х годов, и опыт чтения курсов студентам-математикам накопился достаточный. Но на этих университетских курсах, похоже, преподают не мышление о причинах и следствиях (помним, что причины и следствия всегда предметны! Нужен subject matter expert, чтобы из своего опыта и творческого воображения, питаемого нейронным шумом, генерировать гипотезы/догадки), а просто способ провести расчёты для выбора лучшей гипотезы из имеющихся. Там преподают не исследования как трансдисциплину, а дают просто матаппарат для вычислений причинности. Причинное обновление оказалось не увязано с другими трансдисциплинами, из курса для математиков остаётся непонятно, как оно используется в исследованиях. А оно используется для опровержения гипотез (даже не для подтверждения! В исследованиях есть опровержения, но нет доказательств/подтверждений!).
Очень похоже на ситуацию с системным мышлением как приёмах мышления о частях-целых (эти приёмы раскиданы по множеству трансдисциплин), где на курсах systems thinking в современных университетах часто можно найти изложение какой-нибудь systems dynamics как привет из 70-х, где системное мышление подаётся как подробное изложение дифференциальных уравнений для моделирования кибернетических моделей с обратными связями, вариант теории автоматического управления (ТАУ)[8]. И выучившиеся такому «системному мышлению» люди оказываются неспособными что-то сделать в прикладных проектах, ибо речь в системном мышлении будет идти сразу о многоуровневости и конфликтах между системами разных уровней, неустроенностях, системах создания, эволюции.
Содержание фундаментального образования опять изменилось, уже в 21 веке, и даже не в самом начале 21 века! Забудьте всё, что вы знали про «причины», «следствия», «корреляцию» и «механизмы», забудьте про «науку» с её «британскими учёными» и «доказано, что». Выучите это всё заново по современным статьям (часто даже учебников по этим новым мыслительным практикам нет, хотя бывают уже онлайн-курсы), там уже давно всё не так, как было в прошлом веке. Как? Наш курс «Интеллект-стек», который вы изучаете, как раз и даёт короткий обзор происходящего в области лучших мыслительных практик.
Разберитесь в том, как выдвигать гипотезы и проводить эксперименты, обеспечивая длинное связное эволюционное развитие знания: этому посвящено множество самых разных мыслительных практик, включая общее описание того, как это происходит в практике познания/исследований (хотя более честно было бы назвать её практикой творчества). Если вы не понимаете, почему нельзя экспериментом опровергнуть гипотезу, если у вас в руках нет второй конкурирующей гипотезы (то есть минимум — это две гипотезы и фальсифицирующий одну из них эксперимент, а не одна гипотеза и один эксперимент), то вы не понимаете того, что такое исследования в их современном варианте, ни научные, ни инженерные. Вы не понимаете сути R**&D,** не понимаете сути творчества.
Большинство из предлагаемых приёмов современного (лучшего из известных на данных момент, state-of-the-art) мышления крайне контринтуитивны — они не приходят в голову «от опыта», их нужно узнать из какого-то курса и понять. Это понимание даётся с трудом, надо делать собственные догадки и подтверждать их как приводимым учебным материалом, так и опытом выполнения каких-то практик в жизни. А ещё нужно добиться беглости в выполнении этих приёмов мышления. Но освоенные приёмы сильного мышления позволяют вам стать умнее, начать разбираться с проблемами, справиться с которыми раньше и мечтать было нельзя. Вы усилите свой интеллект, так что овчинка стоит выделки.
При познании-обучении/supervised learning в отличие от познания-исследования/self-supervised learning речь идёт об импорте одним интеллектом результатов работ других интеллектов.
У СМД-методологов этому соответствует коммуникация, и эту коммуникацию (а мы называем это обучением) нельзя убрать из мышления (наше общее «мышление» и для исследований, и для коммуникации, и для прикладных рассуждений СМД-методологи называют «мыследеятельность»).
David Deutsch сделал замечание, что с точки зрения познающего агента (конечно, не всего агента в целом с его телом, а его познающего интеллекта как познающего универсального вычислителя в составе агента) его обучение проходит не путём его «внешнего программирования», а путём выдвижения самим этим интеллектом собственных гипотез/догадок и уточнения имеющихся у него собственных объяснений по мере получения от других интеллектов в коммуникации с ними информации о понятиях и их связях, а также указания на примеры проявления получаемых описаний в реальном мире. Эта коммуникация может быть и через книги, и через упражнения на тренажёрах, необязательно с живым учителем, и даже может быть коммуникация с самим собой (внутренний диалог, а то и диалог, опосредованный записями — мыслим мы не с пустыми руками обычно, а раньше с карандашом и бумагой, а сегодня с клавиатурой, мышкой и экраном).
То есть в познании обучение имеет акцент вычислений интеллекта в ходе коммуникации с уже что-то познавшим интеллектом и с окружающей средой, а исследование — когда никакого познавшего интеллекта нет, поэтому общаемся только с окружающей средой. В познании, реализуемом интеллектом, существуют самые разные варианты сочетания исследования и обучения: алгоритмы интеллекта в разных ситуациях могут быть очень разными (взять хотя бы lifelong learning, pretrain-finetune для языковых моделей и т.д.).