Онтология/модель данных как структура пространства смыслов
Уровни мета-моделирования/абстракции/онтологические нам нужны, чтобы как-то организовать модульность в пространстве смыслов/ментальном пространстве, где модули этого пространства представляют собой какие-то понятия в их взаимосвязи, какие-то знания и факты об окружающем мире и его описаниях/моделях/представлениях.
Так что мы говорим о стеке абстрактности мышления/стеке мета-моделей примерно так же как о любом другом платформенном стеке (стеке по отношению композиции между физическими конструктивными объектами-модулями), который будет рассматриваться в трансдисциплине системного мышления. Разве что речь идёт прежде всего об иерархии математических/абстрактных понятий, и отношения там отнюдь не отношения композиции, как в случае отношений физических объектов — мы говорим о классификациях и специализациях прежде всего в мире ментальных объектов, которые можно мыслить как области «ментального многомерного пространства смыслов». В модульном рассмотрении пространства смыслов интересует аспект изолирования мышления в каких-то одних областях этого пространства смыслов от мышления в других областях. Конечно, при этом есть понимание, что даже уже изолированные по разным регионам смыслы тоже связаны — но эти связи идут через границу двух смежных уровней абстракции, а не идут произвольно из любого уровня в любой, причём по линии этих связей существуют такие механизмы как «наследование свойств» в случае отношения специализации, нетождественность свойств класса и экземпляра класса в случае классификации (множество из одного объекта — другой объект, нежели сам объект в составе этого множества), и т.д..
Вся эта конструкция из многих уровней абстракции базируется на какого-то сорта «метафизическом заземлении»[1], для целей которого сегодня победило мнение, что в конечном итоге речь идёт о представлении в онтологии физических объектов. Поэтому любые абстрактные рассуждения в конечном итоге у нас дотягиваются по цепочкам описаний по уровням абстракции до выделяемым вниманием экземпляров объектов в физическом мире (свойство адекватности мышления).
Хитрость нарезки на онтологические уровни/уровни абстракции/уровни мета-моделирования в том, что внимание блуждает после этого не по бесчисленному множеству непосредственно воспринимаемых предметов физического мира, а по концептам этой предметной области — и этих концептов немного, они хорошо связаны друг с другом (и эти связи продуманы и непротиворечивы, а не придуманы вот только что по ходу проекта и поэтому не слишком продуманы!), занимают компактную область в пространстве смыслов. Если ваше внимание вдруг сосредоточилось на валентности, химической связи, pH, радикале — то вы уже понимаете просто из предъявляемых вниманию объектов и отношений, что в этом ряду «радикал» это не «бескомпромиссный выразитель каких-либо взглядов на общественное устройство», а «атом или молекула, имеющая один или несколько неспаренных электронов», вы находитесь в какой-то определённой области пространства смыслов, а не в произвольном его месте. Дисциплины состоят из абстрактных концептов/понятий, к которым привязано внимание в данной предметной области. Если вы вдруг зацепились за какое-то понятие/концепт дисциплины, то внимание начинает блуждать по другим связанным отношениями понятиям из этой же области пространства смыслов, в каком-то смысле понятия одной дисциплины близки в пространстве смыслов, а понятия разных дисциплин далеки. Это активно используется сегодня в prompt engineering для нейросетей: если вы скажете «расскажи о Форде», то непонятно, о Форде-автомобиле, Форде-предпринимателе или Форде-президенте вам расскажут. Надо вместе с запросом дать контекст, иначе вопрос будет непонятен. И вы добавляете к запросу какие-то дополнительные детали, наиболее вероятно просто добавляя тип, то есть указание объекта более высокого уровня абстракции: «расскажи об автомобиле Форд», «расскажи о президенте Форде», и чем больше таких уточнений, тем точнее будет ответ: «расскажи об объёме выпуска автомобиля Форд», «расскажи о потреблении топлива автомобилем Форд», «расскажи о политических пристрастиях предпринимателя Форда», «расскажи о доходах президента Форда», и т.д.
Собранность даёт устойчивое внимание на каких-то объектах, но не говорит, на каких именно объектах. Онтология говорит, какие именно объекты должны быть во внимании: лес, дерево, элементарная частица, благорасположение, энтропия, социология, понятие, абстракция (сама «абстракция» — это тоже объект мира абстракций, она может быть предметом внимания!). Дисциплина же для внимания берётся не случайная, а помогающая рассуждениям.
Формальность в мышлении обычно означает чёткость и узость границ какого-то концепта в пространстве смыслов, неформальность — размытость и широту границ этого концепта, поэтому онтологии задаются на разном уровне формальности. Если формальность какой-то онтологии/модели данных достаточна, чтобы проводить строго логические рассуждения, то иногда про такое говорят, что это предмет дисциплины вычислительная онтология/computational ontology (ибо такие строго логические рассуждения/вычисления часто поручают компьютеру с программами «доказательства правильности» на базе математической логики, люди так мыслят только в порядке исключения, и это будет обсуждаться в трансдисциплине рациональности). Gruber, Borst и Studer определили онтологию как явную спецификацию разделяемой концептуализации, An ontology is a formal, explicit specification of a shared conceptualization[2]. Определим концептуализацию как задание важных для надёжного active/embodied inference[3] объектов восприятия в мире. Это позволяет сформулировать задачу создания онтологии в терминах управления вниманием, а «явная формальная спецификация» тут говорит о том, что эти объекты внимания выделяются не спонтанно, а по какой-то явной модели этих объектов (онтологии), заданной при помощи другой модели для этой модели, а именно модели формализма (foundational ontology). В конечном итоге для модели формализма используют математику, и это нами уже подробно обсуждалось. Другое дело, что от формализма математической логики перейти в онтологии как трансдисциплине к более фундаментальным формализмам самой математики (унивалентные основания математики, гомотопическая теория типов, неформальная теория типов, теория категорий) пока не удаётся, слишком недавно по историческим меркам были предложены эти изменения:
- Сами изменения в математике стартовали где-то с 2006-2007 годов (предложение аксиомы унивалентности)
- В 2012 году нейронная сеть ImageNet выиграла соревнования по распознаванию изображений.
- В 2013 в нейросетях было предложено слова в тексте (и даже буквы, и даже предложения и целые документы) представлять в форме эмбеддингов (векторов в многомерном пространстве), и знания о мире из текстов оказалось возможным представлять альтернативно форме объектов и отношений из классических онтологий.
- Пик развития computational ontology в связи с предложениями так называемого «семантического веба» (semantic web, Web 3.0) прошёл где-то в 2013 году, после чего интерес к semantic network пропал настолько, что это для этого представления был ребрендинг в knowledge graph
- Вопрос о более формальных математических представлениях онтологии тем самым где-то с 2013 года был снят ввиду угасания самого интереса к графам знаний. Программы искусственного интеллекта всё более склонялись сначала к модели «мы приделаем к огромному графу знаний нейронную сетку», затем «мы приделаем к огромной нейронной сетке граф знаний», а теперь «внутри нейронной сетки все эти графы знаний сами отличненько получаются, и не надо никаких специальных математических представлений». Поэтому вопрос об этой «новой математике» просто отпал, все разговоры про «давайте выражать онтологии на языке теории категорий» закончились где-то в начале десятых годов 21 века, а разговоры «давайте говорить об онтологиях на языке гомотопической теории типов» оказались вообще маргинальны.
Область использования классических онтологий тем самым оказалась довольно узкой, ибо для задач искусственного интеллекта (что считалось всегда главным приложением для онтологической инженерии) они сейчас по факту не рассматриваются, но всё-таки классический подход к онтологическим описаниям мира остаётся важным в интеллект-стеке:
- Мета-моделирование оказывается важным навыком при разбирательстве с объектами внимания, задействующими экзокортекс. Мета-моделирование позволяет более-менее надёжно находить важные объекты внимания, задавая их не «исподволь» (обучая нейронную сеть в мозге на тысячах и тысячах «жизненных ситуаций»), но непосредственной передачей в текстах. В частности, в учебных курсах для людей используется именно этот ход. Главное тут — это нахождение тех объектов внимания, типы которых явно задаются онтологией, использованной в каких-то теориях/объяснениях/дисциплинах, но которые пока не найдены. Скажем, вы услышали, что кто-то активно использует слова «учёт», «дебит», «кредит», «баланс» — это отсылает к практике финансового учёта, роли бухгалтера. Дальше можно задавать предписанные практикой вопросы (например, это учёт РСБУ или МСФО? Какая квалификация у присвоившего себе роль по практике бухучёта? Какие полномочия по принятию решений в области учёта у этого агента?).
- онтологическая инженерия оказывается крайне полезной для организации экзокортекса как личного, так и корпоративного. В классическом корпоративном программировании («кровавый энтерпрайз») онтологическая инженерия известна под именем Domain-Driven Design (DDD)[4] с основным посылом «для каждого обнаруженного в жизни объекта должен существовать программный объект с похожим поведением». Онтология тем самым представляется как модель данных для базы данных программного приложения.
- В промышленных системах поддержки проектирования и производства ошибки и неустойчивости в работе нейронных сетей неприемлемы: если 2*2 «примерно равно» 5, хотя никак не 10 и не 48, то ракета не полетит. Поэтому используются формальные методы, разговор стараются держать максимально точным, хотя «математической точности» часто и не требуется (затраты на лишнюю формализацию мышления часто не окупаются, нужно следить за удержанием оптимального, а не максимального уровня формализации). Чаще всего онтологии используются для моделирования данных при интеграции данных самого разного инженерного и менеджерского софта, но они называются «моделями данных», их в этой предметной области не называют онтологиями. Редко в научных работах услышишь «онтологическое моделирование данных», если вспоминают о высоких уровнях абстракции (foundational и upper ontology) в моделировании данных. Основные приложения онтологической работы для этого нужно искать сегодня в тематике цифровых двойников, при их создании (и создании сетей этих двойников) как раз и используются онтологии[5].
Абстракции, упорядочиванием которых занимается онтологическая инженерия, дают сознанию карту быстрых проходов в мышлении, это «порталы» (wormholes, хотя это не так аппетитно переводится), которые позволяют вниманию не только осмысленно (то есть с максимальной вероятностью пользы для текущей ситуации**)** перескакивать с одного понятия/концепта на другой в дисциплинах как компактных областях пространства смыслов **какой-то предметной области/**domain в рамках всего этого пространства, но главное — с мышления в рамках одной дисциплины на мышление в рамках другой дисциплины, попадать из одной области пространства смыслов в другую.
Тут есть некоторые проблемы с математикой «строгости» рассуждений. По большому счёту, несколько онтологий-микротеорий, хорошо выражающие без противоречий рассуждения для объектов и отношений в их предметных областях, совместно противоречивы — и формально рассуждения по ним невозможны, онтологии в принципе несовместимы. Тем не менее, организовываются разные способы работы с этими микротеориями, позволяющие рассуждать как-то более-менее точно/строго/формально в ситуациях принципиальной невозможности такого рассуждения. Наиболее продвинутыми в этом плане оказываются исследования CYC Corp., которая продолжает свою работу по онтологической инженерии даже в ситуации, когда главенствуют методы представления знаний в форме языковых моделей[6].
Если перейти к географическим аналогиям, то в мышлении можно отслеживать перемещения между понятиями одного уровня абстракции, как в жизни перемещения между областями одного уровня крупности: внутри улицы между домами, внутри города между улицами, внутри области между городами, внутри страны между областями, внутри планеты между странами. И если нам нужно с улицы в городе какой-то области какой-то страны попасть на другую улицу в городе другой области другой страны, то в мышлении это сделать легко примерно по тому же принципу, как мы рассуждали сейчас о перемещениях в пространстве. Это абстрактные объекты, переместиться вниманием из Колумбии в Чехию занимает примерно столько же времени мышления, сколько переместиться (мышлением! Переключить внимание!) из дома 11 по улице Краснозелёных в Анапе Краснодарского края в дом номер 18 на этой же улице. Вот и в онтологиях переместиться вниманием из физики в математику или из онтологии в теорию понятий (это разные дисциплины!) займёт примерно столько же времени, сколько между моментом и силой в ньютоновской механике физики или объектом и отношением как понятиями из теоретической теории понятий/theory theory.
И постоянно помним про «заземление»/grounding в его современном понимании: все эти абстракции в конечном итоге согласованы с физическим миром. В любой момент мы можем ответить на вопрос, не утеряли ли мы связь с реальностью в наших рассуждениях с огромным пространством смыслов — ровно потому, что все эти цепочки отношений в рамках онтологии обязательно должны базироваться в конечном итоге на отношении репрезентации/воплощения между понятием и 4D/четырёхмерным физическим объектом, занимающим место/протяжённом в пространстве-времени (онтологический принцип 4****D экстенсионализма). Онтологическое мышление в варианте 4D экстенсионализма тем самым удовлетворяет критерию адекватности, поэтому все эти перемещения в рассуждениях между онтологическими уровнями/уровнями мета-моделирования и внутри каждого уровня можно проверять на адекватность, «неотрыв от реальности».
Nicola Guarino, Daniel Oberle, and Steffen Staab, What Is an Ontology?, in S. Staab and R. Studer (eds.), Handbook on Ontologies, Springer-Verlag, 2009 ↩︎
Karl Friston, Embodied inference: or "I think therefore I am, if I am what I think" In W. Tschacher, C. Bergomi (Eds.), The implications of embodiment: Cognition and communication (pp. 89–125). Imprint Academic., https://www.fil.ion.ucl.ac.uk/~karl/Embodied Inference.pdf ↩︎
Онтологическая инженерия в 2022, https://ailev.livejournal.com/1653296.html ↩︎
Раздел «CYC никуда не делся, продолжает делать и исправлять свои ошибки», https://ailev.livejournal.com/1610230.html (2022) ↩︎