С е м а н т и ч е с к а я    С У Б Д    B R A V O

С У Б Д    д л я    И с с к у с т в е н н о г о    И н т е л л е к т а

В о з м о ж н о с т и   С У Б Д   B R A V O

SDM (Semantic Domain Model)

Создание семантической информационной модели предметной области без программирования.

Семантическое структурирование

любых предметных областей с требуемой степенью детализации в рамках одной или множества семантических информационных моделей.

Метамодель

Семантическое описание метаинформации, работа с информацией различных типов и форматов, что позволяет переносить логику решения задач в SDM

Применение Правил

Правила работы с информацией определяются и хранятся в семантической информационной модели, а не задаются в прикладных приложениях.

Быстрая разработка

Высокий уровень разработки прикладных приложений за счет того, что многие функции реализуются на уровне семантической информационной модели.

Универсальные решения

Возможность решения задач на абстрактном уровне, инвариантным к различным предметным областям позволяет создавать решения, которые могут использоваться с любой моделью ПО.

Российская разработка

Полностью российская разработка в архитектуре которой отсутствуют иностранные проприетарные и open source составные части.

DSL (Semantic Description Language)

Представление информации в виде формализованных, семантически связанных предложений, на языке описания знаний DSL, близком по своим выразительным возможностям к естественному человеческому языку.

Динамическая структура

«Гибкое» создание и настройка структур данных в режиме реального времени без программирования (отсутствует необходимость остановки работы СУБД и ее перезагрузки для добавления любых классов и информационных объектов).

Семантические запросы

Возможность формирования сложных многофакторных поисковых и аналитических запросов в режиме реального времени (в разрезе любых информационных классов, объектов и взаимосвязей) без необходимости создания OLAP-кубов и т.д.

Интеграция данных

Семантическая виртуальная или физическая интеграция с различными приложениями, СУБД и иными структурированными и неструктурированными источниками данных.

Cоблюдению требований ACID

Адаптивный подход к одновременному соблюдению требований ACID для задач, требующих использования транзакций, и свойств BASE для задач, требующих повышенного быстродействия и т.д.

Гибкое администрирование

Администрирование прав доступа на уровне семантических конструкций (лексем), а также возможность одновременного использования мандатной и ролевой модели распределения прав доступа.

От Данных к Знаниям


Актуальность применения семантических технологий


  1. Современные тренды развития технологий управления знаниями предполагают переход от представления и обработки информации в формате, предназначенном для чтения и понимания человеком, к гибридной модели формализованного семантического описания для совместного восприятия информации человеком и программными инструментами машинной обработки.
  2. Представление знаний для такой гибридной модели реализуется за счет построения семантической информационной модели предметной области, основанной на формализованном языке описания знаний.
  3. Информация, описанная в семантических информационных моделях, становится пригодной для обработки и автоматического анализа в режиме реального времени (HTAP - Hybrid Transactional and Analytical Processing), синтеза выводов и преобразования как самих данных, так и сделанных на их основе заключений в различные представления, полезные на практике.
  4. Применяющиеся в настоящее время технологии управления знаниями не обеспечивают достаточные выразительные возможности для семантического описания сложных предметных областей и создания семантических программных систем требуемого уровня.
  5. Создание технологии и программного обеспечения с выразительными возможностями семантического описания предметных областей, схожими с естественным человеческим языком, является одним из показателей перехода от «слабого» искусственного интеллекта к «сильному».

Современные технологии управления знаниями


В настоящее время в мире происходит настоящий «бум» развития технологий управления знаниями. Ведущие международные и российские корпорации и сообщества применяют и динамично развивают программные комплексы, основанные на графах знаний. Данный подход позволяет представлять и обрабатывать данные в форме семантически связанных знаний, т.е. в формате, приближенном к человеческому восприяти... (Источник)

Основные технологии вышеуказанного подхода:

  • модели представления данных: RDF, RDF*, LPG;
  • стандарты и языки для описания онтологий RDFS, OWL и т.д.;
  • графовые СУБД и RDF-хранилища;
  • языки запросов: SPARQL, Cypher, Gremlin, GraphQL и т.д.

Международные компании – лидеры по применению данных технологий: Apple, Amazon, Microsoft, Alibaba, Google, Facebook, Twitter и т.д. В Россий применяют аналогичные решения для построения графов знаний: ФНС, ФСС и т.д. В настоящее время по всему миру созданы сотни графов знаний, самые крупные из которых хранят миллиарды фактов (онтологических утверждений): DBPedia, DataWiki, Google Knowledge Graph, BioPortal и т.д.


«Слабые места» современных технологий


Существующие технологии управления знаниями отлично решают проблему поиска информации по семантическим запросам, однако, крайне неэффективно осуществляют семантическое представление знаний для сложных предметных областей. Данная проблема не может быть решена текущими технологиями потому, что их выразительные возможности существенно уступают возможностям человеческого языка. В частности:

  • описание предметной области в модели представления данных RDF представлено в упрощенной форме – в виде триплетов «Субъект – Предикат – Объект», не предполагающей описания большого количества свойств ресурсов и условий их применения;
  • описание предметной области в моделях представления данных RDF* и LPG позволяет ввести дополнительные свойства, что существенно повышает возможности описания, однако данные модели не обладают формализованными правилами семантики.

      Таким образом, можно сделать вывод, что существующий уровень технологий управления знаниями не может обеспечить возможность программным инструментам машинной обработки самостоятельно, т.е. без настройки человеком, осуществлять обработку информации в любых предметных областях (для отдельных, «простых» предметных областей такая возможность уже существует), а также закреплять новую полученную информацию в виде знаний (по аналогии с человеческим мозгом).

      Решение вышеуказанной проблемы заключается в построении семантической информационной модели предметной области, основанной на формализованном языке описания знаний, близком по своим возможностям к естественному человеческому языку, для структурированного семантического представления и хранения информации, а также формировании и хранении в модели новых знаний, описанных в виде правил.

Т Е Х Н О Л О Г И Я    B R A V O

Язык описания знаний DSL

DSL (Semantic Description Language) – формализованный язык описания, обладающий свойствами естественного языка, разработанный для понимания компьютерными системами. DSL обеспечивает семантическое структурирование описаний. DSL поддерживает следующие семантические категории:

Объект - это сущность, выделяемая при формировании модели непосредственно из проблемной среды и выступающая в дальнейшем в качестве предмета описания. Сущности, обладающие структурой, в зависимости от характера взаимосвязей между ее частями, а также контекста их рассмотрения могут трактоваться либо как сложные объекты, либо как ситуации. Объекты могут быть общими именами и индивидными объектами. Общее имя является именем некоторого класса сущностей. Индивидный объект – это конкретный экземпляр сущности.

Признак – это сущности, выступающие в роли характеристик. Признаки могут быть различного типа: качественные, количественные, дата/время, строки, фотографии и т.д. Признаки могут быть конкретными (например, конкретная дата) или иметь интервалы значений (например, период дат).

Параметр – семантическая координата, позволяющая соотносить описания различных сущностей между собой. Семантические координаты определяют механизмы сопоставления сущностей в многомерном пространстве.

Предложение (высказывание, взаимосвязь) - отражает некоторый факт - наличие или отсутствие определенных связей между ее сущностями или сущностями и их характеристиками. Факт трактуется как значение высказывания. Модификаторы могут менять интерпретацию высказывания (например, отрицание высказывания, возможность этого факта и др). Специализированным вариантом высказывания являются «императивы», которые позволяют автоматически получать значения своих параметров в зависимости от других фактов в Модели (например, императив «возраст» автоматически рассчитывает возраст по наличию факта о дате рождения).

Информационный образ – совокупность высказываний, объединенных в один информационный блок. Информационный образ может объединять высказывания различными логическими операциями (И,ИЛИ,ИСКЛИЛИ). Если логическая операция не задана, то информационный образ трактуется как перечень фактов.

Описание – совокупность информационных образов и/или независимых высказываний, которые описывают некоторую сущность. Описание имеет собственный идентификатор. Описание может содержать не полную информацию и информацию из различных источников. Описание используется для индивидных сущностей.

Определение – специализированный вид описания, задаваемый для классов сущностей. Высказывания, содержащиеся в определении, задают класс сущности и позволяют относить описания к различным классам.

Модификатор – элемент описания сущностей, позволяющий задавать трактовку высказываний. Модификаторы играют как семантическую роль, так и обеспечивают технические свойства описания – могут задавать уровни доступа к высказываниям, нести оценку высказывания (например, вероятность 0.9, т.е. задавать нечеткую логику для высказываний), привязывать ассоциированные процедуры на высказывания.

DSL является открытым языком, что позволяет добавлять в него синтаксические конструкции и обеспечивать их семантическую интерпретацию.

Описание на языке DSL имеет отображение в виде электронной карточки, содержащей предложения языка, которые объединены в «параметрическое дерево». Содержание электронной карточки объекта строится автоматически по описанию этого объекта. При изменении или расширении описания объекта вся новая информация будет автоматически отображаться в электронной карточке.

  1. Вся информация в описании объекта может быть разделена на смысловые закладки: личные данные, семья, работа и т.п.
  2. В качестве характеристик объекта могут выступать различные типы данных: числовые, текстовые, графические и др.
  3. Предложения языка DSL могут быть «императивными» - автоматически вычисляться системой в момент обращения к ним.
  4. Простые, характеристические, предложения языка DSL - обеспечивают представление простых свойств объектов предметной области.
  5. Составные предложения, обеспечивающие отображение составных характеристик или отображение разнообразных связей между объектами.
  6. В описание объекта возможно использование одного предложения несколько раз с различными значениям.

Семантическая модель предметной области (SDM)

SDM (Semantic Domain Model) – это семантически структурированное описание предметной области на языке DSL.

SDM состоит из 2-х частей:

BM (базовая модель) – обеспечивает определение всех используемых в модели понятий, задает классы сущностей и различные иерархические взаимосвязи между классами сущностей. ВМ определяет всю лексику для построения описания на DSL, только определенные в ВМ могут быть использованы для построения IM. BM обеспечивает функции сопоставления классов сущностей с учетом всех иерархических взаимосвязей.

IM (информационная модель) – содержит описание всех экземпляров сущностей (индивидных сущностей), составленных на языке DSL.

SDM может содержать несколько семантических уровней, когда сущности на одном уровне имеют дополнительные описания на другом уровне (например: характеристика «зеленый цвет» может иметь собственное описание в виде «конкретной длины волны» и выступать уже в роли «объекта» в описании другого уровня). В IM также хранится описание интерфейса пользователя, правила администрирования, ассоциированные процедуры и др.

Хранилище SDM построено по принципу хранения описания одной сущности целиком в виде одного информационного блока. Для сущностей любого класса можно задать собственное хранилище что позволяет настраивать хранилище в зависимости от задачи и масштабировать его во время эксплуатации. Разделение хранения сущностей по классам позволяет оптимизировать поиск нужных сущностей только в требуемых хранилищах (например: если хранить документы по годам, то поиск требуемого документа будет осуществляться только в хранилище соответствующего года)

Отличие DSL от OWL

OWL DSL
В основе построения описаний на OWL лежит понятие «триплет» (субъект-предикат-объект), что эффективно для описания простых взаимосвязей, при необходимости описания сложных связей используется множество «триплетов» В DSL используется понятие «предложение» которое является n-арным предикатом, обеспечивающим взаимосвязь множества Термов. Различные взаимосвязи (предикаты) могут иметь различную структуру с разным количеством Термов
Для построения описаний используются только 3 категории (субъект, предикат, объект) Для построения описаний используются 8 категорий (см. выше)
Все виды связей описываются одной конструкцией «триплетом» Возможность использования различных конструкций для разных связей: предложения, информационные образы, определения, иерархии и др.
Однозначная трактовка взаимосвязи (для обеспечения различных трактовок, нужно создавать новые взаимосвязи) Возможность использования «модификаторов» для задания трактовки взаимосвязи (например связь «смотреть» может иметь трактовку «посмотрел», «будет смотреть» «не смотрел» …)
Нет возможности задания вычисляемых взаимосвязей Возможности задания вычисляемых взаимосвязей (императивов)
Ориентирован на решение информационно-поисковых задач Возможность создания прикладных решений любого назначения (управление предприятием, управление персоналом, управление процессами и др)

С Ц Е Н А Р И И    П Р И М Е Н Е Н И Я    B R A V O

Построение семантических моделей и семантическая интеграция данных

Основной особенностью, существенно отличающей СУБД Bravo от других инструментов и технологий, является создание семантической информационной модели предметной области и на ее основе формирование описаний сущностей предметной области (цифровых двойников). Это утверждение означает, что все информационные объекты и их связи между собой будут семантически определены и структурированы в формате приближенном к возможностям человеческого восприятия. Представление информации в такой форме на порядки увеличивает возможности по анализу информации, в том числе и с применением программных инструментов машинной обработки, изначально обученных на данной семантической модели и предназначенных для дальнейшего самостоятельного обучения и обработки информации.

СУБД Bravo обладает наибольшими среди существующих технологий возможностями для организации семантической виртуальной и/или физической интеграции с различными структурированными и неструктурированными источниками данных.

Семантическая интеграция с использованием СУБД Bravo применима в условиях:

  • неоднородности форматов;
  • семантической неоднородности;
  • распределенности данных;
  • неоднородности наименований;
  • неоднозначности и эволюции данных.

За счет своих технологических возможностей СУБД Bravo может использоваться в качестве гибридного хранилища данных как для организации физической интеграции источников данных с переносом и преобразованием данных в формат SDM, так и для организации виртуальной интеграции источников данных с хранением их в нативных форматах и формированием запросов к ним на языке описания знаний DSL с преобразованием «на лету» запросов в нативные форматы.

Аналитическая платформа

Работа с информацией на уровне семантической информационной модели предметной области позволяет существенно повысить аналитические возможности. Данные возможности основаны на следующих свойствах СУБД Bravo:

  1. вся информация, содержащаяся в СУБД Bravo*, собирается и структурируется в модели в семантически и интуитивно понятной форме;
  2. для всех информационных объектов в модели семантически определены их взаимосвязи;
  3. структура представления информации в модели схожа с восприятием информации человеческим мозгом;
  4. для работы с моделью не требуется знаний по программированию и администрированию СУБД;
  5. в результате выполнения поисковых и аналитических запросов формируются новые знания о предметной области, которые можно записывать в модель в виде правил, а также определять условия выполнения данных правил;
  6. правила работы со знаниями являются неотъемлиемой частью модели, а не хранятся в прикладных программах (по аналогии с человеческим мозгом – когда человек получает новые знания, то они просто запоминаются им и в дальнейшем естественным образом применяются);
  7. задание семантически связанных многофакторных поисковых и аналитических запросов может осуществляться как средствами интерфейса, так и на языке описания знаний DSL;
  8. использование встроенных функциональных блоков и библиотек, а также пользовательских модулей, реализованных на различных языках программирования (Python, C/C++, Java, PHP), для применения методов искусственного интеллекта, позволяет осуществлять интеллектуальный анализ данных за счет:

    • операций логического вывода;
    • машинного обучения;
    • обучения нейронных сетей и глубокого обучения.

  9. задание запросов с помощью различных языков программирования (Python, C/C++, Java, PHP).

* Для источников данных, содержащихся в нативных форматах, в семантической информационной модели определяется единая логическая схема взаимодействия.

СУБД для приложений различного назначения

  • системы управления ресурсами предприятия (ERP);
  • системы управления взаимоотношениями с клиентами (CRM);
  • системы управления производственными процессами (MES);
  • системы управления данными об изделиях (PDM);
  • системы управления персоналом (HRM);
  • системы электронного документооборота (СЭД, ECM);
  • медицинские информационные системы (МИС);
  • системы поддержки принятия решений (СППР, DSS);
  • прочие.

Источник Знаний

ВИДЕОУРОКИ

К О Н Т А К Т Ы

Адрес:

Copyright © 2006-2020 - Bravosoft