Справочник функций

Ваш аккаунт

Войти через: 
Забыли пароль?
Регистрация
Информацию о новых материалах можно получать и без регистрации:

Последние темы форума

Показать новые сообщения »

Почтовая рассылка

Подписчиков: 11715
Последний выпуск: 19.06.2015

Проблемы моделирования предметных областей в информационных системах

Автор: Г.Востров, Е.Малахов, К.Корнилова

Контакты: fsage@yandex.ru, expert_trade@hotmail.com globchem@hotmail.com

Интенсивное развитие информационных технологий с каждым годом делает разработку информационных систем (ИС) одним из определяющих факторов успеха в каждой области бизнеса, промышленности, также и в сфере научных исследований. Основной компонентой любой информационной системы является предметная область. В настоящее время отсутствует общепризнанное формальное определение понятия предметной области. К сожалению, отсутствует и ее содержательное определение. Принято считать, что понятие предметной области не может быть формализовано как первичное понятие [1]. Отсутствие конструктивного определения понятия предметной области существенно сдерживает развитие математической теории информационных систем и информационных технологий [2].

В последние годы в теории баз данных и информационных хранилищ сформировались новые направления научных исследо-ваний, получившие название теории концептуального моделирования в базах данных, корпоративных хранилищах данных. Последующим развитием создаваемой теории стало развитие методов моделирования предметных областей в информационных системах.

Для того чтобы ИС адекватно отражала информацию с помощью данных необходимо сформулировать понятие предметной области (ПрО), которое представляет интерес для данного исследования. Некоторые авторы, [3], определяют ПрО как часть реального мира (класс или совокупность классов реальных объектов), подлежащая модельному отражению с целью ее изучения под некоторым вполне определенным углом зрения, который также входит в понятие предметной области. Но рассмотрение предметной области, как некоторой части реального мира, не позволяет построить ее приемлемое определение ни с содержательной, ни с формальной точки зрения.

Также под ПрО понимают взаимодействие т.н. трех миров, это значит, что стало общепризнанным фактом, что реальный мир есть продукт взаимодействия трех миров: физического, ментального и платоновского математического — рис. 1.

ris1.jpg
Рис. 1. Три “мира” — платоновский математический, физический, ментальный и схема их взаимодействия

При этом ни об одном из этих миров, об их структуре, свойствах нет полной информации. Еще меньше известно о том, каким законам подчиняется взаимосвязь этих миров, является ли она постоянной или изменяется в пространстве и времени по весьма сложным динамическим законам.

В этих сложных и весьма неопределенных условиях возникает потенциально бесконечное множество других проблем. Одна из них связана с самим понятием — предметная область. Построению содержательного его определения должно предшествовать разъяснение того, какой смысл мы вкладываем в это понятие. Необходимо заметить, что в каждом из миров: физическом, ментальном, платоновском математическом в свою очередь можно выделить предметные области. Предметная область реального мира является продуктом взаимодействия соответствующих предметных областей каждого из миров. Очевидно, что каждый из миров имеет структуру пространства. Однако мы располагаем крайне ограниченными знаниями о том, как устроены эти пространства. Особенно, это касается ментального мира. Можно сказать, что наиболее исследовано пространство физического мира и его структура. Математический мир представляется достаточно глубоко изученным, но значительное количество нерешенных фундаментальных математических проблем не позволяют сформулировать четкие предположения о структуре его пространства.

Несмотря на отмеченные сложности, теории всех типов миров продолжают активно развиваться. В этом развитии немаловажное влияние оказывает создание теории предметных областей. Однако любая предметная область является частью реального мира, который в свою очередь является продуктом взаимодействия трех отмеченных миров. Отношения между предметными областями и связанными с ними информационными системами в общем случае не носят четко выраженный и однозначно определенный характер взаимодействия между ними и взаимного влияния. Под последним подразумевается существование процессов, которые с одной стороны по мере углубления содержательных представлений о предметной области и развития их формальной теории, позволяют строить все более совершенные, интеллектуализированные информационные системы, а с другой стороны развитие математической теории информационных систем приводит к созданию совершенно новых поколений методов углубления и расширения знаний о предметных областях. Несмотря на взаимное, постоянно развивающееся взаимодействие друг с другом, оно не носит симметричный характер.

В связи со всем вышеизложенным приведем построенную модель организации любой информационной системы с учетом влияния на нее предметной области — рис.2.


Рис.2. Модель организации информационной системы

Т.е. информационная система состоит из баз данных, информационных хранилищ и баз знаний, которые реализуют функции сбора, обработки, поиска, выдачи и передачи информации. При этом каждый из этих носителей может использоваться как отдельная специфическая модель предметной области (МПО) ИС, так и в совокупности — интегрированная МПО.

Входной информацией в таких моделях взаимодействия могут быть сигналы вида:

1. и — функции одной и многих переменных, зависящие от времени.

2. — случайные величины.

3. — случайные процессы.

При создании БД используется априорная информация, полученная при решении индивидуальных задач, массовых проблем при приближенном значении их параметров, которая размещается в базе пользователями (экспертами). Зачастую эксперты пользуются субъективными представлениями о предметной области. После проведения анализа и дополнительной обработки информация из БД поступает в информационное хранилище, а после с помощью различных математических средств наполняет базу знаний.

Прежде всего, следует отметить, что сама необходимость построения информационных систем над предметной областью возникает в силу того, что над ней постоянно существует потребность решения различных классов массовых проблем и индивидуальных задач. В каждый момент времени t в силу причин, обусловленных возникшей ситуацией в предметной области и ее состоянием формируется определенное множество массовых проблем, подлежащих решению. В каждые моменты времени t1,…tN,.. каждая массовая проблема индуцирует соответствующее множество индивидуальных задач. Рассмотрим основные классы содержательно формулируемых проблем над предметными областями, потребность решения которых возникает в различные моменты времени.

Рассмотрим подробнее механизм наполнения БД из предметной области информационной системы. В процессе экономической деятельности человека возникает необходимость систематического решения заданного множества массовых проблем или выделенного множества индивидуальных задач, которые определены над выделенной предметной областью или многообразием ее подобластей. Решение индивидуальной задачи может быть либо однозначным, либо многозначным.

Однозначное решение определяется парой множеств следующего вида:

QUOTE , (1)

где – множество конкретных значений, заданных m переменных, а – множество значений, связанных предметных множеств множества . Если массовая проблема является детерминированной, то множество решения определяется однозначно. В случае стохастической массовой проблемы множество решения носит случайный характер, включая значения переменной n.

В том случае, когда индивидуальная задача имеет многозначное решение каждому конкретному множеству значений параметров соответствует множество решений . Множества могут отличаться значения , а также составом переменных в том смысле, что отдельные переменные могут входить во все множества, а отдельные переменные могут входить в одни решения и не входить в другие.

Расширение множества решаемых индивидуальных задач приводит к расширению множества свойств предметной области, которые включаются в многообразие факторов в терминах строится достаточно полное описание с требуемой степенью определенности, достоверности и непротиворечивости описание определенных предметных областей, множеств предметных областей и подобластей, объектов, агрегатов, свойств различной структуры.

Следует отметить, что на каждой итерации, расширения уточнения выделенной структуры предметной области, одновременно уточняется и определение, представление, формируется приближенное формальное ее представление. Множество решений индивидуальных задач по существу определяют исходную таблицу конструируемого реляционного отношения. Множество свойств создаваемого реляционного отношения может включать как свойства предметных областей так и множеств предметных областей и их подобластей, объектов, топологических структур на многообразиях свойств самой различной природы. В создаваемую математическую структуру могут входить классы объектов, кластерные образования, ситуации, состояния, траектории эволюции, типологические многообразия различной природы.

Положим, что на q-ой итерации в процессе решения выделенного множества массовых проблем и соответственно множеств индивидуальных задач сформированы совокупности множества свойств вида:

, (2)

где первый индекс совместно со вторым определяет положение свойства в некотором упорядочении, индексы типа pl определяют номер массовой проблемы в заданной упорядочении, индексы типа os определяют номер объекта в заданном классе ir и так далее.

Все данные, полученные в процессе решения выделенных множеств индивидуальных задач могут быть организованы в таблицу. Она является основой реляционного отношения совершенного нового класса.

Ее главным достоинством является то обстоятельство, что совокупности соответствующих атрибутов

, (1.3)

поставлено в соответствие множество решений множества индивидуальных задач .

Полученное таким образом реляционное отношение в общем случае не относится к классическому типу реляционных отношений. Это прежде всего связано с тем, что в одно реляционное отношение включается свойства весьма различных элементов предметной области.

Следует заметить, что множество содержательно формулируемых проблем над любой предметной практически неограниченно [1]. Однако из всего многообразия содержательно поставленных и формализованных проблем обычно выделяется конечное подмножество, которое сформировалось благодаря научно-техническому прогрессу, развитию социальных, экономических систем, разработке современных систем управления предметной областью, прогнозированию динамики ее развития и ряда других факторов.

Во всем многообразии массовых проблем, формулируемых над предметными областями, в настоящее время ключевыми являются следующие классы:

  • решение сформулированного класса запросно-ответных задач;
  • построение систем информационной поддержки процедур принятия решений;
  • построение траектории динамики предметных областей, подобластей, объектов, свойств в пространствах функционирования;
  • создание математических методов расширения и углубления знаний о предметной области;
  • разработка систем управления предметными областями относительно выбранной системы критериев и поставленных целей.

Следует заметить, что каждый из приведенных классов массовых проблем описан весьма в общих чертах. В действительности любой из этих классов может быть разложен на самостоятельные массовые проблемы в зависимости от их вычислительной сложности, каждый под класс массовой проблемы решается весьма существенно отличающимися алгоритмами [4].

Построение достаточно точного математического описания и представления предметных областей их объектов в терминах их свойств, представляет собой весьма сложную проблему. Не смотря на отсутствие эффективных математических методов решения данной проблемы, в процессе хозяйственной деятельности человека возникает необходимость систематического решения заданного множества массовых проблем или выделенного множества индивидуальных задач, которые определены над выделенной предметной областью или многообразием ее подобластей.

Но следует отметить, что предметные области в значительной степени существуют, не зависимо от существования информационных систем. Это следует из того, что как часть реального мира, предметные области в своем развитии значительно в большей степени зависят от динамики других предметных областей, чем от информационной системы, создаваемой в их среде. Все же в зависимости от целенаправленности построения информационной системы зависит эффективность решения классов задач над предметной областью.

Необходимо признать, что неполнота, размытость, неопределенность, недостижимость и противоречивость априорных представлений о предметной области приводит к построению достаточно примитивных информационных систем на первых этапах их проектировании и создания. По существу это и является ключевым фактором, обуславливающим разработку методов математического моделирования предметных областей в информационных системах.

Создается достаточно глубокая проблема неоднозначности выбора предметной области, как объекта моделирования, в информационных системах. Неоднозначность выбора модели предметной области (МПО) влечет за собой низкую степень адекватности математической модели, что в свою очередь влечет ограниченный характер возможности решения целых классов важных математических проблем над предметной областью.

Эти обстоятельства предопределяют циклический итерационный характер необходимости углубления и расширения знаний о предметной области, увеличения объема накопленной информации, что практически целенаправленно приводит к увеличению степени адекватности математических моделей предметных областей в информационных системах, что приводит к существенному расширению математических и содержательно сформулированных проблем, которые могут уже решаться над предметной областью.

Такая ситуация приводит к необходимости разработки современных методов проектирования, построения, планирования и управления информационными системами. Она и обусловила небывало высокий уровень развития информационных систем важными компонентами, которые стали: базы данных, информационные хранилища и базы знаний [1…2]. Их развитие и совершенствование не только расширит классы решаемых над предметной областью проблем, но приведет к созданию средств семантического моделирования, которые позволили для любого решения находить четкую содержательную интерпретацию.

Для построения структуры предметной области необходимо располагать достаточной детальной информацией и знаниями, позволяющими с требуемой полнотой и точностью ответить на ряд вопросов, касающихся предметных областей, подобластей, операций над ними, закономерностей взаимодействия между ними. К множеству проблемных вопросов, задач, построений методов можно отнести следующую последовательность:

1. По каким причинам над одной и той же областью физического мира может быть выделено множество различных предметных областей (на рис. 2 обозначены большими эллипсами), или подобластей (на рис. 2 обозначены малыми эллипсами) одной и той же предметной области;

2. Чем в отличаются предметные области или подобласти выделенные над заданной областью физического мира;

3. Содержательное и приближенное математическое определение предметной области в общих чертах (абстракция предметной области).

4. Определение конкретной предметной области и в чем состоят его принципиальные отличия от общего определения;

5. В чем состоят отличия конкретных областей и подобластей построенных (выделенных) над одной и той же областью физического мира;

6. В чем заключаются отличия описания предметной области, в общем от конкретного описания предметных областей и подобластей;

7. Общие принципы выделения подобластей предметной областей на основе заданной системы факторов;

8. Отношения между предметными областями и их информационными системами:

8.1. ИС является частью предметной области;

8.2. ИС находится вне среды предметной области и связана с ней только системой каналов связи;

8.3. ИС частично пересекается с предметной областью.

Получение ответов на сформулированные вопросы, решение поставленных задач позволяет обосновывать выбор метода построения математических моделей предметных областей в информационных системах, разработать систему критериев для оценки степени адекватности математических моделей предметных областей.

Таким образом, чтобы получить необходимую информацию от ИС необходимо моделировать предметную область. Но, проблема в том, каким будет алгоритм построения математической модели предметной области, какими свойствами он обладает, как накапливается и обрабатывается информация в ИС с помощью этого алгоритма — является проблемой моделирования предметных областей ИС. Кроме того, алгоритмов моделирования может существовать много, но для исследователей, пользователей и экспертов представляют интерес те алгоритмы, которые адекватно описывают ПрО. Следовательно появляется еще одна проблема в математическом моделировании предметных областей — проблема оценки (критериев) адекватности ИС относительно предметной области.

Каждая из кратко описанных процедур может быть детализирована до уровня формально представленного алгоритма. Далее детализируем функционирование ПрО и ИС с помощью итерационного алгоритма.

Р1 — на основе содержательного определения К-1 итерации накапливается дополнительная совокупность данных о предметной области;

Р2 — накопленный массив данных размещается в базе данных предметной области, с помощью разработанной информационной технологии корректируются информационные хранилища и база знаний;

Р3 — совершенствуется совокупность инструментальных средств, предназначенных для анализа и обработки информации в базе данных информационного хранилища и базе знаний;

Р4 — с помощью усовершенствованных инструментальных средств строится уточненное содержательное определение предметной области;

Р5— на основе скорректированной базы данных, информационного хранилища и базы знаний уточняется математическая модель предметной области в создаваемой информационной системе, и ее содержательное определение;

Р6— проверяется степень адекватности математической модели предметной области на основе разработанной и постоянно совершенствуемой системы критериев. Если степень адекватности удовлетворяет заданным условиям, то полученное содержательное определение предметной области принимаем за основу для построения конструктивного (формального) определения предметной области.

Для того чтобы ИС существовала (работала) долго и ее эксплуатация приносила ощутимую выгоду, необходимо тщательно проектировать и ее архитектуру, и ее составные компоненты.

Литература

  1. Цаленко М.Ш. Моделирование семантики в базах данных. — М.:Наука. — 1989 — 287 с.
  2. Деметрович Я., Дьепеши Д. Аксиоматизирование обобщенных функциональных зависимостей в реляционных банках данных. // Кибернетика. — Вып. 2. — 1981. С.42 — 48.
  3. Христьяновский Д.Г., Эрлих А.И. Проблемы моделирования в прикладных интеллектуальных системах.
  4. Гери Б., Джонсон Д. Вычислительные машины и труднорешаемые задачи. — М.: Мир. — 1982 — 456 с.

Оставить комментарий

Комментарий:
можно использовать BB-коды
Максимальная длина комментария - 4000 символов.
 
Реклама на сайте | Обмен ссылками | Ссылки | Экспорт (RSS) | Контакты
Добавить статью | Добавить исходник | Добавить хостинг-провайдера | Добавить сайт в каталог