Текст книги "Проектирование распределенных информационных систем"
Автор книги: Елена Чернопрудова
Жанр: Техническая литература, Наука и Образование
сообщить о неприемлемом содержимом
Текущая страница: 3 (всего у книги 9 страниц)
Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной.
Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.
В то же время понятная, но известная компетентному пользователю информация представляет собой для него тоже семантический шум.
Рисунок 1.9 – Зависимость Jc = f (Sn)
При разработке информационного обеспечения АИС следует стремиться к согласованию величиныŜ и Sn так, чтобы циркулирующая в системе информация была понятна, доступна для восприятия и обладала наибольшей содержательностью S, т.е.
S = Jc/Vд
Прагматическая мера информации – это ее полезность, ценность для управления. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе.
Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция управления системой. В автоматизированной системе управления производством, например, ценность информации определяется эффективностью осуществляемого на ее основе экономического управления, или иначе, приростом экономического эффекта функционирования системы управления, обусловленным прагматическими свойствами информации:
Jnβ (γ) = П (γ/β) – П (γ),
где: Jnβ (γ) – ценность информационного сообщения β для системы управления γ;
П (γ) – априорный ожидаемый экономический эффект функционирования системы управления γ;
П (γ/β) – ожидаемый эффект функционирования системы γ при условии, что для управления будет использована информация, содержащаяся в сообщении β.
Поскольку экономический эффект функционирования АИС складывается из экономического эффекта решения отдельных функциональных задач, то для вычисления Jn следует определить:
Zβ -множество задач, для решения которых используется информация β;
F – частоту решения каждой задачи за период времени, для которого оценивается экономический эффект;
Rβ – степень влияния информационного сообщения β на точность решения задачи, 0≤ R ≤ 1.
Тогда:
где Пj – экономический эффект от решения j-й задачи в системе.
В такой постановке единицей измерения ценности информации АИС является обычно рубль.
Качество информации.
Информация в АИС является и предметом труда и продуктом труда, поэтому от ее качества существенно зависят эффективность и качество функционирования системы.
Качество информации можно определить как совокупность свойств, обусловливающих возможность ее использования для удовлетворения определенных в соответствии с ее назначением потребностей.
Возможность и эффективность использования информации для управления обусловливается такими ее потребительскими показателями качества, как репрезентативность, содержательность, полнота, доступность, актуальность, своевременность, устойчивость, точность, достоверность и ценность.
Репрезентативность информации связана с правильностью ее отбора и формирования с целью адекватного отражения заданных свойств объекта. Важнейшее значение здесь имеют: правильность концепции, на базе которой сформулировано исходное понятие; обоснованность отбора существенных признаков и связей отображаемого явления; правильность методики измерения и алгоритма формирования информации.
Содержательность информации – это ее удельная семантическая емкость, равная отношению количества семантической информации в сообщении к объему данных, его отображающих, т.е. S = Ic/Vд. С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
Полнота информации означает, что она содержит минимальный, но достаточный для принятия правильного управленческого решения состав (набор показателей). Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижают эффективность управления; наивысшим качеством обладает именно полная информация.
Доступность информации для восприятия при принятии управленческого решения в АИС обеспечивается выполнением соответствующих процедур ее получения и преобразования. Так, назначением автоматизированной системы обработки данных и является увеличение ценности информации путем согласования ее с тезаурусом пользователя, т.е. преобразование ее к доступной и удобной для восприятия управляющими органами форме.
Актуальность определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от статистических характеристик отображаемого объекта (от динамики изменения этих характеристик) и от интервала времени, прошедшего с момента возникновения данной информации.
Своевременность информации: своевременной является такая информация, которая может быть учтена при выработке управленческого решения без нарушения установленной процедуры и регламента, т.е. такая информация, которая поступает на тот или иной уровень управления не позже заранее назначенного момента времени, согласованно со временем решения задачи управления.
Устойчивость есть свойство управляющей информации реагировать на изменения исходных данных, сохраняя необходимую точность. Устойчивость информации, как и ее репрезентативность, обусловлены методической правильностью ее отбора и формирования.
Точность информации определяется степенью близости отображаемого информацией параметра и истинного значения этого параметра.
Для экономических показателей, отображаемых цифровым кодом, известны четыре классификационных понятия точности:
– формальная точность, измеряемая значением единицы младшего разряда числа, которым показатель представлен;
– реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
– достижимая точность, – максимальная точность, которую можно получить в данных конкретных условиях функционирования системы;
– необходимая точность, определяемая функциональным назначением показателя.
Достоверность информации – это свойство информации отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
Наряду с понятием «достоверность информации» существует понятие «достоверность данных» т.е. информация, рассматриваемой в синтаксическом аспекте. Под достоверностью данных понимается их безошибочность; измеряется она вероятностью появления ошибок в данных.
Недостоверность данных может не повлиять на объем данных, а может и увеличить его в отличии от недостоверности информации, всегда уменьшающей ее количество.
Ценность информации – комплексный показатель ее качества, ее мера на прагматическом уровне.
Исследования показывают, что для целевой функции оптимизация функционирования методически правильно спроектированной информационной системы в качестве ограничений, обусловливаемых параметрами качества информации, достаточно использовать ограничения только по полноте, своевременности и достоверности.
Понятие о базах данных.
Термин база данных (database) страдает от обилия различных интерпретаций. Он использовался ранее для обозначения чего угодно – от обычной картотеки до многих томов данных, которые правительство собирает о своих гражданах.
Рассмотрим некоторые из них.
Определение 1 База данных – это компьютеризированная система хранения информации, основная цель которой содержать информацию и предоставлять её по требованию.
Определение 2 База данных – это хранение структурированных данных, при этом данные должны быть не противоречивыми, минимально избыточными и целостными.
В настоящее время действует Закон «О правовой охране программ для ЭВМ и баз данных» от 23.09.92 г. В нем дается определение БД:
Определение 3 База данных – это объектная форма представления и организации совокупности данных (например статей, расчетов), систематизированных таким образом, чтобы эти данные могли быть найдены и обработаны с помощью ЭВМ.
Определение 4 База данных – это набор интегрированных записей с самоописанием.
Определение 5 База данных – это организованная в соответствии с определенными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей.
Определение 6 База данных – именованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области.
В Толковом словаре по вычислительным системам дается следующее определение: Определение 7 База данных, в обычном, строгом смысле слова – файл данных, для определения и обращения к которому используются средства управления базой данных.
Рассмотрим определение базы данных Дэвида Кренке, который предложил использовать термин база данных в конкретном значении:
Определение 8 База данных – это самодокументированное собрание интегрированных записей.
Возьмем данное определение за основное, как самое лаконичное и объемное. Обсудим данное определение. База данных является самодокументированной (self-describing) если она содержит, в дополнение к исходным данным пользователя, описание собственной структуры. Это описание называется словарем данных (data dictionary), каталогом данных (data directory) или метаданными (metadata).
Интегрированность записей проявляется в стандартной иерархии данных, которая выглядит следующим образом: биты объединяются в байты, или символы; символы группируются в поля; из полей формируются записи; записи организуются в файлы. Информационная технология баз данных была разработана для того, чтобы преодолеть ограничения, свойственные системам обработки файлов. Чтобы понять, каким образом это было сделано, сравните систему обработки файлов (рисунок 1.10) с системой обработки базы данных (database processing system).
Рисунок 1.10 – Иерархия данных в системах баз данных
Программы обработки файлов обращаются непосредственно к файлам данных. В отличие от них, программы обработки баз данных для доступа к данным вызывают системы управления БД. Это отличие важно тем, что оно упрощает прикладное программирование: программистам больше не нужно задумываться о том, как физически организовано хранение данных, и они могут смело сконцентрироваться на вопросах, представляющих важность для пользователя, а не для компьютерной системы.
В зависимости от вида организации данных различают следующие основные модели представления данных в базе:
– иерархическую;
– сетевую;
– реляционную.
Иерархические модели данных имеют древовидную структуру, когда каждому узлу структуры соответствует один сегмент, представляющий собой поименованный линейный кортеж полей данных. Каждому сегменту соответствует один входной и несколько выходных сегментов (рисунок 1.11,а). Каждый сегмент структуры лежит на единственном иерархическом пути, начинающемся от корневого сегмента.
Для описания такой логической организации данных достаточно предусматривать для каждого сегмента данных только идентификацию входного для него сегмента. В иерархической модели каждому входному сегменту данных соответствует N выходных.
Рисунок 1.11 – Структура иерархической (а) и сетевой (б) БД
Сетевая модель БД во многом подобна иерархической.. Отличие заключается в том, что в сетевой модели для сегментов допускается несколько входных сегментов наряду с возможностью наличия сегментов без входов с точки зрения иерархической структуры. На рисунке 1.11,б представлен простой пример сетевой структуры, полученной на основе модификации иерархической структуры. Графическое изображение структуры связей сегментов в такого типа моделях представляет собой сеть. Сегменты данных в сетевых БД могут иметь множественные связи с сегментами старшего уровня.
Реляционной моделью БД называется модель, в которой средства управления БД поддерживают реляционную (табличную) структуру данных. Концепция реляционной модели была предложена в 1970 г. Эдгаром Коддом и имеет в настоящее время большое значение в деле организации работы с БД. Данная модель позволяет представить все данные в виде двумерного массива в виде таблиц, соответствующих какому-то определенному объекту или действию, называемым сущностью. Для работы с такой моделью используется математический инструмент – реляционная алгебра, позволяющая манипулировать данными путем склеивания и разрезания таблиц с использованием специального языка манипулирования данными (ЯМД). Итак, основой реляционных баз данных является таблица. Важно запомнить терминологию, которую используют разработчики баз данных.
В таблице 1.2 представлены термины, которые используют различные специалисты по базам данных.
Таблица 1.2
Системы управления базами данных (СУБД).
СУБД представляет собой совокупность лингвистических и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.
В Толковом словаре по вычислительным системам дано следующее понятие СУБД:
Система управления базой данных – система программного обеспечения, имеющая средства обработки на языке базы данных, позволяющая обрабатывать обращения к базе данных, которые поступают от прикладных программ и (или) конечных пользователей, и поддерживать целостность базы данных.
Заключение.
Итак, если мы уяснили основные понятия и определения теории информационных систем, можно считать, что цель вводного обучения достигнута.
В следующих лекциях будет раскрываться учебный материал на основе понятий и определений первой лекции.
Вопросы для самоконтроля.
1 Что называется данными?
2 Дайте определение и толкования термина «информация».
3 Что называется базами данных?
4 Как определить качество информации?
5 Какие показатели качества информации вы знаете?
6 Что означает тезаурус пользователя информации?
7 Какие модели данных вы знаете?
8 Дайте характеристику реляционных баз данных?
9 Какими терминами пользуются специалисты реляционных баз данных при разработке таблиц, строк, столбцов?
10 Что называется системой управления БД?
2 Лекция 2. Концепция баз данных и автоматизированных информационных систем
Концепция в общем смысле представляет некоторую систему взглядов на процесс или явление. Составными частями концепции являются совокупность принципов и методология. Под методологией понимается совокупность методов решения проблемы.
Принцип – правила, которыми следует руководствоваться в деятельности. Часто принципы формулируются в виде ограничений и требований, в частности, требований к базам данных.
Ключевые слова: базы данных, хранилище данных, информационнопоисковая система, информационно-советующая система, проектирование баз данных, создание и использование баз данных, функционирование баз данных.
Требования, предъявляемы к базам данных.
С современных позиций следует порознь рассматривать требования, предъявляемые к транзакционным (операционным) базам данных и к хранилищам данных.
Первоначально перечислим основные требования, которые предъявляются к операционным базам данных, а следовательно, и к СУБД, на которых они строятся.
1 Простота обновления данных. Под операцией обновления понимают добавления, удаления и изменения данных.
2 Высокое быстродействие (малое время отклика на запрос). Время отклика – промежуток времени от момента запроса к БД и фактическим получением данных. Похожим является термин время доступа – промежуток времени между выдачей команды записи (считывания) и фактическим получением данных. Под доступом пони мается операция поиска, чтения данных или записи их.
3 Независимость данных.
4 Совместное использование данных многими пользователями.
5 Безопасность данных – защита данных от преднамеренного или непреднамеренного нарушения секретности, искажения или разрушения.
6 Стандартизация построения и эксплуатации БД (фактически СУБД).
7 Адекватность отображения данных соответствующей предмет ной области.
8 Дружелюбный интерфейс пользователя.
Важнейшими являются первые два противоречивых требования: повышение быстродействия требует упрощения структуры БД, что, в свою очередь, затрудняет процедуру обновления данных, увеличивает их избыточность.
Независимость данных – возможность изменения логической и физической структуры БД без изменения представлений пользователей. Независимость данных предполагает инвариантность к характеру хранения данных, программному обеспечению и техническим средствам. Она обеспечивает минимальные изменения структуры БД при изменениях стратегии доступа к данным и структуры самих исходных данных. Это достигается, как будет показано далее, «смещением» всех изменений на этапы концептуального и логического проектирования с минимальными изменениями на этапе физического проектирования.
Безопасность данных включает их целостность и защиту. Целостность данных – устойчивость хранимых данных к разрушению и уничтожению, связанных с неисправностями технических средств, системными ошибками и ошибочными действиями пользователей.
Она предполагает:
– отсутствие неточно введенных данных или двух одинаковых записей об одном и том же факте;
– защиту от ошибок при обновлении БД;
– невозможность удаления порознь (каскадное удаление) связанных данных разных таблиц;
– неискажение данных при работе в многопользовательском ре жиме и в распределенных базах данных;
– сохранность данных при сбоях техники (восстановление данных).
Целостность обеспечивается триггерами целостности – специальными приложениями-программами, работающими при определенных условиях. Для некоторых СУБД (например, Access, Paradox) триггеры являются встроенными.
Защита данных от несанкционированного доступа предполагает ограничение доступа к конфиденциальным данным и может достигаться:
– введением системы паролей;
– получением разрешений от администратора базы данных (АБД);
– запретом от АБД на доступ к данным;
– формированием видов – таблиц, производных от исходных и предназначенных конкретным пользователям.
Три последние процедуры легко выполняются в рамках языка структурированных запросов Structured Query Language – SQL, часто называемом SQL2.
Стандартизация обеспечивает преемственность поколений СУБД, упрощает взаимодействие БД одного поколения СУБД с одинаковыми и различными моделями данных. Стандартизация (ANSI/SPARC) осуществлена в значительной степени в части интерфейса пользователя СУБД и языка SQL. Перейдем к требованиям, предъявляемым к хранилищам данных, которые структурно являются продолжением операционных баз данных.
Поскольку данные в хранилище практически не изменяются, а лишь добавляются, требование простоты обновления становится неактуальным. На первое место – в силу значительного объема данных в хранилище – выходит требование высокого быстродействия.
К хранилищам данных предъявляются следующие дополнительные требования:
– высокая производительность загрузки данных из операционных БД;
– возможность фильтрования, переформатирования, проверки целостности исходных данных, индексирования данных, обновления метаданных;
– повышенные требования к качеству исходных данных в части обеспечения их непротиворечивости, поскольку они могут быть получены из разных источников;
– высокая производительность запросов;
– обеспечение высокой размерности;
– одновременность доступа к ХД;
– наличие средств администрирования.
Э.Ф. Кодд на основе своего опыта предъявил следующие требования к системе OLAP:
– Многомерное концептуальное представление данных.
– Прозрачность технологии и источников данных.
– Доступность к источникам данных при использовании различных моделей данных.
– Неизменная производительность подготовки отчетов при росте объема, количества измерений, процедур обобщения данных.
– Использование гибкой, адаптивной, масштабируемой архитектуры клиент – сервер.
– Универсальность измерений (формулы и средства создания отчетов не должны быть привязаны к конкретным видам размерностей).
– Динамическое управление разреженностью матриц (пустые значения NULL должны храниться эффективным образом).
– Многопользовательская поддержка.
– Неограниченные операционные связи между размерностями.
– Поддержка интуитивно понятных манипуляций с данными.
– Гибкость средств формирования отчетов.
– Неограниченное число измерений и уровней обобщения.
Перечисленные требования отличны от требований к операционным БД, что вызвало появление специализированных БД – хранилищ данных.
Концепция построения баз данных.
Концепция предполагает изложение основных положений чего-либо. Описание концепции БД невозможно выполнить без учета хронологии.
1 Инженерные и экономические задачи. Первоначально (начало 60-х г. XX в.) использовалась файловая система хранения. Для решения преимущественно инженерных задач, характеризующихся небольшим количеством данных и значительным объемом вычислений, данные хранились непосредственно в программе. Применялся последовательный способ организации данных, имелась их высокая избыточность, идентичность логической и физической структур и полная зависимость данных.
С появлением экономико-управленческих задач (информационная система руководства – M1S), отличающихся большими объемами данных и малой долей вычислений, указанная организация данных оказалась неэффективной. Требовалось упорядочение данных, которое, как выяснилось, возможно было проводить по двум критериям: использование (информационные массивы); хранение (базы данных).
2 Информационно-поисковые и информационно-советующие системы управления. Следует отметить, что экономические задачи часто связаны с управлением организационными системами. По характеру применения компьютеров такие системы возможно разделить на информационно-поисковые (рисунок 2.1), получившие также название «традиционные», и информационно-советующие или современные (рисунок 2.2) системы. Сначала шло построение и изучение традиционных систем.
Рисунок 2.1 – Информационно-поисковая система
Рисунок 2.2 – Информационно-советующая система
3 Информационные массивы и базы данных. Первоначально в информационно-поисковых системах применяли информационные массивы. При этом возникала необходимость хранения избыточной информации при дефиците компьютерной памяти. Выяснилось так же, что алгоритмы задач более подвижны, чем данные для них. При довольно частом изменении алгоритмов в процессе совершенствования систем управления каждый раз требовалось проводить трудоемкую процедуру создания новых массивов. В этих условиях стало ясно превосходство баз данных, несмотря на их более сложную структуру по сравнению с системой массивов. В дальнейшем базы данных стали снабжаться программной составляющей, позволяющей легко реализовать и оперативно изменять алгоритмы приложения.
4 Модели данных. Использование файлов для хранения только данных (рисунок 2.3,а) предложено МакГри в 1959 г. В 1963 г. С. Бахман построил первую промышленную базу данных IDS с сетевой моделью данных, которая все еще характеризовалась избыточностью данных и ее использованием только для одного приложения. В 1969 г. сформировалась группа, создавшая набор стандартов CODASYL (КОДАСИЛ) для сетевой модели данных. Фактически начала тогда использоваться (рисунок 2.3,6) современная архитектура базы данных. Существенный скачок в развитии технологии баз данных произошел в 1970 г., когда М. Кодд предложил парадигму реляционной модели данных.
Рисунок 2.3. Файловая система (а) и СУБД (б) для хранения данных
Под парадигмой понимается научная теория, воплощенная в систему понятий, отражающих существенные черты действительности. Теперь логические структуры могли быть получены из одних и тех же физических данных, т. е. доступ к одним и тем же физическим данным мог осуществляться различными приложениями по разным путям. Стало возможным обеспечение целостности и независимости данных. В конце 70-х годов XX в. появились современные СУБД, обеспечивающие физическую и логическую независимость, безопасность данных, обладающие развитыми языками БД.
В начале 90-х годов реляционные БД получили наиболее широкое распространение, особенно при использовании персональных компьютеров. Появились разнообразные СУБД, рассчитанные как на пользователя-профессионала (в программировании), так и на пользователя-непрофессионала, предназначенные для построения и небольших (по объему памяти), и сверхбольших БД, работающие как в локальном, так и в сетевом режимах. При этом базы данных строились как статические (в зарубежной терминологии – операционные, транзакционные, Online Transactional Processing – OLTP).
К середине 90-х годов в базах данных накопилось такое количество информации, что ее стало возможным использовать для аналитических процедур выработки решений-советов. Появились динамические (аналитические) базы данных, называемые за рубежом Online Analytical Processing – OLAP. Их основными составляющими стали электронный архив и хранилище данных (Data Warehouse). Одновременно выявились недостатки реляционных БД, у которых появились конкуренты в виде объектно-ориентированных баз данных.
Последнее десятилетие характеризуется появлением распределенных и объектно-ориентированных баз данных, характеристики которых определяются приложениями средств автоматизации проектирования и интеллектуализации БД.
5 Подходы к построению БД. Они базируются на двух подходах к созданию автоматизированной системы управления (АСУ). Первый из них связан с автоматизацией документооборота (совокупность документов, движущихся в процессе работы предприятия).
К 90-м годам XX в. сформировался второй, современный подход, связанный с автоматизацией управления. Он предполагает первоначальное выявление стандартных алгоритмов приложений (алгоритмов бизнеса в зарубежной терминологии), под которые определяются данные, а стало быть, и база данных. Объектно-ориентированное программирование только усилило значимость этого подхода.
Состав БД для различных подходов представлен на рисунке 2.4.
Рисунок 2.4 – Схема классического (а) и современного (б) подхода при построении БД
В работе БД возможны одно– и многопользовательский режимы. В последнем случае несколько пользователей подключаются к одному компьютеру через разные порты.
6 Восходящее и нисходящее проектирование БД. Первое применяют в распределенных БД при интеграции спроектированных локальных баз данных, которые могут быть выполнены с использованием различных моделей данных. Более характерным для централизованных БД является нисходящее проектирование.
В последующих лекциях первоначально будет рассмотрен классический подход для централизованных БД, а затем – современный. Распределенным БД посвящены заключительные лекции.
Работа с базами данных может быть представлена в виде схемы, приведенной на рисунке 2.5. Из нее видно, что следует выделять методологию создания, методологию использования и методологию функционирования БД.
Рисунок 2.5 – Этапы создания (Cl, C2) и использования (И1 – ИЗ) БД
Методология БД определяется в процедуре проектирования, но проявляется и в процедуре использования.
7 Хранилище данных – предметно-ориентированный, интегрированный, привязанный ко времени и неизменный набор данных, предназначенный для поддержки принятия решений. В соответствии с определением хранилище данных ориентировано не на алгоритм приложения, как (операционная) БД, а на предметную область.
Интегрированность определяется тем фактом, что источниками данных могут быть несколько БД, которые могут иметь разные форматы данных и степень заполнения БД. Эти данные должны быть приведены к «стандарту», используемому в ХД. Привязка ко времени означает, что исходные данные характеризуют какой-то интервал времени, при этом время присутствует в БД явно. В силу этого вновь поступающие данные не изменяют прежние данные в ХД, а дополняют их.
Методология проектирования баз данных.
Существует много разновидностей методологии рассмотрения баз данных в классическом подходе, однако чаще всего придерживаются методологии ANSI/SPARC, схема которой представлена на рисунке 2.6. Совокупность процедур проектирования централизованной БД можно разделить на четыре этапа.
На этапе формулирования и анализа требований устанавливаются цели организации, определяются требования к БД. Для формирования специфических требований обычно используется методика интервьюирования персонала различных уровней управления. Все требования документируются в форме, доступной конечному пользователю и проектировщику БД.
Этап концептуального проектирования заключается в описании и синтезе информационных требований пользователей в первоначальный проект БД. Исходными данными могут быть совокупность документов пользователя при классическом подходе или алгоритмы приложений (алгоритмы бизнеса) при современном подходе. Результатом этого этапа является высокоуровневое представление (в виде системы таблиц БД) информационных требований пользователей на основе различных подходов. Сначала выбирается модель БД. Затем с помощью ЯОД создается структура БД, которая затем заполняется данными с помощью команд ЯМД, систем меню, экранных форм или в режиме просмотра таблиц БД. Здесь же обеспечивается защита и целостность (в том числе – ссылочная) данных с помощью СУБД или путем построения триггеров. В процессе логического проектирования высокоуровневое представление данных преобразуется в структуру используемой СУБД. Основной целью этапа является устранение избыточности данных с использованием специальных правил – нормализации.
Рисунок 2.6 – Этапы проектирования операционных БД
На этапе физического проектирования решаются вопросы, связанные с производительностью системы, определяются структуры хранения данных и методы доступа. Взаимодействие между этапами проектирования и словарной системой необходимо рассматривать отдельно. Процедуры проектирования могут использоваться независимо в случае отсутствия словарной системы. Сама словарная система может рассматриваться как элемент автоматизации проектирования. Средства проектирования и оценочные критерии используются на всех стадиях разработки. В настоящее время неопределенность при выборе критериев является наиболее слабым местом в проектировании БД. Это связано с трудностью описания и идентификации большого числа альтернативных решений. В то же время существует много критериев оптимальности, являющихся неизмеримыми свойствами, трудно выразимыми в количественном представлении или в виде целевой функции.
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.