May 29, 2019

42. Логическая организация баз данных (БД); объекты и атрибуты; схемы и подсхемы. Эволюция концепции БД.

Логическая организация БД – представление пользователя о той предметной области, информация о которой должна храниться в БД, то есть это логическая модель предметной области.

Такая модель отражает 3 вида информации:

  • сведения об объектах предметной области;
  • их свойства;
  • отношения между объектами.

Структуру данных необходимо описывать формальным образом. Описания логической и физической структур базы данных используются программными средствами управления базами данных при обработке требований пользователей на получение той информации, которую содержит база данных. Описание общей логической структуры базы данных называют схемой. Ее называют иногда общей моделью данных, концептуальной моделью или концептуальной схемой. Эти термины примерно равнозначны. Схема представляет собой таблицу типов используемых данных. Она содержит имена объектов и их атрибуты и определяет существующую между ними связь. Схема представляет собой структуру, в которой могут быть помещены значения элементов данных. Подобно табло в аэропорту, на котором высвечивается информация о прибытии и отправлении самолетов, схема не меняется, в то время как величины, помещенные в ней, время от времени изменяются.


(пикча херня, но на всякий)

Схема базы данных показывает логическую организацию всей базы данных в целом, а подсхема – описание части базы данных, описание представления о данных отдельного пользователя или приложения.


Логическая модель – графическое представление структуры базы данных с учетом принимаемой модели данных (иерархической, сетевой, реляционной и т.д.), независимое от конечной реализации базы данных и аппаратной платформы.

Иными словами, она показывает, ЧТО хранится в базе данных (объекты предметной области, их атрибуты и связи между ними), но не отвечает на вопрос КАК.

Сущность (объект) – это множество реальных или абстрактных предметов (людей, объектов, мест, событий, состояний и т.д.), обладающих общими атрибутами и характеристиками.
Атрибут – это описательное свойство или характеристика сущности.

Правила для атрибутов сущности:

  1. Каждый атрибут должен иметь уникальное имя.
  2. Сущность может обладать любым количеством атрибутов.
  3. Сущность может обладать любым количеством наследуемых атрибутов, но наследуемый атрибут должен быть частью первичного ключа сущности-родителя.
  4. Для каждого экземпляра сущности должно существовать значение каждого его атрибута (правило необращения в нуль - Not Null).
  5. Ни один из экземпляров сущности не может обладать более чем одним значением для ее атрибута.

С точки зрения БД (физическая модель) сущности соответствует таблица, экземпляру сущности – строка в таблице, а атрибуту – колонка таблицы.

Связь – это логическое соотношение между сущностями. Каждая связь должна именоваться глаголом или глагольной фразой. Имя связи выражает некоторое ограничение или бизнес-правило и облегчает чтение диаграммы. По умолчанию имя связи на диаграмме не показывается.

Эволюция концепции БД

Базы данных в своем развитии прошли шесть поколений. Вначале данные обрабатывались вручную. Затем появилось оборудование с перфокартами и электромеханические машины для сортировки и табулирования миллионов записей. Позже данные стали хранить на магнитных лентах, и сохраняемые программы выполняли пакетную обработку последовательных файлов. На следующем этапе развития появилось понятие «схемы» базы данных и оперативного навигационного доступа к данным. Затем был обеспечен автоматический доступ к реляционным базам данных и внедрены распределенная и клиент-серверная обработки.

Первое поколение — менеджеры записей (с IV тысячелетия до н. э.), например учет царской казны и налогов в Шумере.

Второе поколение — менеджеры записей (1800-1955 гг.). Автоматизированная обработка информации началась. С появлением технологии записи информации на перфокартах и впервые была широко использована при переписи населения в США в 1890 г. Тогда-то появилась и компания по производству оборудования для записи информации на перфокарты, которая впоследствии получила название IBM.

Третье поколение — программируемое оборудование обработки записей (1955-1970 гг.). Электронные компьютеры могли обрабатывать сотни записей в секунду. Ключевым компонентом в этой новой технологии стало программное обеспечение. Стали появляться стандартные пакеты для таких общеупотребительных бизнес-приложений, как общая бухгалтерия, расчет заработной платы.

Четвертое поколение — оперативные сетевые базы данных (1965-1980 гг.). Для таких приложений, как ведение операций на фондовой бирже или резервирование билетов, требуется знание текущей информации и немедленный доступ к ней.

Пятое поколениереляционные базы данных и архитектура «клиент-сервер» (1980-1995 гг.). Реляционная модель данных, когда все данные хранятся в таблицах, связанных между собой по ключевому полю, обладает унифицированным языком для определения данных, навигации по данным и манипулирования ими, а не отдельными языками для каждой из этих задач. Эта реляционная модель имеет много других преимуществ.

Шестое поколениемультимедийные базы данных (с 1995 г.). До появления этого поколения существовало четкое разделение программ и данных. И этот подход хорошо работал, пока речь шла о таких данных, как числа, символы, списки. Но скоро данные стали представлять сложные объекты типа «графический образ», «звук», их обработка потребовала новых подходов и программ. Произошел переход от традиционных баз данных, хранящих числа и символы, к базам данных, в которых каждая запись может содержать данные со сложным поведением.