Текст книги "Информационные технологии"
Автор книги: Михаил Елочкин
Жанр: Прочая образовательная литература, Наука и Образование
сообщить о неприемлемом содержимом
Текущая страница: 7 (всего у книги 16 страниц)
Глава 4
Электронные таблицы
4.1. Возможности электронных таблиц
Электронные таблицы – специализированные программы, выполняющие всевозможные операции с табличными данными. Представление данных в виде таблиц существенно упрощает анализ информации. Для решения задач, которые можно представить в форме таблиц, разработаны специальные пакеты программ, называемые электронными таблицами или табличными процессорами. Они ориентированы прежде всего на решение экономических задач, однако с их помощью можно решать математические, физические и инженерные задачи, например осуществлять расчеты по формулам, строить графики и диаграммы.
Электронные таблицы представляют собой прямоугольный бланк произвольной формы и размера, отображенный на экране ЭВМ. Причем каждая ячейка этого бланка может хранить не только видимое или невидимое значение величины, но и формулу или целую программу для ее расчета. Активизация программы в ячейках может происходить автоматически или по какому-либо событию.
Табличные процессоры – это класс программ, которые позволяют избавиться от рутинной работы при ведении бухгалтерского учета, обработке результатов научных экспериментов и других видах деятельности, требующих обработки табличных данных. Современные электронные таблицы позволяют представить результат вычислений с помощью различных диаграмм, использовать иллюстрации и другие возможности оформления результирующего документа.
Области применения электронных таблиц:
– бухгалтерский и банковский учет;
– планирование распределения ресурсов;
– проектно-сметные работы;
– инженерно-технические расчеты;
– статистическая обработка больших массивов информации;
– исследование динамических процессов.
Основные возможности электронных таблиц:
– решение расчетных задач, проведение вычислений по формулам, заданным пользователем;
– решение оптимизационных задач;
– анализ и моделирование на основе результатов вычислений;
– оформление таблиц, отчетов;
– построение диаграмм требуемого вида;
– создание и ведение баз данных с возможностью выбора записей по заданному критерию и сортировки по любому параметру;
– перенесение (вставка) в таблицу информации из документов, созданных в других программных средствах;
– печать итоговых документов;
– коллективное использование данных, хранящихся в таблицах, распространение и просмотр электронных таблиц всеми участниками рабочей группы.
Преимущества электронных таблиц:
1. Решение задач с помощью электронных таблиц освобождает от составления подробного алгоритма решения задачи и отладки соответствующей программы. Нужно только определенным образом записать в таблицу исходные данные и математические соотношения, входящие в модель решения задачи.
2. При использовании однотипных формул нет необходимости вводить их многократно, можно скопировать формулу в нужные ячейки. При этом произойдет автоматический пересчет адресов ячеек, встречающихся в формуле. Если же необходимо, чтобы при копировании формулы ссылка на какую-то ячейку не изменилась, то существует возможность задания абсолютного (неизменяемого) адреса ячейки.
3. Изменение содержимого любой ячейки приводит к автоматическому пересчету значений всех ячеек таблицы, в которых есть ссылки на данную ячейку.
4. Исходные данные и результаты расчетов можно представить как в числовом виде, так и с помощью деловой графики (гистограммы, секторные диаграммы, графики зависимостей и пр.). Причем изменение данных, по которым строились графики, автоматически обеспечивает изменение графического образа.
В настоящее время широко применяют редакторы электронных таблиц Super Calc, MS Excel, Lotus, Quattro Pro, SDSS Spreadsheet, Vista Calc, GS-Calc и др. Из них наибольшую известность приобрели Lotus 1-2-3 фирмы Lotus Development, Super Calc фирмы Computer Associates, Multiplan и Excel фирмы Microsoft.
MS Excel – один из наиболее широко распространенных редакторов электронных таблиц. Включение конвертора файла, сохраненного в форматах MS Excel, обязательно для всех программ, так или иначе использующих информацию, связанную с обработкой и хранением электронных таблиц.
MS Excel предоставляет огромные возможности для обработки табличной информации и внедрения ее в текстовые процессоры и другие программы в виде как рабочих листов, так и уже готовых графиков.
4.2. Общие сведения о редакторе электронных таблиц Microsoft Excel
Рабочая книга – это файл, создаваемый и сохраняемый MS Excel, основной составляющей которого является рабочий лист.
Имя рабочей книги должно соответствовать стандартам Windows, а именно:
– имя файла не должно превышать 255 символов;
– нельзя использовать следующие символы: «/», «», «?», «:», «*», ««»», «<», «>», «,», «|»;
– более одного файла с одним именем и расширением не могут находиться в одной папке (каталоге).
Обычная рабочая книга имеет расширение. xls.
Рабочий лист – это элемент рабочей книги, предназначенный для ввода, хранения информации и выполнения вычислений; основной составляющей рабочего места является ячейка. Каждый рабочий лист имеет свое имя, которое отображается и хранится в ярлычке листа.
Ярлычок листа – это часть рабочего листа; он расположен внизу листа и служит для выбора листа в качестве активного, т. е. отображает лист и делает видимым его содержимое на экране.
Имя рабочего листа должно соответствовать следующим критериям:
– каждый рабочий лист должен иметь уникальное имя;
– имя листа не должно превышать 31 символа;
– нельзя использовать в имени символы: «/», «», «?», «:», «*»;
– существуют ограничения на порядок ввода имени рабочего листа.
Каждый рабочий лист состоит из 16 777 216 ячеек, образующих сетку из 65 536 строк и 256 столбцов. Столбцы представлены в виде букв, а строки – в виде цифр. Названия столбцов можно задать в виде номеров. Если содержимое листа невозможно отобразить целиком на экране, то можно воспользоваться полосами прокрутки.
Полоса прокрутки – это часть рабочего листа, используемая для прокрутки содержимого листа, что делает возможным увидеть на экране любую часть листа.
Ячейка – наименьшая часть электронной таблицы, предназначенная для ввода и хранения информации. Каждая ячейка может содержать текст, число или формулу.
Адрес – это месторасположение ячейки; адрес складывается из двух составляющих: буквы (номера) столбца и номера строки, на пересечении которых находится данная ячейка.
Ссылка – это указание на адрес ячейки. Для ссылок на другие ячейки используется стиль А1 или R1C1. Все ссылки делят на несколько типов:
– абсолютная ссылка – это ссылка, которая всегда указывает на один и тот же адрес ячейки, т. е. при перемещении или копировании абсолютная ссылка изменяться не будет;
– относительная ссылка – это ссылка, указывающая на адрес ячейки, который будет меняться при перемещении или копировании ячейки;
– смешанная ссылка (неофициальный термин) – это ссылка, которая совмещает в себе два вышеописанных типа адресации, т. е. имеет абсолютную ссылку на строку или столбец. Ссылки могут быть также на ячейку, расположенную на другом рабочем листе и даже в другой рабочей книге;
– внешняя ссылка – это ссылка на ячейку, расположенную в другой рабочей книге.
Формула – это инструмент MS Excel для расчетов, вычислений и анализа данных. Каждая формула может содержать константу, оператор, ссылку, имя ячейки или диапазона и функцию.
Существует несколько видов операторов:
– арифметический оператор – это оператор для выполнения арифметических действий и возвращающий в качестве результата число;
– оператор сравнения – это оператор для сравнения данных, возвращающий в качестве результата логическое значение ИСТИНА или ЛОЖЬ;
– текстовый оператор – это оператор для объединения любых данных.
Если в ячейке содержится формула, возвращающая неправильный результат, то в ячейке будет отображено значение ошибки. Значения ошибок и их причины:
– «#ДЕЛ/0!» – задано деление на ноль;
– «#ЗНАЧ!» – указан неправильный аргумент или оператор;
– «#ИМЯ!» – указано недопустимое имя;
– «#Н/Д!» – значение не указано;
– «#ПУСТО!» – задана область пересечения диапазонов, которые не пересекаются;
– «#ССЫЛКА!» – указана некорректная ссылка;
– «#ЧИСЛО!» – ошибка при использовании числа.
Функция – это готовая формула MS Excel для расчетов, вычислений и анализа данных. Каждая функция может содержать константу, оператор, ссылку, имя ячейки или диапазона и формулу.
Пользовательская функция – это функция, написанная пользователем на языке VBA. Функции MS Excel можно разделить на несколько категорий:
– финансовые;
– определяющие дату и время;
– математические;
– статистические;
– ссылки и массивы;
– работающие с базой данных;
– текстовые;
– логические;
– проверяющие свойства и значения.
Некоторые функции будут доступны только после установки соответствующих надстроек, содержащихся в файлах с расширением. xla.
Форматирование – это изменение внешнего вида ячейки или изменение представления данных, находящихся в этой ячейке. В некоторых случаях данные, которые находятся в ячейке, также подвержены изменениям.
Параметры форматирования ячейки и ее содержимое независимы друг от друга. После применения форматирования отображенное значение в ячейке не всегда точно совпадает с сохраненным в ней фактическим значением. В строке формул всегда точно отображается фактическое значение, которое хранится в ячейке. Применять форматирование ячейки можно как до, так и после ввода в нее данных. Параметры форматирования, заданные для одной ячейки, можно перенести на другие ячейки, сохранить в качестве стиля и применять к другим ячейкам. В одной ячейке допускается задавать разные параметры форматирования для отдельных символов. Список возможных действий, связанных с форматированием ячеек:
– изменение числового формата;
– изменение шрифта;
– изменение параметров шрифта;
– выравнивание содержимого;
– изменение ширины столбца;
– изменение высоты строки;
– скрытие столбцов и строк;
– создание рамки или узора;
– изменение цвета (заливка).
Печать – это встроенная в MS Excel возможность вывести на бумагу содержимое рабочей книги, используя установленный принтер. Список возможных объектов для печати:
– рабочая книга;
– несколько рабочих книг;
– рабочий лист;
– несколько рабочих листов;
– диапазон ячеек в рабочем листе;
– диапазон ячеек в нескольких рабочих листах;
– графический объект (например, диаграмма).
Существует возможность печати нескольких копий одного объекта за один раз. По умолчанию MS Excel выводит на печать содержимое всего рабочего листа. При отсутствии данных для печати вы получите сообщение об этом.
Настройки – это изменение уже существующих параметров в MS Excel стандартными средствами, т. е. при помощи интерфейса MS Excel.
Параметры, которые устанавливаются при инсталляции MS Excel, называются «по умолчанию» и делятся как минимум на два типа:
– глобальные (общие) – это параметры, изменение которых приведет к изменению параметров во всех рабочих книгах, в том числе и вновь создаваемых;
– локальные – это параметры, изменение которых приведет к изменению параметров только в той рабочей книге, где они были изменены.
Некоторые параметры MS Excel можно изменять без использования стандартных средств.
Контрольные вопросы
1. Каковы назначение и области применения электронных таблиц?
2. Каковы виды и возможности электронных таблиц?
Глава 5
Базы данных
5.1. Основные понятия базы данных
Явления реального мира зачастую могут быть описаны с помощью структурных взаимосвязей между совокупностями фактов. Для представления информации подобного рода в явлениях может быть использована структурная модель данных.
База данных (БД) – это поименованная совокупность структурированных данных о конкретных объектах реального мира в какой-либо предметной области. Структурирование данных предполагает существование (или установление) между ними каких-то отношений (связей). В зависимости от характера этих отношений можно выделить несколько классификационных признаков структур данных.
1. По отношению порядка структуры данных делятся на упорядоченные и неупорядоченные.
В упорядоченных структурах элементы размещаются по порядку в соответствии со значением некоторого признака. Наиболее простым признаком является порядковый номер элемента; установление порядка в соответствии с номером называется нумерацией. При этом если весь набор имеет один общий идентификатор (например, М), то отдельным данным присваиваются собственные идентификаторы – индексы (например, М5 или Mb). Чаще всего индекс задается целым числом, хотя это необязательно (в качестве индекса может выступать любой знак из конечного алфавита). Лексикографический порядок индексов определяет отношение следования между элементами структуры, т. е. элемент Мб следует за элементом М5, а элемент Ма располагается перед элементом Mb. Примером структур, в которых упорядочение производится по номеру элемента, являются массивы. Порядковый номер элемента можно считать внешним признаком, который может присваиваться элементу независимо от его значения. Например, регистрационный номер документа определяется только временем его поступления в учреждение, а не его содержанием. Помимо нумерации, в структурах данных используется упорядочение по значению некоторого внутреннего признака (например, размещение фамилий в алфавитном порядке или группы предприятий – в порядке убывания их рентабельности); такое упорядочение называется ранжированием.
Примером неупорядоченных структур являются множества – в них не определен порядок элементов; единственное, что можно установить для каких-то конкретных данных, так это их принадлежность (или непринадлежность) выбранному множеству.
2. По характеру отношений между элементами структуры данных подразделяют на линейные и нелинейные.
В линейных структурах все элементы равноправны. К ним относят массив, множество, стек, очередь.
В нелинейных структурах между элементами существуют отношения подчиненности или они могут быть связаны логическими условиями. К ним относят деревья, графы, фреймы.
3. По однородности структуры данных делят на однородные и неоднородные. К однородным относят структуры, содержащие элементарные данные только одного типа. Примерами однородных структур являются массивы, множества, стеки. Неоднородные структуры объединяют данные разных типов. К неоднородным структурам относят записи.
4. По технологии обработки данных БД подразделяют на централизованные и распределенные.
Централизованная БД хранится в памяти одной вычислительной системы. Если эта вычислительная система является компонентом сети ЭВМ, возможен распределенный доступ к такой базе. Такой способ использования баз данных часто применяют в локальных сетях ПК.
Распределенная БД состоит из нескольких (возможно, пересекающихся или даже дублирующих друг друга) частей, хранимых в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД).
5. По способу доступа к данным различают БД с локальным и удаленным (сетевым) доступом. Системы централизованных БД с сетевым доступом предполагают различные архитектуры подобных систем, такие, как файл-сервер и клиент-сервер.
Файл-сервер. Архитектура систем БД с сетевым доступом предполагает выделение одной из машин сети в качестве центральной (сервер файлов). На такой машине хранится совместно используемая централизованная БД. Все другие машины сети выполняют функции рабочих станций, с помощью которых поддерживается доступ пользовательской системы к централизованной БД. Файлы БД в соответствии с пользовательскими запросами передаются на рабочие станции, где в основном и производят обработку. При большой интенсивности доступа к одним и тем же данным производительность информационной системы падает. Пользователи могут создавать на рабочих станциях локальные БД – для своих нужд. Концепция «файл-сервер» условно отображена на рис. 8.
Рис. 8. Схема обработки информации в БД по принципу «файл-сервер»
Клиент-сервер. В соответствии с этой концепцией подразумевается, что, помимо хранения централизованной БД, центральная машина (сервер базы данных) должна обеспечивать выполнение основного объема обработки данных. Запрос на данные, выдаваемый клиентом (рабочей станцией), порождает поиск и извлечение данных на сервере. Извлеченные данные (но не файлы) транспортируются по сети от сервера к клиенту. Спецификой архитектуры «клиент-сервер» является использование языка запросов SQL. Концепция «клиент-сервер» условно изображена на рис. 9.
Рис. 9. Схема обработки информации в БД по принципу «клиент-сервер»
БД (в том или ином виде) – неотъемлемая часть решения большинства практических задач, в первую очередь информационных систем. В современной технологии предполагается, что создание БД, ее поддержка и обеспечение доступа пользователей к ней осуществляются централизованно с помощью специального программного инструментария – системы управления базами данных.
Система управления базами данных (СУБД) – это комплекс программных и языковых средств, необходимых для создания БД, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.
Централизованный характер управления данными в БД предполагает необходимость существования некоторого лица (группы лиц), на которое возложены функции администрирования данными, хранимыми в базе. Системы управления базами данных выполняют две основные функции:
– хранение и ведение представления структурной информации (данных);
– преобразование по некоторому запросу хранимого представления в структурную информацию.
Процедура хранения информации в ПК состоит в том, чтобы сформировать и поддерживать структуру хранения данных в памяти компьютера.
Процедура актуализации данных позволяет изменить значения данных, записанных в базе, либо дополнить определенный раздел, группу данных. Устаревшие данные могут быть удалены с помощью соответствующей операции.
Процедура извлечения данных необходима для пересылки из БД необходимых сведений для преобразования, отображения или передачи по вычислительной сети.
Современные структуры хранения данных должны быть независимыми от программ, использующих эти данные, и реализовывать принципы полноты и минимальной избыточности. Такие структуры и получили название БД. Процедуры создания структуры хранения (БД), актуализации, извлечения и удаления данных осуществляют с помощью специальных программ, называемых системами управления базами данных.
Хранение и передача данных тесно связаны между собой, для выполнения этих процедур используют сетевые информационные технологии. Программы, предназначенные только для хранения и передачи данных, носят название информационных хранилищ и представляют собой компьютеризованные архивы.
5.2. Уровни представления данных
Ядром любой БД является модель данных – множество структур данных, ограничений целостности и операций манипулирования данными. Модель данных – это совокупность структур данных и операций их обработки. С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними.
СУБД основывается на использовании иерархической, сетевой или реляционной моделей, на комбинации этих моделей или на некотором их подмножестве.
Иерархическая модель данных. Иерархическая структура – это совокупность элементов, связанных между собой по определенным правилам. Объекты, связанные иерархическими отношениями, образуют ориентированный граф (перевернутое дерево), вид которого представлен на рис. 10.
Рис. 10. Графическое изображение иерархической структуры БД
К основным понятиям иерархической структуры относятся: уровень, узел (элемент), связь.
Узел – это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т. д. уровнях. Количество деревьев в БД определяется числом корневых записей.
К каждой записи БД существует только один (иерархический) путь от корневой записи. Например, как видно из рис. 10, для записи С4 путь проходит через записи А и ВЗ.
Из приведенного на рис. 11 примера очевидно, что иерархическая структура правомерна, так как каждый студент учится в определенной (только одной) группе, которая относится к определенному (только одному) институту.
Рис. 11. Пример иерархической структуры БД
Сетевая модель данных. В сетевой структуре при тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом.
Примером сложной сетевой структуры может служить структура БД, содержащей сведения о работах студентов учебных заведений. Возможно участие одного студента в нескольких разработках, а также участие нескольких студентов в разработке одной темы. Графическое изображение примера, состоящего только из двух типов записей, показано на рис. 12 и рис. 13. Единственное отношение представляет собой сложную связь между записями в обоих направлениях.
Рис. 12. Графическое изображение сетевой структуры в виде графа
Рис. 13. Пример сетевой структуры БД
Реляционная модель данных. Понятие «реляционный» (от англ. relation – отношение) связано с разработками известного американского специалиста в области систем баз данных Е. Кодда. Реляционные модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.
Реляционная модель ориентирована на организацию данных в виде двухмерных таблиц. Каждая реляционная таблица представляет собой двухмерный массив и обладает следующими свойствами:
– каждый элемент таблицы – один элемент данных;
– все столбцы в таблице однородны, т. е. все элементы в столбце имеют одинаковые тип (числовой, символьный и т. д.) и длину;
– каждый столбец имеет уникальное имя;
– одинаковые строки в таблице отсутствуют;
– порядок следования строк и столбцов может быть произвольным.
В качестве примера можно представить информацию о студентах вуза в виде реляционной таблицы:
Здесь отношения представлены в виде таблицы, строки которой соответствуют кортежам, или записям, а столбцы – атрибутам отношений, доменам, полям.
Поле, каждое значение которого однозначно определяет соответствующую запись, называется простым ключом (ключевым полем). Если записи однозначно определяются значениями нескольких полей, то такая таблица БД имеет составной ключ. В примере, показанном на рис. 14, ключевым полем таблицы является «Номер личного дела».
Рис. 14. Пример реляционной модели
Чтобы связать две реляционные таблицы, необходимо ключ первой таблицы ввести в состав ключа второй таблицы (возможно совпадение ключей), в противном случае нужно ввести в структуру первой таблицы внешний ключ – ключ второй таблицы. На рис. 14 показана реляционная модель, построенная на основе отношений «Студент, Сессия, Стипендия», где:
– Студент – Номер, Фамилия, Имя, Отчество, Пол, Дата рождения, Группа;
– Сессия – Номер, Оценка 1, Оценка 2, Оценка 3, Оценка 4, Результат;
– Стипендия – Результат, Процент.
Таблицы СТУДЕНТ и СЕССИЯ имеют совпадающие ключи {Номер), что дает возможность легко организовать связь между ними. Таблица СЕССИЯ имеет первичный ключ Номер и содержит внешний ключ Результат, который обеспечивает ее связь с таблицей СТИПЕНДИЯ.
Контрольные вопросы
1. Дайте определение термина «база данных».
2. Дайте определения понятий «данные» и «знания».
3. Дайте определения понятий «банк данных», «система управления базой данных», «администратор базы данных».
4. Назовите уровни представления данных.
5. Назовите способы организации связи между данными.
6. Определите область задач, решаемых с помощью баз данных.
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.