Электронная библиотека » Владимир Вуль » » онлайн чтение - страница 26

Текст книги "Электронные издания"


  • Текст добавлен: 26 июля 2014, 14:30


Автор книги: Владимир Вуль


Жанр: Интернет, Компьютеры


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 26 (всего у книги 41 страниц) [доступный отрывок для чтения: 11 страниц]

Шрифт:
- 100% +
7.4.1. Технические средства долговременного хранения информации

Жесткий магнитный диск (ЖМД) и накопитель CD-ROM считаются обязательными принадлежностями любого современного ПК. Современные носители на ЖМД для ПК и серверов вмещают до 100 Гбайт данных. Еще в 1999 году была представлена дисковая система хранения данных серии Symetrix 5700/3700, которая позволяла хранить 6 Тбайт данных. В этой системе применяется 128 жестких дисков с емкостью 47 Гбайт каждый.

Ассортимент альтернативных устройств весьма разнообразен и включает в себя дисководы со сменными компакт-и DVD-дисками, магнитно-оптическими носителями, накопители CD-R и DVD-R с однократной записью, а также CD-RW и DVD-RAM с многократной записью. Идеальное устройство, которое имело бы невысокую цену при хорошем быстродействии и емкости, было бы рассчитано на недорогие носители длительного срока службы и нечувствительно к воздействию окружающей среды, пока еще не изобретено.

Различные технологии записи/чтения данных: оптическая, магнитная, магнитно-оптическая (МО) обычная и LIMDOW-технология с ускоренной однопроходной записью, способ изменения агрегатного состояния поверхности носителя (Phase-Change Dual, PD) – обусловливают большой разброс потребительских свойств отдельных групп моделей. Практически все устройства несовместимы между собой – за исключением моделей одного и того же семейства.

Уже создано достаточно продукции, записанной на DVD-дисках, в то же время стоимость дисководов опустилась до приемлемого уровня. В компьютерной индустрии цена законченного решения накопителя DVD-ROM стала ниже 100 долларов и эти накопители начали включать в стандартную комплектацию многих ПК средней ценовой категории. С конца 2000 г. накопители DVD-ROM начали постепенно вытеснять дисководы CD-ROM. В 2000 г. объем продаж продукции, оснащенной дисководом DVD-ROM, составил около 5 млн. единиц.

От всех существующих запоминающих устройств компакт-диск отличается одним важным качеством – совместимостью, которая всегда имела высший приоритет при разработке CD-стандартов. Дисковод CD-ROM способен читать данные различных типов: аудио и видео, а также текстовые и графические файлы. Устройство записи компакт-дисков позволяет подготавливать диски мультимедиа, которые читаются любым дисководом для компакт-дисков. Устройства чтения компакт-дисков современного поколения превысили кратность 50, т. е. имеют скорость обмена данными свыше 7,5 Мбайт/с. Все эти модели способны читать многократно перезаписываемые диски CD-RW (CD-ReWritable). Это их свойство называется Multiread.

Судя по всему, еще многие годы единственной технологией многократной записи, обеспечивающей возможность чтения записанных носителей практически на любых системах, останется CD-RW. Некоторые члены DVD-консорциума, в том числе Sony и Philips, предложили вариант – DVD+RW, полностью совместимый с DVD-ROM и DVD-R. Кроме DVD+RW емкостью 3,0 Гбайт имеются еще два альтернативных формата: DVD/RW c емкостью 3,95 Гбайт на каждой стороне диска и 5,2 Гбайт фирмы NEC.

Компания Ioptics сообщила о разработке нового типа оптической памяти (Optical Read Only Memory, OROM), которая может внести коренные изменения в способ хранения данных для портативных вычислительных, встроенных и потребительских систем. Технология OROM включает электрооптическое устройство считывания нового типа и недорогую съемную пластиковую карточку, на которой может храниться 128 Мбайт данных. Считывающее устройство умещается в нагрудном кармане, а размер карточки с данными меньше обычной бизнес-карточки. По стоимости хранения 1 Мбайт данных OROM соизмерима с CD-ROM. OROM принципиально отличается от таких современных оптических систем хранения, как CDROM и DVD. Если в этих устройствах используются подвижная головка и вращающийся носитель и в каждый момент времени производится доступ лишь к одному биту, то в OROM применена новая система освещения и считывания, не имеющая подвижных частей и осуществляющая доступ одновременно к тысячам байт данных.

Данные на карточке записываются в виде множества (около 5 тыс.) двумерных изображений (patch), каждое из которых содержит 32 Кбайт данных. При установке карточки в считыватель она располагается вдоль матрицы органических светоизлучающих диодов (OLED), каждый из которых обслуживает определенный участок (patch). Для получения информации с определенного участка он освещается соответствующим диодом. Свет, прошедший через этот участок, создает изображение данных, проектируемое затем на чувствительное устройство считывателя, где оно и преобразуется в цифровые данные. Общее время доступа OROM составляет примерно 10 мс, т. е. такое же, что и для большей части накопителей с ЖМД, и в десять раз меньше, чем в дисководах CD-ROM. Скорость передачи данных в первой версии накопителя OROM составила 1,6 Мбайт/с. Благодаря отсутствию подвижных частей, накопитель OROM характеризуется высоким быстродействием, хорошей вибро– и удароустойчивостью и малым потреблением энергии.

Компания Hewlett-Packard, контролирующая порядка 60% рынка магнитооптических систем хранения с автоматической сменой дисков, производит семейство SureStore на базе дисков емкостью 5,2 Гбайт. Системы SureStore ориентированы на крупные и средние компании, нуждающиеся в архивировании значительных объемов данных. Новые носители рассчитаны на срок хранения данных до 100 лет. Используемая в устройствах система обеспечивает автоматизированный доступ к данным. Среднее время смены диска (время, затрачиваемое на прекращение считывания данных с одного диска, смену дисков и начало считывания данных с другого диска) составляет 10 с.

Магнитооптические (МО) диски емкостью 5,2 Гбайт выпускает также компания Sony Electronics. Многофункциональные дисководы Sony SMO-F551 позволяют записывать и считывать информацию с МО дисков емкостью 5,2 и 2,6 Гбайт. Кроме того компания выпускает накопитель WORM емкостью 5,2 Гбайт, который совместим по записи и считыванию с MO дисками. На базе обоих накопителей выпущены библиотеки емкостью 1,3 и 2,6 Тбайт.

Среднее время наработки на отказ в SMO-F551 составляет 100 тыс. часов. Достигнута достаточно высокая скорость поиска данных, в МО-накопителях она составляет 25 мс, в WORM-накопителе – 150 мс. МО-и WORM-накопители оснащены кэш-памятью в 4 Мбайт, интерфейсом Fast SCSI, скорость вращения диска – 3300 об/мин, устойчивая скорость передачи данных – 5 Мбайт/с, пиковая скорость передачи – 10 Мбайт/с.

Таким образом, на рынке имеются устройства, которые могут быть использованы в качестве основы для долговременного хранения изданий (и их версий), включая мультимедийные. Причем эти устройства оснащены программным обеспечением, обеспечивающим их качественный интерфейс как с сервером хранилища изданий, так и с сервером доставки.

7.4.2. Некоторые вопросы проектирования атрибутивной базы данных

Как уже отмечалось, в атрибутивной БД хранится информация, необходимая для поиска изданий, а именно атрибуты и ключевые слова и выражения. Здесь же хранятся средства идентификации издания: миниатюра и адрес, характеризующий размещение издания в хранилище. Соответствующая база данных может быть реализована на основе реляционной модели. Определенную трудность составляет лишь организация хранения полного набора ключевых слов и выражений и идентификация конкретного издания на основе введенного логического выражения для поиска.

Пользовательский интерфейс разработанной модели атрибутивной БД показан на рис. 7.6. Он использует меню, построенное по стандартной схеме Pull-down (выпадающее меню). Основные рабочие режимы: ввод данных, просмотр хранимых в БД изданий, отбор или поиск изданий по различным критериям. Вывод может быть организован в виде, когда вся плоскость экрана отводится для описания отдельного издания, или же в табличной форме, когда для каждого издания отводится лишь отдельная строка. В первом случае в плоскости экрана размещаются основные характеристики издания и его миниатюра, а специальные параметры печатного издания могут быть просмотрены после нажатия кнопки "дополнительная информация".

Как следует из представленных на рис. 7.7 данных, экран содержит также определенные возможности управления, представленные в виде кнопок с надписями: первая, следующая, предыдущая, последняя, которые позволяют менять номер текущей записи и соответствующее ему изображение на экране. К сожалению, на одном экране не удается разместить всю информацию об отдельном издании. Поэтому, чтобы не перенасыщать экран и не нарушать качество восприятия информации пользователем, часть информации вынесена на второй экран. Она подключается с помощью кнопки доп. информация. В дополнительной информации преимущественно содержатся технические характеристики издания: формат, тип бумаги, тираж, типография, количество и характер иллюстраций, назначение и т. п. (рис. 7.8).


Рис. 7.6. Меню первого уровня (исходный пользовательский интерфейс) атрибутивной базы данных


Рис. 7.7. Вывод на экран основной информации об издании


Для вывода данных в табличной форме предварительно с помощью экранного интерфейса пользователь отбирает те характеристики издания (поля БД), которые он хотел быть просмотреть на экране. Отметим, что в поля «Тип издания», «Бумага», «Гарнитура» данные можно не вводить, а выбирать с помощью мыши из раскрывающегося списка, причем в каждом из этих списков перечисляются возможные варианты значений соответствующего параметра.

Наибольший интерес представляет организация поиска нужных изданий. С помощью команды Отбор главного меню системы и выполняется эта важнейшая операция. Детерминированный поиск (рис. 7.9) организован по стандартной схеме с использованием индексации по соответствующим полям. Если бы в БД было несколько изданий, фамилии авторов которых удовлетворяли условиям, то все они были бы в таблице.


Рис. 7.8. Вывод на экран дополнительной информации об издании


Рис. 7.9. Интерфейс для детерминированного поиска изданий по значению атрибута – фамилии автора


Детерминированный поиск по наименованию издательства организован аналогичным образом. Аналогично производится поиск по времени выпуска в свет издания, тиражу, формату и многим другим характеристикам.

Квазидетерминированный поиск организован по ключевым словам и выражениям, которые играют роль термов, на основании которых могут создаваться сложные запросы, в которых отдельные термы объединены с помощью логических операторов И и ИЛИ. Именно для создания такого запроса служит экранный интерфейс, представленный на рис. 7.10. Ключевые слова из соответствующих Memo-полей каждой из записей сгруппированы в файле keywrd.dbf, откуда выводятся в список с маркером прокрутки Укажите слова для отбора, показанном на рисунке. Установив курсор на любое из них, мы может перевести их в окно создания запроса, а затем, с помощью переключателя И/ИЛИ присоединить к уже имеющемуся в окне выражению. Это принципиально позволяет пользователю создать запрос любой степени сложности. В то же время, от пользователя не требуется усилий по припоминанию нужных ключевых слов и их вводу. Он должен узнать и выбрать ключевые слова из имеющегося в наличии их множества, затем нажать кнопку добавить и терм будет перемещен в нижнее поле интерфейса под названием Список выбранных слов и формула отбора в виде – «кл_слово=»<терм>, где под последним понимается переносимое слово. Для переноса каждого слова кроме первого следует предварительно установить в нужную позицию переключатель И/ИЛИ, и лишь после этого нажать кнопку добавить. Если полученное логическое выражение не удовлетворяет пользователя, следует его отменить, нажав кнопку очистить. В том случае, когда запрос удовлетворяет пользователя, он нажимает кнопку OK и получает ответ системы.


Рис. 7.10. Интерфейс для организации поиска по ключевым словам и выражениям


В систему для проверки ее работоспособности было заведено несколько изданий различного профиля, причем произведенная проверка полностью подтвердила работоспособность программного комплекса и правильность принципов построения, положенных в его основу.

7.5. Проектирование других элементов информационной структуры издательства

В этом разделе будут рассмотрены оставшиеся элементы информационной системы издательства, а именно: загрузчик, клиентское рабочее место и средства доставки медиа-информации клиенту.

7.5.1. Загрузчик

Загрузчик является той частью издательской системы, которая должна сделать ввод изданий и документов настолько эффективным, насколько это возможно. Поскольку количество вводимой информации велико, становится понятно требование минимизации ручного труда в этом процессе.

При вводе документов одновременно должны генерироваться метаданные для каталогизации и индексирования, на основе которых документы могут затем извлекаться пользователями. Существует несколько способов автоматизации, соответствующих разным методам доступа к данным. Наиболее известен и хорошо отработан метод автоматической индексации полного текста. Самые прогрессивные средства индексации текста базируются на технологии семантических сетей, в которой значения слов определяются по контексту, а не просто подбором унифицированных терминов для отдельных слов; однако пока работу программных средств нельзя назвать безупречной. Представляется оправданным включение в метаданные ключевых слов и выражений, отобранных автором (иногда редактором), так как лучше них никто не сможет подобрать набор ключевых слов, оптимально характеризующих как тематическую область издания, так и его отличия от близких по тематике. Возможен отбор этих слов из уже имеющегося в атрибутивной базе данных набора, но иногда оправдано и расширение этого общего набора путем ввода дополнительных элементов, характерных для нового издания.

Чем более структурирован язык составления страниц, тем легче выделять информацию: форматы с высоким уровнем структуризации, подобные Adobe FrameMaker, SGML и XML, удобнее, чем форматы со специальной структурой типа QuarkXPress и Word; хуже всего интерпретируются форматы, не имеющие четко выраженной структуры – PostScript и, в меньшей степени, PDF.

Пока не существует общих средств автоматического выделения специфической информации из изображений, аудио и видео, но ряд фирм и лабораторий занимаются исследованиями в этой области. Иногда атрибутивные метаданные могут генерироваться просто путем извлечения информации из определенных форматов данных. В качестве примера можно сослаться на внутренний формат файлов программного пакета Photoshop.

При загрузке следует добавлять в атрибутивную базу данных не только метаданные, но и вспомогательные представления документов, в частности, миниатюры, отражающие внешний вид издания. Генерация миниатюр может быть автоматизирована. Например, большинство графических форматов содержат свои собственные миниатюры; для других, например для изображений с высоким разрешением, можно сгенерировать их "на лету". Аналогично можно спроектировать загрузчик таким образом, чтобы он, получая цифровые аудиообъекты, создавал клипы первых нескольких секунд (например, в формате WAV 10 кГц). Таким же образом видео в формате MPEG-2 может преобразовываться в клипы QuickTime длительностью в 5 или 10 с.

7.5.2. Средства доставки медиа-информации клиенту

Существует два базовых способа доставки цифровых документов пользователю: передача файлов – ее можно использовать для текстов, изображений, аудио и видео с низким качеством, и поточная передача для высококачественного «движущегося» медиа, т. е. аудио, видео и анимации. Этот последний способ налагает очень серьезные требования на возможности сервера.

Сервер доставки аудио/видео обязан обеспечивать гарантированную полосу пропускания для потока данных, поэтому в архитектуре сервера должны быть сбалансированы ресурсы процессора, периферия ввода/вывода и сетевых интерфейсов. Программное обеспечение сервера доставки, во-первых, должно включать средства низкого уровня для работы с файлами, обеспечивающие различные режимы проигрывания медиа. Во-вторых, нужно, чтобы это ПО определяло стандартные интерфейсы для разработки приложений – "плееров" на клиентской стороне и реализовывало серверную часть этих интерфейсов.

В большинстве случаев используется сквозное проигрывание (playthrough), что дает возможность начать просмотр мультимедийного издания еще до того, как он полностью загружен на сервер доставки. Например, сервер MediaCenter фирмы Sun позволяет начать воспроизведение аудио– или видеоданных уже через 5 секунд после начала загрузки. Сквозное проигрывание необходимо для приложений с быстрым и непрерывным обновлением содержания. Режим playthrough развивает метод оперативной загрузки, который заключается в способности сервера одновременно загружать один и воспроизводить другой документ.

На уровне операционной системы видеоматериалы представляются взаимосвязанной совокупностью файлов. Так, для фильма в цифровой форме хранятся файлы одного или нескольких видеопотоков и файл для аудиопотока.

В дополнение к файлам содержания существуют вспомогательные файлы, которые поддерживают распределение первичного файла по разным дискам (striping), синхронизацию между видео и аудио, обеспечивают разные режимы воспроизведения.

Из имеющихся технических и программных средств системы доставки цифрового медиа в наибольшей степени подходят серверы семейства MediaCenter известной фирмы Sun и специализированное программное обеспечение этой же фирмы. Характеристики некоторых серверов представлены в табл. 7.1.


Таблица 7.1. Сравнительные характеристики серверов доставки медиа фирмы Sun



Рассмотрим подробнее одну из моделей сервера – Sun MediaCenter UltraSPARC. Это высокопроизводительная масштабируемая система с невысокой стоимостью базовой конфигурации. Как и все модели этой линии, она предназначается для доставки цифрового видео по сетевым и вещательным каналам в режиме video-on-demand.

MediaCenter UltraSPARC базируется на сервере Sun Ultra Enterprise 2 и имеет масштабируемую многопроцессорную архитектуру с двумя процессорами UltraSPARC 167 МГц, каждый с 512 Кбайт памяти на чипе и 2 Мбайт кэшпамяти на модуль. Обмен данными между процессорами, памятью и портами ввода/вывода осуществляется пакетным переключателем с малой задержкой. Из 50 Гбайт внешней памяти Raid-4, 42 Гбайт – это чистая память для хранения видео, и еще 8 Гбайт используются для контроля. Новая версия 2.0 ПО MediaCenter позволяет масштабировать внешнюю память 100 Гбайт (124 часа видео при компресии 1,5 Мбайт/с). Сетевые интерфейсы в стандартах ATM, Fast Ethernet, Ethernet обеспечивают гарантированную пропускную способность 100 Мбит/с для передачи видео. Серверы MediaCenter оснащаются всеми необходимыми компонентами для хранения и доставки видео. В частности, используемая в них операционная система Solaris дополнена специализированным обеспечением, превращающим файл-сервер Ultra Enterprise в медиа-сервер. Как обычно, в системах такого класса большое внимание уделяется надежности. Сервер Sun MediaCenter защищен от сбоя одного диска механизмом контроля четности Block-Interleaved Parity, соответствующим Raid Level 4. Средства системного администрирования включают замену дисков без перезагрузки системы, управление размещением медиа-документов и мониторинг сети.

Специальное программное обеспечение Sun MediaCenter включает:

✓ модифицированное ядро операционной системы Solaris;

✓ модифицированные драйверы сетевых интерфейсов, настроенные на вывод мультимедиа;

✓ файловую система MFS (Media File System), оптимизированную для доставки удовлетворяющего строгим временным ограничениям битового потока;

✓ менеджер медиапотока MSM (Media System Manager), позволяющий управлять проигрываемыми потоками;

✓ менеджер загрузки документов СМ (Configuration manager).

Оба менеджера – MSM и CM – поддерживают интерфейс с программой-клиентом на основе протокола удаленного вызова процедур RPC (Remote Procedure Call), а сервер обладает двумя важными свойствами. Во-первых, он гарантирует требуемую скорость передачи видеопотока (в рамках максимальной полосы пропускания). Поскольку Sun MediaCenter оптимизирован на доставку видео, он может поддерживать больший, чем стандартный сервер, видеопоток, при тех же аппаратных ресурсах. Во-вторых, менеджер MFS спроектирован специально для приложений с высоким уровнем ввода/вывода, и поэтому MediaCenter гарантирует среднюю производительность дискового ввода/вывода, в отличие от серверов с обычной файловой системой, которые гарантируют более низкий уровень производительности. Кроме того, MFS обеспечивает независимость передачи: если пользователи запрашивают даже одни те же битовые потоки, временные ограничения по их доставке не будут нарушены, при условии, конечно, что они укладываются в максимальную полосу пропускания. В обычной файловой системе, не оптимизированной для видео, множественные запросы к одному битовому потоку ведут к падению производительности сервера.

В сервере реализована модель "выталкивания", согласно которой он только инициирует и посылает поток битов по сетевому интерфейсу, выделенному для видеовывода. На этом интерфейсе нет канала для передачи информации в обратном направлении: от декодера к серверу. На сервер возлагается единственная задача – строго выдерживать временные ограничения потока. На принимающем конце должен быть достаточно быстрый декодер. Достоинства модели "выталкивания" очевидны – она более простая, а значит, принимающее устройство может быть более дешевым.

Sun MediaCenter начинает проигрывание уже через 5 секунд после начала загрузки. Сквозное проигрывание необходимо для приложений с быстрым и непрерывным обновлением содержания. Этот режим не налагает никаких ограничений на тип документов – они могут быть любыми, единственное ограничение в том, что видеопоток проигрывается только в нормальном режиме в прямом направлении. Сквозное проигрывание поддерживается менеджером документов CM и менеджером потока MSM, что позволяет использовать программы, которые практически одновременно записывают и проигрывают документы с сервера. Утилиты CM, распознавая режим сквозного проигрывания, предотвращают преждевременное уничтожение документов.

На уровне операционной системы видеодокументы представляются взаимосвязанной совокупностью файлов. Таким образом, для фильма в цифровой форме хранятся файлы одного или нескольких видеопотоков и файл для аудиопотока. В дополнение к файлам содержания существуют вспомогательные файлы, которые поддерживают распределение первичного файла по разным дискам (striping), синхронизацию между видео и аудио, обеспечивают разные режимы проигрывания. Менеджер документов делает все эти сложности невидимыми для глаза, позволяя работать с абстракцией видеофайла. Например, копирование и удаление видеофайлов производится так же, как и обычных текстовых, но, естественно, видеофайлы имеют дополнительные свойства – клиент MSM может заказать их доставку для проигрывания.

Из других типов медиа-серверов упомянем семейство Challenge фирмы SGI. Фирма эта известна своими разработками в области трехмерной графики (например, браузер и язык VRML – см. разд. 4.3.1). Ее системы Cosmo и WebForce оснащены медиа-серверами. Линейка серверов Challenge начинается с простой модели "S", а заканчивается суперсервером модели "XL". Их данные сведены в табл. 7.2.

Это семейство серверов имеет симметричную многопроцессорную архитектуру. Масштабируемость серверов достигается не только за счет увеличения числа процессоров и каналов ввода-вывода, но и путем перехода от младших моделей к старшим. Все модели полностью совместимы и работают под управлением операционной системы IRIX, причем ее версии, начиная с 6.X, поддерживают 64-разрядную архитектуру. Challenge S – настольный медиасервер, цена которого лишь немного превышает стоимость ПК. Для работы с внешней памятью используются 3 SCSI-интерфейса. Два слота ввода/вывода обеспечивают полосу пропускания до 267 Мбит/с.


Таблица 7.2. Сравнительная характеристика серверов семейства Challenge фирмы SGI



Старшая модель Challenge XL способна обслужить до 1000 видеопотоков. Объем оперативной памяти в ней может достигнуть 16 Гбайт. Помимо обычной внешней памяти емкостью до 2 Тбайт предусмотрена внешняя память с особо высокой надежностью на основе RAID-технологий, емкость которой достигает 6,3 Тбайт. Естественно, что цена старшей модели достаточно высока.

Операционная система IRIX представляет собой адаптированный вариант UNIX и соответствует стандарту X/Open. В нее входит файловая система XPS (Expert System), которая поддерживает:

✓ 64-разрядную адресацию;

✓ специальную журнализацию;

✓ детерминированное время ответа.

Такая адресация, в отличие от 32-разрядной, практически не ограничивает размер адресуемой памяти. В этой файловой системе адресуется до 9 млн. Тбайт. Пока аппаратные ограничения не позволяют иметь память такого объема. Журнализация в файловой системе состоит в систематической регистрации транзакций, что обеспечивает быстрое восстановление файловой системы при повреждениях. А детерминированное время ответа означает, что файловая система гарантирует получение запрашиваемой полосы пропускания в течении определенного промежутка времени.

На рынке медиасерверов в последние годы растет конкуренция. Выпускаются серверы на основе оборудования фирмы Hewllett-Packard с программным обеспечением OKI MediaServer. Работы в данном направлении ведутся и компьютерным гигантом IBM совместно с фирмами BellSouth и Panasonic.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10 11
  • 4.6 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации