Электронная библиотека » Динара Гагарина » » онлайн чтение - страница 3


  • Текст добавлен: 19 января 2022, 20:00


Автор книги: Динара Гагарина


Жанр: Прочая образовательная литература, Наука и Образование


сообщить о неприемлемом содержимом

Текущая страница: 3 (всего у книги 16 страниц) [доступный отрывок для чтения: 5 страниц]

Шрифт:
- 100% +
Классификация по областям исторического знания

О содержательных характеристиках исторических информационных систем позволяют судить такие атрибуты, как область истории, география и хронология. Классификация по ним показывает тематическое разнообразие изучаемого вида ресурсов.

По-прежнему, как было установлено П. Доорном еще в середине 1990-х годов [Доорн, 1995], наиболее популярными тематиками (в порядке убывания) являются: социальная история, экономическая история, история культуры, политическая история, демография, краеведение и археология. Тот факт, что большая часть современных систем предназначены для исследований по социально-экономической и политической истории, объясняется, с одной стороны, востребованностью данной проблематики, а с другой – наличием значительных массивов информации, требующей обработки. В то же время растет число ресурсов, содержащих информацию, связанную с историко-культурным наследием.

По хронологическим критериям большинство рассматриваемых информационных систем относятся к истории XX в., что связано с доступностью источников этого периода. Ранее, по данным на начало 1990-х годов, отмечалось преобладание ресурсов по истории XIX в., а затем XVII и XVIII вв. [Доорн, 1995].

В целом исторические информационные системы имеют разную временную протяженность – от нескольких месяцев до нескольких веков. Активно развиваются системы, охватывающие до нескольких тысячелетий, в том числе в рамках междисциплинарного направления Big History – истории развития Земли от Большого взрыва до современности. Для таких проектов характерно использование таймлайнов и картографических инструментов (например, как в интерактивном атласе TimeMaps[13]13
  TimeMaps [Электронный ресурс]. URL: http://www.timemaps.com (дата обращения: 10.04.2020).


[Закрыть]
, содержащем более 1500 карт по различным периодам и регионам). Значительная хронологическая протяженность присуща и более традиционным коллекциям источников, к которым относится проект Йельского университета Avalon[14]14
  Avalon [Электронный ресурс]. URL: http://avalon.law.yale.edu (дата обращения: 10.04.2020).


[Закрыть]
, разработанный в 2008 г. и содержащий полные тексты источников в области права, экономики, политики, дипломатии и государственного управления, начиная с 4 тыс. лет до н. э. Наиболее известным в области Big History является одноименный Big History Project[15]15
  Big History Project [Электронный ресурс]. URL: https://school.bighistoryproject. com (дата обращения: 10.04.2020).


[Закрыть]
, разрабатываемый по инициативе Билла Гейтса и рассматривающий почти 14 млн лет истории. Еще один проект Big History – ChronoZoom – совместная разработка Калифорнийского университета в Беркли и Московского государственного университета им. М. В. Ломоносова[16]16
  ChronoZoom [Электронный ресурс]. URL: http://www.chronozoom.com (дата обращения: 10.04.2020).


[Закрыть]
. Данный проект представляет инструменты для создания собственных ресурсов, их сохранения и репрезентации в рамках единой системы. Для перечисленных примеров и других подобных проектов свойственны сильная образовательная составляющая и наличие методических разработок, адаптирующих использование продукта в учебном процессе.

Классификация по типу исторических источников

Существующие историко-ориентированные информационные системы варьируются по типам исторических источников, использованных в формировании контента. В этом смысле можно говорить о системах, основанных на письменных, статистических, вещественных, изобразительных, аудио-, видео-, мультимедийных, картографических и других источниках, а также на их различных комбинациях. Наиболее часто встречающиеся источники на всем протяжении развития историко-ориентированных информационных систем и баз данных – письменные, что связано как с их преобладанием в общем объеме исторических источников, так и с доступностью технологий для их перевода в цифровой формат. Вместе с тем характер используемых письменных источников и способы их репрезентации в системе существенно изменялись со временем. Историко-ориентированные базы данных конца 1980-х – 1990-х годов основывались преимущественно на массовых, прежде всего формулярных источниках: личных карточках, отчетных делопроизводственных документах, родословных книгах, формулярных списках, информация которых хорошо структурирована и удобным образом укладывается в формат реляционных баз данных.

Поскольку хранение, анализ и описание изображений в оболочке информационной системы гораздо легче текста, в ряде случаев текстовый источник заносится в информационную систему в виде нераспознанного изображения. Такие изображения могут быть сделаны на основе оригинала или копии (факсимильного издания) и представлены следующими форматами: jpeg, gif, pdf, djvu и др. Все чаще встречаются псевдоизображения, представленные в формате pdf, передающие, например, оригинальный шрифт источника, а также нераспознанный или плохо распознанный текст.

С развитием технологий круг источников, для представления информации которых используются информационные системы, расширяется. Одновременно меняется способ репрезентации источников в системе в направлении большей машиночитаемости, а также точности и детальности визуализации. В наибольшей степени это видно на примере письменных и вещественных источников. Применительно к текстовым источникам это может быть обозначено как переход от простой атрибуции к полнотекстовости с сохранением формальных и внешних особенностей документа и возможностью передачи многослойности текста. Сегодня все более характерным при репрезентации текстовых источников в информационной системе становится их представление в виде изображения, метаописания, распознанного и размеченного текста и, если необходимо, транскрипции, перевода[17]17
  Например, Древнерусские берестяные грамоты [Электронный ресурс]. URL: http://gramoty.ru (дата обращения: 10.04.2020).


[Закрыть]
.

В перспективе следует ожидать изменения способов репрезентации и для других источников, в частности аудио-, видео– и мультимедийных данных, для которых сегодня по-прежнему преобладают атрибутивное описание и наличие соответствующего файла, не предполагающие возможности полнотекстового поиска. Значительным шагом в этом направлении стала разработка инструментария для анализа массивов аудиоданных. Так, в Королевском технологическом институте (Стокгольм, Швеция) разработана программа[18]18
  SoX – Sound eXchange [Электронный ресурс]. URL: http://sox.sourceforge.net (дата обращения: 10.04.2020).


[Закрыть]
c открытым кодом для поиска по большим неструктурированным массивам аудиоданных. В ходе тестирования указанного инструментария на оцифрованных аудиоматериалах из архива Института языка и фольклора (Institute for Language and Folklore, ISOF) – а это порядка 13 тыс. часов звучания – была доказана эффективность разработанной методики анализа [Fallgren, Malisz, Edlund, 2018].

Также встречается значительное число информационных систем, источниковой базой которых стали статистические данные. Как правило, такие системы предназначены для анализа социально-экономических процессов и динамики демографического развития.

Наличие многочисленных систем, различающихся по такому критерию, как тип источника, создает возможности для комплексных исследований на основе разнотипных источников, сочетая текст, статистику и изображения.

1.5. Каталог историко-ориентированных информационных систем

Сайт «Историко-ориентированные информационные системы» – http://digitalhistory.ru – предназначен для отображения процесса и результатов исследования теоретических и практических вопросов создания таких систем, использования их в науке, образовании и для сохранения историко-культурного наследия.

В основе сайта лежит база данных MySQL, содержащая информацию об историко-ориентированных информационных системах, публикациях по этой тематике, связях между ними, авторах, организациях создания ресурсов, тематике, типологии систем и публикаций по различным основаниям.

Основными разделами сайта являются «Публикации» и «Каталог систем». Оба раздела включают соответствующие электронные каталоги, расширенный поиск и детализированное описание каждого экземпляра.

Источниковую основу каталога составили в первую очередь системы, представленные в Интернете или доступные на локальных носителях. Они были найдены в основном в 2013–2015 гг., в период работы над проектом «Историко-ориентированные информационные системы: методологические, теоретические и прикладные проблемы создания и использования»[19]19
  Грант РФФИ № 13-06-00655.


[Закрыть]
, через поисковые системы, каталоги, списки и перечни отдельных типов информационных ресурсов, сайты научных фондов (в частности, РФФИ[20]20
  Российский фонд фундаментальных исследований [Электронный ресурс]. URL: http://www.rf r.ru (дата обращения: 16.04.2020).


[Закрыть]
и РГНФ, в настоящее время вошедшего в состав РФФИ, которые в течение многих лет проводили конкурсы по созданию информационных систем), а также сайты университетов, научных организаций, учреждений хранения. Созданный каталог продолжает пополняться в настоящее время. Значимым источником информации о ресурсах стали коллекции информационных систем и баз данных, созданные в партнерстве различными организациями и не всегда связанные содержательно, а также тематические порталы, агрегаторы (часть из них перечислены в предыдущем разделе как примеры метасистем).

В источниковую базу также вошли публикации с описаниями различных систем и баз данных. Большая выборка таких публикаций на русском языке представлена в изданиях Ассоциации «История и компьютер»: книжной серии «Круг идей», Информационном бюллетене ассоциации и журнале «Историческая информатика».

Описание каждой системы в каталоге включает примерно 25 формальных, функциональных, тематических и технологических полей. В основе структуры описания лежит разработанная методика описания и классификации историко-ориентированных информационных систем. Формальный блок представлен полями: «Название», «Адрес (если есть)», «Режим доступа», «Организация», «Город», «Страна», «Авторы», «Год создания». Тематический и функциональный блоки включают поля: «Назначение (исследования, образование)», «Полнотекстовость», «Тип (библиографическая, историографическая, геоинформационная, энциклопедическая и др.)», «Тип источников», «Источники», «Подход к созданию», «Область знания», «Область истории», «География», «Хронология» (несколько полей), «Ключевые слова». Технологический блок включает поля: «Технология создания», «Программное обеспечение», «Объем (в записях)», «Язык интерфейса», «Количество пользователей». Также предусмотрено описание системы на естественном языке (аннотация), составляемое исполнителями проекта либо взятое из открытых источников. Для некоторых из указанных атрибутов («Автор», «Организация», «Ключевые слова» и др.) значения отображаются гиперссылками, по которым можно просмотреть все системы выбранного автора, организации и т. д.

При наличии в базе данных публикаций о данной системе на странице описания также отображается гиперактивный список таких публикаций. Это особо значимо при работе с системами, не представленными в свободном доступе в Интернете, а также с уже не существующими системами.

Аналогично организован электронный каталог публикаций по тематике историко-ориентированных информационных систем. Описание публикации включает 15 библиографических и тематических атрибутов. При наличии в базе данных проекта информации об упоминаемых в публикации системах, на странице публикации выводится список таких ресурсов.

Особое значение для функциональности созданной информационной системы имеют связи между объектами на уровне базы данных. Между сущностями «Публикация» и «Система» реализована связь «многие ко многим», что позволяет для каждой системы ввести и просмотреть список публикаций, в которых описывается или упоминается в качестве примера данная система. Аналогично для каждой публикации в каталоге можно ввести или просмотреть список связанных с ней систем.

На момент написания этой книги в базу данных введено более 1100 российских и зарубежных историко-ориентированных информационных систем, созданных с 1990-х годов по настоящее время, а также более 500 публикаций. Каталог постоянно пополняется.

На сайте реализована система регистрации и разграничения прав пользователей. Просмотр информации, поиск по каталогу публикаций и систем не требует регистрации. Ввод и редактирование данных, управление сайтом осуществляются через веб-интерфейсы. Возможен ввод новых систем и публикаций пользователями.

Кроме разделов «Каталог систем» и «Публикации», ресурс содержит информацию о понятийном аппарате и классификации историко-ориентированных информационных систем, а также ссылки на соответствующие публикации.

Созданный интернет-ресурс включает наиболее информативные на сегодняшний день электронные каталоги историко-ориентированных информационных систем и публикаций о них, а также имеет развитый информационно-поисковый инструментарий. Внесенные в каталог ресурсы и публикации аннотированы и атрибутированы, что создает возможность выбора ресурсов по заданным параметрам для дальнейшего использования в научных исследованиях.

Запросы позволяют выделить ресурсы по области знания, периоду, области истории, географическому охвату, типу системы, типу источников, подходу, технологиям создания и полнотекстовости. Внутренняя поисковая система позволяет не только находить необходимые информационные системы, но и анализировать контент на основе запросов к ней. Сайт может быть использован также в учебном процессе, соответствующие методика и возможности описаны в последней главе монографии.

Распределение по типам ресурсов в каталоге в целом соответствует сложившейся ситуации, временные срезы позволяют проанализировать динамику развития исторических информационных систем и преобладания тех или иных их видов в разные периоды.

Наиболее широко в каталоге представлены ресурсы, посвященные социально-экономической и политической истории, истории культуры, а также историческому и культурному наследию. Более половины систем, включенных в каталог, относятся к периоду новой и новейшей истории. Географически половина введенных систем почти равномерно распределена между историей Азии, Западной Европы и Северной Америки; другая половина приходится на прочие территории и смешанные ресурсы.

Около половины ресурсов в каталоге относятся к проблемно-ориентированным, что связано с их бо́льшим, по сравнению с источнико-ориентированными системами, разнообразием. Также около половины систем созданы на основе текстовых исторических источников, причем среди источнико-ориентированных систем их около двух третей.

1.6. Анализ и оценка исторических информационных систем

Определение направлений, средств и способов дальнейшего создания и использования историко-ориентированных информационных систем должно опираться на результаты анализа и оценки их эффективности. На сегодняшний день существуют международные и отечественные стандарты оценки информационных систем; имеется большое количество публикаций научного и практического характера, в которых даются понятия эффективности вообще и применительно к информационным технологиям в частности; разработаны и обоснованы подходы и критерии определения эффективности информационных систем [Зиндер, 2006]. В то же время эти вопросы рассматриваются в основном применительно к информационным системам, используемым на предприятиях, в аспекте управления, бизнес-процессов и производства. Внимание уделяется прежде всего оценке финансово-экономической эффективности таких систем, а также качества и эффективности их проектирования и внедрения.

Что же касается эффективности информационных систем, используемых в научных исследованиях и образовании, то в этой области есть только отдельные публикации. В них поднимается проблема «достижения высокой эффективности проектируемых комплексных информационных систем и АСУ дидактического, научного и управленческого назначения». Речь, как правило, идет «о проблемно-ориентированных системах поддержки принятия решений» в области развития научной и образовательной деятельности [Матчин, Монахов, Мордвинов, Свечников, Шленов, 2003/2004, с. 3].

Анализ публикаций дает основания говорить о том, что специально проблема эффективности систем поддержки научных исследований и образовательных процессов, тем более ориентированных на определенную предметную область, не рассматривается. Это справедливо и для исторической отрасли, которой посвящена данная работа: задачи, содержание, критерии и методики анализа и оценки историко-ориентированных информационных систем недостаточно разработаны и понимаются не всегда однозначно. Возможно, недостаточная разработанность методик анализа и оценки эффективности предметных (в том числе исторических) систем объясняется их сложностью и многообразием.

Рассмотрим, какие основания можно и важно выделить при разработке методики оценки историко-ориентированных информационных систем.

Во-первых, одно из важных мест занимает эффективность использования этих систем в целях получения научных исторических знаний, их репрезентации и обеспечения доступа к ним, совершенствования труда историка.

Во-вторых, необходимо опираться на уже разработанные и сложившиеся подходы к анализу и оценке эффективности информационных ресурсов и систем.

В-третьих, важно учитывать специфику создания, назначения, использования именно исторических информационных систем и выделять соответствующие этому показатели эффективности.

Исходя из этого, для анализа и оценки эффективности историко-ориентированных информационных систем будем использовать системный и комплексный подходы, а также вытекающий из них подход, предусматривающий сочетание формализованных и качественных показателей [Матчин, Монахов, Мордвинов, Свечников, Шленов, 2003/2004, с. 11, 12]. Сочетание этих подходов ориентирует на определение целей информационной системы; анализ ее структуры, отдельных подсистем; учет общих и специфических для истории критериев. Указанные подходы позволяют подойти к анализу и оценке эффективности историко-ориентированных систем как многоуровневого объекта, включая уровень информационных ресурсов вообще и информационных ресурсов определенной предметной области (истории). На каждом из уровней выделяются подуровни, связанные с назначением системы и ее научными или образовательными задачами, которые могут быть ориентированы на различные, порой не совпадающие информационные потребности разных категорий пользователей. При этом историко-ориентированная система выступает и как информационный ресурс, и как технология, и как программный продукт для хранения и обработки информации.

На основании вышеизложенного нами выявлены общие и специфические показатели эффективности, жизнеспособности, активности, долговечности и востребованности историко-ориентированных информационных систем, а также разработана методика оценки рассматриваемого вида ресурсов.

В основе этой методики лежит рейтинговое оценивание объектов с использованием более 30 критериев, которые разбиты на несколько групп, отражающих различные аспекты функционирования информационных систем: поисковые и аналитические возможности; документирование; обеспечение доступа; образовательные возможности; жизнеспособность, долговечность, устойчивость; востребованность; общее удобство использования.

Среди наиболее важных критериев можно выделить: хронологическое, тематическое, географическое и иное структурирование и поиск; полнотекстовый поиск; получение сводных отчетов, описательной статистики и их визуализация; уровень поддержки исследовательского процесса; наличие и качество метаданных в соответствии с международными стандартами описания и спецификой исследовательских задач; устойчивость; мультизадачность; количество исследований, выполненных на основе системы, и др. Подробно выделенные группы критериев и входящие в них показатели приведены в табл. 1.1.

Для оценки выделенных показателей могут быть использованы разные шкалы, в том числе дихотомическая, ранговая, шкала отношений. Измерение может производиться как по набору фиксированных признаков, так и методом экспертных оценок.

В случае использования различных шкал для оценки разных критериев их необходимо нормализовать, приведя к единой шкале (например, [0; 1]). Баллы внутри одной группы складываются. Возможно использование весов у каждого показателя и у группы в целом. При суммировании баллов по группам также может использоваться нормализация, так как количество показателей внутри групп различно.

Таким образом, можно получить следующую формулу расчета S – оценки историко-ориентированной информационной системы:




В зависимости от целей оценки и оцениваемого массива систем могут варьироваться (в том числе обнуляться) веса критериев и веса групп.

Набор критериев и пример используемых методов оценки (шкал) приведены в табл. 1.1.


Таблица 1.1. Критерии оценки исторических информационных систем


Продолжение табл. 1.1.


Продолжение табл. 1.1.


Продолжение табл. 1.1.


Окончание табл. 1.1.


Глава 2. Создание исторических информационных систем

Эта глава посвящена проблемам создания исторических информационных систем, разработке соответствующих моделей и выбору технологий и инструментов. Наибольше внимание уделено системам на основе реляционных СУБД, а также на основе технологий разметки XML и TEI. Кроме того, рассмотрены возможности привлечения пользователей для пополнения информационных систем.


Страницы книги >> Предыдущая | 1 2 3 4 5 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации