Текст книги "The Ebook. Книга об электронных книгах"
Автор книги: Владимир Прохоренков
Жанр: Документальная литература, Публицистика
сообщить о неприемлемом содержимом
Текущая страница: 5 (всего у книги 28 страниц) [доступный отрывок для чтения: 9 страниц]
До начала массового использования Интернет распространение книг на «физическом носителе» было популярным источником цифрового контента. Он распространялся с помощью карт памяти, USB накопителей или посредством копирования с любого физического носителя, который был популярен для конкретного времени в истории, например, CD, HDD и так далее.
В современном мире физические носители становятся все менее популярным видом распространения контента. Переосмыслению подвергаются не только электронные книги, но и целые индустрии развлечений – кино, игры, музыка и так далее.
В большинстве случаев контент на физическом носителе можно приобрести в розничных магазинах или с помощью курьерской доставки из какого-либо онлайн ресурса, где им далеко не всегда является типичный интернет-магазин. Некоторые файлообменные сети могут предлагать такой вид сервиса.
В книжных розничных магазинах покупка на физическом носителе оправдана, но далеко не всегда это является удобной формой сервиса. Для такого вида деятельности обычно адаптируют компьютер в зале магазина, в котором сначала нужно выбрать книгу, потом оплатить на кассе и только в самом конце всей процедуры скопировать файл на физический носитель покупателя. В редких случаях можно встретить «специализированные торговые киоски» для продажи контента.
Исторически, когда тиражирование контента на физическом носителе стала очевидной выгодой, и это казалось естественным способом защиты от копирования, некоторые магазины и производители специализированных гаджетов предлагали готовый контент «в коробке». Для приобретения цифровой книги достаточно было приобрести, например, карту памяти или так называемый «картридж», на котором уже заранее был записан выбранный потребителем контент.
До сих пор этот метод практикуется среди продавцов электронных словарей и GPS навигаторов, игровых консолей и так далее. Подобный механизм рано или поздно погубит популярность этих устройств и даст возможность более расторопным конкурентам привязать потребителей к своей продукции, только благодаря наличию современной и более доступной формы распространения контента. Кроме того, в розничных магазинах уже практически нет места на полках для «цифрового контента в коробках».
Частные и локальные источникиСуществуют частные и локальные источники получения контента. То, что называется «из рук в руки». В большинстве случаев это не означает, что эти источники являются авторами произведений, а могут быть просто файлами из «частной коллекции». Так обмениваются между собой несколько пользователей, которые используют распространение контента в публичной форме. Для копирования используется частная переписка с помощью электронной почты, файловый обмен по сети, копирование с физического носителя и так далее. Некоторые пользователи создают в локальных сетях публичные директории для обмена контентом и доступ к ним ограничен рамками сети, а также знанием о существовании источника.
«Частным репозиторием» можно назвать желание владельца файла выложить произведение в публичный доступ и при наступлении события «частная форма» преобразуется уже в совершенно иную, для которой «частные» юридические определения уже не применяются.
Оцифровка книгОпределение оцифровки, причём только бумажных книг, не совсем точное определение. Процесс предполагает носитель в качестве источника, а им не всегда является только бумага. В современном мире существует несколько типов носителей информации – бумажные книги, экран компьютера, графические файлы, сайты, мультимедийные издания и так далее.
Более точное определение процесса «оцифровки книг» – это создание или использование готовой графической копии страницы в одном из соответствующих форматов. Например, TIFF, JPG, PDF, DJVU и PNG с последующим (не всегда обязательным) распознаванием текста и перевод результата в электронную форму для дальнейшего копирования, тиражирования, хранения и в том числе перевод первичной копии в другие цифровые форматы необходимого для использования типа.
Самый популярный способ оцифровки – перевод растрового изображения в цифровой формат книг. Среди форматов могут быть графические – PDF, DJVU, форматы для комиксов – CBZ, CBR, текстовые – TXT, FB2, EPUB, PDF, HTML, DOC и так далее. Как правило, графические форматы не являются масштабируемыми. Они сохраняют пропорции и размер исходной страницы вместе с содержимым. В них и довольно часто, для компактности сокращают пустые поля страницы, чтобы текстовое окно, как образ книги, лучше вписывался в экраны мобильных устройств.
Оцифровка книг – это ещё один возможный источник получения электронного контента для чтения.
Оцифровка книг применяется для различных целей. От личного использования до профессиональных нужд. Как хобби и вид заработка. Для наполнения библиотек и магазинов контентом. Довольно закономерное правило – чем больше контента продаётся или распространяется бесплатно, тем меньше используется оцифровка для создания электронного контента. Этот вид деятельности переходит в узкоспециализированное русло для увлечённых людей и профессионалов. В то же время, наполнение библиотек происходит путём обмена, а не создания новых цифровых копий.
Магазины и музейные архивы активно оцифровывают книги по нескольким причинам, основным из которых является недоступность цифровой копии у правообладателя, ограниченное количество или старинные книги, исходный материал создавался не цифровым набором.
Владельцы копий узкоспециализированной литературы не стремятся создавать для массового потребителя контент, источником которого являются редкие книги. В этом случае цифровая копия создаётся для изучения книг без ущерба их первичного носителя, не только со стороны читателя, но и для исключения разрушительного воздействия воздуха, света, различных газов, паразитов и так далее. Редкие цифровые копии книг и рукописей чаще всего находятся в рамках исторических архивов и библиотек.
Электронные книги, как файлы, создаются несколькими способами: прямая цифровая копия из подготовленной профессиональной или иной вёрстки, а также оцифровка бумажной книги или другого источника в электронную форму. Устаревшей формой оцифровки можно признать ручной набор текста и диктант.
Не всегда и везде оцифрованная книга должна и может содержать текст, который возможно впоследствии масштабировать и даже редактировать, в том числе применять конвертацию в другие текстовые форматы электронных книг. Оцифрованные книги могут быть факсимильной копией, то есть графически точно отражать вид бумажной страницы.
Текстовые книги получаются с помощью распознавания текста. Применяется метод OCR – оптическое распознавание символов (анг. optical character recognition). Страницы книги предварительно сканируются в графический формат, и впоследствии текст распознаётся с помощью специального программного обеспечения. Точность распознавания зависит от качества шрифта, контраста текста, наличия дефектов и графических иллюстраций. Финальное качество, в большинстве случаев, контролируется корректорами, которые сверяют текст между первоисточником и цифровой копией.
(Довольно много разногласий между специалистами OCR вызывает необходимость или возможность сохранения опечаток в цифровой копии, которые имели место в бумажной книге).
Подготовленная цифровая книга трансформируется в один из текстовых форматов. Впоследствии можно преобразовать готовую книгу в другие популярные форматы, с возможной потерей вёрстки, так как не все из них поддерживают совместимый набор разметки текста и иллюстраций. Первично выбранный формат зависит от предпочтений оцифровщика и использования технологической цепочки для последующей трансформации. Чаще выбирают форматы с развитой структурой разметки.
Графические книги создаются за счёт точного образа страницы или факсимильной копии с помощью оптического прибора, чаще с помощью сканера, реже с помощью фотоаппарата. Метод выбирается за счёт определения скорости преобразования, и вероятного вреда, который может быть нанесён первоисточнику внешним освещением, нагревом или физическими изломами оригинала.
Каждая страница отсканированного материала – это графический файл JPEG, TIFF или любой другой, в том числе контейнеры, которыми могут быть PDF и DJVU. Выбор формата зависит от дальнейшего преобразования множества файлов в один документ или наоборот, когда из одного файла создаётся множество промежуточных, для координации профессиональной обработки.
Сканеры существуют нескольких типов – отличаются скоростью работы, встроенными средствами распознавания, конструкцией и конечно размерами. Немаловажная разница заключается в цене решения при эксплуатации того или иного типа сканера и сложности управления процессом.
Малораспространённый тип – это ручные компактные сканеры, которые не точны, имеют небольшую скорость работы, за один раз охватывают небольшую зону изображения и не имеют встроенных механизмов автоматизации процесса. Но за счёт низкой стоимости, малого веса и компактности – применяются до сих пор. Они удобны для отдельных рукописей, страниц или только для сканирования подписи автора.
Другие типы сканеров являются стационарными приборами. Они подразделяются между собой на типовые, специализированные и профессиональные.
«Типовые» – они же массовый продукт, который существует в продаже, имеют компактные формы, тратят в рабочем режиме на одну страницу несколько секунд или минут. Точность и качество цифровой копии зависит в основном от прилегания исходной страницы на поверхности сканера. Для отдельных листов, существуют автоматические лотки для подачи бумаги, что увеличивает скорость работы, так как фактически не тратится время на смену листов первоисточника.
«Специализированные сканеры» – отличаются от «типовых» возможностью создания «бестеневой копии» с оригинала и они не всегда сканеры в привычном понимании. Позволяют «сканирование листа в край» даже для книг с корешком. Иногда имеют встроенное программное обеспечение для сбора отдельных копий в единый документ, хотя производители чаще прикладывают в комплекте со сканером программное обеспечение для PC и Mac. Такая работа более наглядна, происходит на большом экране компьютера.
Чаще всего, специализированные сканеры называют «книжными». Они относятся к планшетному типу. Наиболее доступными по цене и популярными среди потребителей можно признать продукцию компании Plustek. Модель OpticBook A300 позволяет сканировать не только в край, но и вплоть до A3 формата листа оригинала.
Профессиональные сканеры имеют большие габариты, скорость работы и отличаются методом сканирования.
«Планетарные сканеры» – это оптическая копия с помощью одной или нескольких фотокамер. Называются так из-за расположения камеры, как спутника над планетой, которой является сканируемый оригинал. Некоторые модели сканеров могут использовать две камеры, чтобы одновременно делать копию разворота страниц.
Компания Atiz выпускает популярную серию сканеров BookDrive, которые похожи скорее на небольшую фотостудию. Отличаются размером основной площадки, на которую помещается оригинал. Можно оцифровать газету или книгу, которые располагаются на основе под углом 90° между листами, а камеры направлены перпендикулярно в сторону каждого раскрытого листа, чтобы сохранить геометрию страницы без искажений.
Серия планетарных сканеров Microbox book2net от компании Xerox имеют одну площадку, где издание одним листом располагается на основании, а оптический прибор фотографирует только одну страницу или разворот, при том, что он должен быть максимально плоским, чтобы избежать теней на корешке.
Роботизированные сканеры имеют крупные габариты, обычно это готовый набор в шкафу, в котором есть все необходимое для автоматического сканирования целого издания – свет, оптический сканер, система для перелистывания страниц, компьютер для управления и узкоспециализированные сервисные функции. Сканируемое издание располагается под меньшим углом. Для увеличения производительности осуществляется съёмка сразу двух страниц разворота.
Компания Treventus уже несколько лет выпускает роботизированные сканеры ScanRobot, которые за короткое время могут оцифровать целые библиотеки при минимальном участии человека. Лицевая часть сканера может закрываться во время работы, чтобы исключить паразитную засветку от внешних источников света.
Планетарные и роботизированные сканеры работают с производительностью от 500 страниц в час, а лучшие модели способны сканировать на скорости до 3000 страниц в час.
После сканирования изображения с оригинальной страницы необходимо распознать текст и иллюстрации. Для этой цели понадобится специальное программное обеспечение, способное оптически и логически распознавать объекты в изображении. Сложность распознавания заключается в форме букв оригинала, контрастности изображения, наличия цветовых подложек, рисунков или сложной структуры вёрстки. В момент распознавания происходят типовые проблемы и ошибки для конкретного оборудования и программного обеспечения, которые специалист по OCR попытается компенсировать с помощью скриптов и проверки орфографии.
Скрипты – это самодельная надстройка для исправления ошибок. Именно подобное отношение отличает разных специалистов к качеству распознавания текста. Скрипты создают специалисты OCR для личного использования, и они актуальны только для личного метода распознавания текста и используемого оборудования. Подчистка текста нужна не только для исправления вероятных грамматических ошибок, но и для задания тексту базовой типографики.
Для автоматизации первичной очистки текста, можно рекомендовать программу OCR Pad от Валерия Войцеховского.
Компьютерными технологиями не ограничивается точность распознавания. Очень важную роль играют корректоры, которые считывают текст и сверяют его с оригиналом. Это очень важно, особенно для технической литературы.
Для ускорения процесса редактирования текста используется «распределённый метод» – части документа распределяются между группой корректоров. Этот способ позволяет вычитать книгу полностью за несколько минут, но не всем под силу организация такого процесса. Обычно используется веб-интерфейс, без необходимости устанавливать дополнительное программное обеспечение на множество компьютеров.
Для вычитки текста не обязательны профессиональные лингвисты. Обычно этим занимаются люди, наделённые вниманием и наблюдательностью. Важна не столько грамотность, сколько умение сравнивать печатный и электронный текст между собой, замечать разницу в технических опечатках, разницу между буквами и цифрами.
Художественная литература может считываться только для поиска орфографических ошибок.
В «OCR мастерских» небольшого размера «работают» парами. Обычно специалист по OCR является организатором процесса и сотрудничает с одним или группой корректоров. Группа существует на особом сочетании характеров и возможностей. При переходе к другому типу распространения готовых электронных книг, «мастерская» может распадаться, часть группы придерживается идеологических взглядов на свою деятельность.
В момент зарождения электронных книг, OCR-щики первыми протоптали дорожку для читателей к бесплатным библиотекам и собрали для них контент. Если библиотеки известны массовому читателю, то наполняли эти библиотеки не магазинные копии книг, а частные коллекции OCR.
Среди специалистов по распознаванию текста есть профессиональные объединения, свой кодекс, честь и прочее. Самой известной в отечественной истории была «OCR-группа Вадима Ершова», которая располагалась по адресу publ.lib.ru и работала изначально только для библиотеки Мошкова (других не существовало). Впоследствии форум группы Ершова стал местом сбора и общения профессионалов в области OCR.
Время идёт. Меняются приоритеты, интересы и источники оцифровки книг. Интерес к книжному распознаванию стал меньше и перешёл в профессиональное русло. Доля собственной оцифровки в бесплатных библиотеках значительно ниже доли копирования или «заимствования» готового материала. Поэтому, если кого-то интересует собственная оцифровка, то обычно это редкие и детские книги.
В последнее время часто оцифровывают с экрана компьютера, без использования сканера для бумажных книг. Таких любителей не много и пока это работает как «спортивный интерес» по взлому защищённых цифровых изданий.
Обычный читатель может самостоятельно оцифровать книгу, читать и вычитывать её в электронном виде. Частной заинтересованности в этом мало, слишком трудоёмко. Интерес быстро перерастает в «желание поделиться» оцифрованной книгой со всеми в Интернет. Так рождаются потоки новых книг и мелкие частные библиотеки. Хобби становится профессиональным занятием.
Законность приобретения книг
Любой существующий способ копирования контента – в любом случае подчиняется локальным законам государства. Незнание или вольная интерпретация законов не отменяет и не изменяет форму легальности распространения.
В современном мире, где Интернет не знает границ, определение локальности и законов конкретного государства является сложной и неопределённой задачей для реализации защиты авторских прав. Каждое государство может толковать нарушение законов исходя из моральных устоев, сферы политического влияния и межгосударственными договорами.
В большинстве случаев законы предусматривают пресечение нелегальной деятельности в рамках государства, собственных граждан и влияние на локальный рынок извне, если репозиторий не ограничивает свою деятельность самостоятельно в рамках конкретного региона.
Проще всего устанавливаются границы дозволенного в легальных магазинах, которые ориентируются на государственную принадлежность потребителя по биллингу платёжной системы.
Некоторые пользователи сети Интернет могут наивно предполагать степень легальности своих поступков. Например, выкладывают файлы для публичного доступа и сопровождают их сообщением: «данное произведение выложено для частного и образовательного использования», что не является оправданием нарушения существующих законов об авторском праве, а является лишь копией предупреждения заимствованной с легальной продукции и произвольной интерпретацией существующих локальных законов.
Некоторые файлообменные сети имеют «лицензионный договор с пользователем», где чётко написано, что «пользователь прямо соглашается c тем, что использует Ресурс на свой собственный страх и риск». Делается это – умышлено, чтобы владелец файловой сети мог избежать судебного преследования и умышленно перекладывает вину на пользователя. В большинстве случаев такая схема не работает, если ресурс предоставляет открытый доступ для просмотра содержимого сайта, даже без права копирования. То есть, наличие факта существования контрафактной продукции уже даёт право преследовать юридически, игнорируя желание ресурса прикрыть свои тылы «пользовательским соглашением».
Законность копирования основана на личной ответственности, вне зависимости от массовости в неверной интерпретации законов, мнений, суждений, используемых владельцами ресурсов, лозунгов и прочего. Что на самом деле может быть частью популяризации своего вида деятельности, и на самом деле никакого отношения к реальным законам и осуществляемым целям не имеет.
Развитые страны уже много лет контролируют копирование на уровне пользователя и фиксируют факт распространения путём определения направления потока данных. Например, в Германии и США это является отдельным видом бизнеса, когда сотрудники специализированных компаний доказывают факт нарушения авторских прав и направляют личное уведомление о возмещение ущерба. Если пользователь отказывается заплатить указанную сумму в определённые сроки, дело отправляется в суд с автоматическим увеличением финансовых претензий. В большинстве случаев конечный потребитель не хочет оспаривать свои действия в суде, если не преследует иные цели. Но такой подход отбивает какое-либо желание афишировать причастность к «пиратской деятельности», как минимум.
Задача юридических служб в зарубежных странах направлена на уменьшение популярности нелегального копирования через потребителей, в то время как отечественные правообладатели до сих пор оперируют понятием легальности по отношению к ресурсам. Метод создаёт обратную реакцию, объединяет единомышленников вокруг файлообменных сетей любого типа, не оказывая никакого влияния на их личную ответственность перед законом, увеличивая степень безнаказанности.
Несовершенство законодательной базы создаёт прецеденты для нарушения законов об авторском праве и увеличивает условную личную свободу при использовании «нелегального копирования», как естественную идеологию потребителей на современном этапе, в то время как исполнение существующего закона не рассматривается в качестве важного фактора для развития интеллектуальной собственности.
В качестве доказательства необходимости бесконтрольного копирования и несовершенства законодательства используется обоснование того, что авторские права имеют слишком большой временной период, что искусство должно принадлежать более широким массам, особенно среди так называемых классических произведений, что слишком высока цена за отдельный экземпляр и многое другое. Выбор и широта оправданий зависит от степени подготовленности, временных рамок, страны проживания, личных убеждений и многого другого.
Законность приобретения контента во многом зависит от степени развития отрасли. Это верно не только по отношению к электронным книгам, как к сегменту рынка. Во многом законность зависит от социального развития общества, от увеличения спроса на собственность в области интеллектуальной деятельности.
Законность тех или иных видов деятельности вырабатывается государством и обществом последовательно в течение длительного периода. От запретительных и карательных мер к более широкому, тонкому толкованию законов и их соблюдению.
Нарушение законов говорит только о том, что существующее авторское право не отвечает современным запросам общества на основные свободы и отсутствует умение поддерживать точное соблюдение законов на уровне государства, а также международных договоров.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?