Неоцифрованный / Hi-tech / Бизнес
Неоцифрованный / Hi-tech / Бизнес
Неоцифрованный
/ Hi-tech / Бизнес
Почему в культурном пространстве страны возникла цифровая брешь размером примерно полстолетия
Тот же Лев Толстой, только в цифре: 185-й день рождения классика мировой литературы наша страна отмечает трудовым подвигом сотен добровольцев — они дружно создают электронное собрание сочинений писателя в 90 томах. Как же так? Уж сколько лет говорят о цифровом культурном наследии страны, проводятся конференции, даются президентские поручения, но до сих пор нет полностью оцифрованного под современные стандарты электронного чтения Льва нашего Николаевича? В чем дело?
Цифровизация всего и вся — глобальный тренд, а в части литературы первую скрипку во всем мире играют библиотеки. С одной стороны, они решают цеховую задачу доступности редких и ветхих книг. С другой стороны, являются исполнителями крупных политических проектов типа «Электронной Европы», для которой цифровой контент является базой сохранения европейской идентичности и поддержки мультикультурности. Наша страна идет по аналогичному пути.
Как рассказывает Елена Тихонова, замгендиректора по библиотечной работе Российской национальной библиотеки (РНБ), формирование электронных коллекций библиотек как раз и начиналось с оцифровки старинных книжных изданий, отражающих историю и культуру России. Например, на сайте РНБ можно увидеть уникальный книжный памятник — Лаврентьевскую летопись 1377 года, полностью соответствующую оригиналу вплоть до текстуры бумаги и тона краски, да еще с научными комментариями ведущих специалистов. Региональные партнеры Национальной электронной библиотеки (НЭБ), задуманной как единый портал, интегрирующий библиотечные ресурсы России в единую информационную сеть, передают в НЭБ коллекции, среди которых преобладает краеведческая литература. В рамках совместного проекта РНБ и столичной Российской государственной библиотеки (РГБ) выполняется масштабный проект «Русская классика», охватывающий литературные произведения XVIII — первой половины XX веков. Уже оцифровано свыше 12 тысяч классических произведений 86 авторов: от мировых звезд до литераторов меньшей величины. Только компания «ЭЛАР», по оценкам директора по маркетингу Павла Плотникова, ежегодно отправляет российским библиотекам более сотни комплектов профессионального оборудования для оцифровки книжных оригиналов стоимостью от сотен тысяч до миллионов рублей.
Но вот в чем проблема: во всем мире стандартом де-факто для оцифровки книг является формат PDF — большинство созданных к сегодняшнему дню электронных версий библиотечных книг представляет собой набор отсканированных картинок страниц. Для редких и ветхих экземпляров это, безусловно, отличный вариант, а вот для анализа, скажем, «Войны и мира» школьниками и аспирантами картинки недостаточно. Поэтому сегодня создаются PDF-книги с контекстным поиском (двухслойный файл, в котором графические изображения страниц дополняются автоматически распознанным текстом, но без его верификации) и полнотекстовые электронные книги, полностью идентичные бумажному оригиналу. Чтобы получить такой электронный вариант, с распознанным текстом работают люди — профессиональные корректоры. Именно такую цель — создание эталонной электронной версии преследует проект «Весь Толстой в один клик», начатый два месяца назад, рассказывает Григорий Липич, генеральный директор компании ABBYY Россия, предоставляющей тысячам добровольных помощников ПО автоматического распознавания текстов: «Полное собрание сочинений будет доступно в формате PDF с распознанным текстовым слоем под картинкой и в наиболее популярных форматах электронных книг ePub и fb2». Надо сказать, что волонтеры для таких задач везде в почете.
«До четверти трудозатрат по обслуживанию Нью-Йоркской публичной библиотеки приходятся на волонтеров,— рассказывает Саттар Гюльмамедов, руководитель центра разработки ПО WEXLER.— Там ведь та же ситуация, что и у нас, — оцифровкой книг библиотеки США занимаются в рамках своих бюджетов с помощью коммерческих организаций». Между тем технический прогресс будет идти дальше. «Я не знаю, какие технологии будут доступны через 100 лет, но сейчас мы поступаем так, чтобы после обработки 90-томника у нас помимо форматов PDF, ePub и fb2 также сохранился некий канонический и выверенный материал в виде размеченного текста и иллюстраций, что позволит в будущем создавать представления электронных книг в новых форматах»,— рассказывает Григорий Липич.
По сути, каждая организация, которая берется сегодня за оцифровку книги, изобретает свой велосипед, ведь единых стандартов этого процесса, регламентов и требований к качеству нет. Нет единых форматов и стандартов хранения, защиты от внесения изменений, а также регламента инвентаризации и учета оцифрованных произведений. «Есть правила бумажного комплектования, но на электронные копии эти правила не распространяются,— сетует Павел Плотников.— Библиотеки решают эти задачи самостоятельно и в зависимости от своей продвинутости». И так обстоит дело не только у нас. Еще только идет разработка международного стандарта ISO в части оцифровки материалов исторического и культурного наследия.
Кстати, единой концепции использования цифровой литературы в школе у нас тоже нет, и это дает четкий ответ на вопрос, далеко ли нашей стране до электронных учебников литературы? Как до звезд. Фекла Толстая, руководитель проекта «Весь Толстой в один клик», завотделом развития Государственного музея Л. Н. Толстого, планирует выпуск специальных приложений для школьников, посвященных произведениям Толстого из школьной программы, — своего рода мультимедийных электронных энциклопедий с текстами, озвучкой, фотоматериалами, включая ответы на вопросы учителя. «Сейчас в Интернете можно скачать тысячу сочинений и рефератов, а мы готовы предоставить материалы, за качество которых будем отвечать»,— говорит праправнучка писателя. Но для этого подвиг оцифровки, систематизации цифрового наследия и создания приложений придется совершить потомкам Достоевского, Пушкина, Салтыкова-Щедрина. Да еще договориться с Минобразования о единых форматах и месте хранения эталонных электронных собраний сочинений знаменитых предков. Нет, этот интеграл не берется. Но почему бы этим вопросом не заняться библиотекам? Причин несколько.
Для того чтобы перейти на современные форматы электронных книг, библиотекам потребуется обновить ПО и провести конвертацию всех PDF-файлов в полнотекстовые версии. Но как отреагируют на запрос соответствующих средств чиновники и общественность? Опять деньги и опять на оцифровку того же самого? К тому же, замечает Саттар Гюльмамедов, при выборе книг для оцифровки библиотеки руководствуются частотой запросов читателей: «Редко кто пойдет в библиотеку за Толстым, Достоевским или Пушкиным. Ориентируясь на вкусы своих читателей, библиотека не будет оцифровывать «Анну Каренину» или «Евгения Онегина». Да еще издатели, мягко говоря, не приветствуют деятельность библиотек по созданию электронных коллекций.
«Весь пафос противников предоставления библиотекам права на оцифровку связан с необоснованной обеспокоенностью относительно ее последующего неконтролируемого распространения. Фактически библиотеки рассматриваются как возможные пособники пиратов,— возмущается Владимир Фирсов, президент Российской библиотечной ассоциации.— Никогда библиотеки не были и не будут источником пиратского контента в сети Интернет». Надо сказать, что и сами издатели не сильно спешат в оцифрованное книжное будущее. По оценкам Саттара Гюльмамедова, хорошо, если десятая часть российских издателей решилась начать продажи электронных изданий: оцифровывать горячие бестселлеры — значит отдавать свой заработок пиратам, а прочие не востребованы читателями. Почему же они ведут себя подобно собакам на сене? У Ивана Засурского, завкафедрой новых медиа и теории коммуникации факультета журналистики МГУ есть четкий ответ: «Главная проблема в плане оцифровки сегодня — это давление книжного лобби по современным книгам».
«Определенное противостояние правообладателей и библиотек существует, так же как интернет-индустрии и правообладателей,— поясняет Владимир Фирсов.— Данное противостояние носит сущностный характер, ибо библиотекари обеспокоены правом публичным, то есть правом граждан на доступ к информации, а правообладатели — правом частным, то есть правом на получение материального вознаграждения». При этом обе стороны конфликта играют на разных полях: правообладателям более интересен актуальный ходкий товар, а библиотеки горюют над несчастной судьбой так называемых сиротских произведений — тех, для которых нельзя найти правообладателей.
Согласно европейской статистике, таковыми являются более 45 процентов книг. И именно для них после долгих споров в ЕС наконец нашли в сентябре прошлого года формулировку регламента для ввода таких произведений в гражданский оборот: если в ходе добросовестного поиска правообладатель не найден, произведение можно использовать без разрешения автора, а авторские вознаграждения выплачивать в пользу обществ по коллективному управлению правами.
У нас ситуация с сиротскими произведениями не лучше, чем в Европе. «В число сиротских произведений, созданных с 60-х годов прошлого столетия, входят ценные научные монографии по истории, филологии, лингвистике, педагогике, культурологии,— говорит Константин Костюк, гендиректор компании «Директ-Медиа».— Крупнейшие издательские проекты Советского Союза, такие как «Советская энциклопедия» или серия «Всемирная литература», не могут быть легализованы и использованы нами в цифровом виде сегодня согласно нормам авторского права. Корифеи советской науки — Андрей Колмогоров, Андрей Сахаров, Дмитрий Лихачев, — или ее рядовые бойцы принадлежат этой когорте. Их труды для потомков недоступны». И все потому, что нет шансов найти наследников и заключить с ними лицензионный договор на безвозмездной основе. И пусть требуется наличие потомков лишь тех авторов, после чьего упокоения не минуло еще 70 лет, тем не менее под раздачу попадает творческая деятельность чуть ли не с начала XX века.
В результате, по мнению Константина Костюка, из трех более или менее равноценных информационных источников, пополняющих нашу книжную культуру: редкой, актуальной и классической книги, — последняя представлена в цифровом формате с колоссальным изъяном. Из 1,5 миллиона книг, необходимых для нормального культурного жизнеобеспечения общества, доступно не более трети, причем редкая книга значительно перевешивает классическую и актуальную вместе взятые.
По признанию генерального директора РГБ Александра Вислого, разработчики электронной библиотеки диссертаций после многих целенаправленных усилий сумели найти и заключить лицензионные договоры только с одним процентом авторов, представленных в библиотеке. Собственно, это и является камнем преткновения для принятия новой редакции ГК РФ в части авторского права — дать библиотекам право предоставлять читателям цифровые копии произведений, охраняемых авторским правом, без получения отдельной лицензии от авторов, точно так же, как и сейчас библиотеки выдают читателям бумажные книги. Копья ломаются вокруг срока давности публикации: 10, 5 лет, два года. Издатели бьются не на жизнь, а на смерть, предвидя, как 70-летнее пространство их нынешней зоны доходности сжимается до 10, а то и двух лет. Однако сваливать на них всю вину несправедливо: государство должно не только решиться на серьезные изменения в авторском праве, но и запустить механизмы коммерциализации электронных библиотечных фондов. В том числе «Анны Карениной». В самом деле, почему бы библиотекам не продавать ее эталонный текст вместе с приложением Музея Л. Н. Толстого школам как информационную услугу? Да и отдельным школьникам тоже, ведь мировой опыт говорит, что почитать бесплатно, скажем, сочинения Фенимора Купера на сайте американской библиотеки не удастся. Новые механизмы монетизации сегодня активно апробирует научное сообщество: в прошлом году в США, Германии, Великобритании началось движение в сторону принятия концепции открытого доступа к материалам научных исследований, в частности в режиме Gold, что подразумевает оплату из бюджета размещения в научном репозитории статей и организацию немедленного доступа к ней из любой точки мира. Это, кстати, один из ответов на вопрос о причинах нашего катастрофического отставания в мировом индексе цитируемости — продвинутые страны используют для этого все доступные методы бюджетного стимулирования.
Так что с 90-томным наследием Льва Толстого нам всем крупно повезло — продвинутый мыслитель завещал без всяких ограничений перепечатывать его произведения. А в части остальной классики «нарыв» действительно назрел: цифровое пространство страны с белым пятном на месте культуры размером больше полстолетия — это нонсенс. И заполняют эту лакуну пресловутые пираты.