DjVu

Материал из Викиреальностя
Перейти к: навигация, поиск
Логотип формата DjVu.

DjVu — формат сжатия, используемый для хранения отсканированных книг. Расширение файла — .djvu. Основное преимущество — высокая (в разы лучше PDF) степень сжатия. Просмотровщик не «тормозит» на больших книгах.

Содержание

[править] Использование на викисайтах

Скриншот программмы WinDjView с книгой о калане. Поскольку формат обеспечивает высокую степень сжатия, книга весит 4,4 мегабайта.
Окно поиска этой же программы WinDjView — намного удобнее PDF. Но в самой книге должен быть текстовый слой.

Зачастую книги, которые приведены в статьях Википедии в разделе ссылок, можно отыскать при помощи поисковиков наподобие Yandex или Google и скачать в этом формате (прямых ссылок может не быть из-за лицензионной политики и/или приступов копирастии у некоторых активных участников Википедии). В поисковый запрос пишут что-то наподобие

djvu название и автор нужной книги 

Аналогичные действия можно попытаться проделать с другими популярными форматами для хранения книг, например, PDF.

В проекте Викитека сканы книг могут помочь сверке с источником.

Чтобы разрешить загрузку таких файлов на собственном викисайте, можно вписать расширение файлов 'djvu' в переменную $wgFileExtensions в файле LocalSettings.php.

[править] Чем просматривать

Хорошим, годным просмотровщиком для книг в формате DjVu является программа WinDjView (работает колесико мыши и поддерживается русский текстовый слой).

По указанной ссылке для скачивания нужно нажать на зеленую стрелку, инсталлятор весит около 3 Мб. Инсталлятор пытается по умолчанию поставить Яндекс-плагин, установку которого можно отключить.

Просмотр данного формата поддерживается также некоторыми программами для просмотра и организации изображений, например, ACDSee. Однако функциональность, в сравнении со специализированными программами, несколько хромает.

[править] Проблема «инь»

Пример ошибки «инь». Красным цветом отмечены проблемные буквы.[1]

В некачественно сделанных сканах кодировщик может заменить похожие буквы, например «и» на «н», и наоборот (так называемая проблема «инь», или «инь-янь»[2]). Это связано с особенностями алгоритма сжатия: однако, для проблемных текстов в настройках кодировщика можно выставить формат сжатия «без потерь» (loseless). [1][3]

[править] Создание книг в формате DjVu

Упаковка в формат DjVu является одним из наиболее простых способов выложить в сеть адекватную по размеру и читабельности отсканированную книгу в электронном виде. Вместе с тем, при этом приходится использовать не совсем обычный софт.

[править] Ссылки

[править] Примечания

DjVu относится к теме «Программное обеспечение»   ±