Что такое DjVu?

DjVu (читается "де-жа-вю") - это новая технология сжатия изображений разработанная в 1996 г. AT&T Labs. DjVu дает возможность распространять по интернету изображений документов очень высокого качества, цифровых документов и фотографий. DjVu позволяет сканировать в высоком разрешении цветные страницы книг, журналы, каталоги, руководства, газеты, исторические и древние документы, и сделать их доступными через Интернет.

При сканировании текста с высоким разрешением, и сохранении качества изображения, размер файлов становится очень громоздким для скачивания с Интернета. Уменьшение разрешения, для повышения скорости скачивания, ведет к потере качества и разборчивости. Распространенные графические веб-форматы JPEG, GIF и PNG при приличном разрешении создают слишком большие изображения. Формат DjVu во многом решает эту проблему.

Технология Сжатия нового поколения

Обычно DjVu сжимает в 5-10 раз лучше, чем существующие методы вроде JPEG и GIF для цветных документов, и в 3-8 раз лучше TIFF для черно-белых документов. Цветные страницы, сканированные в полном цвете с разрешением 300 DPI могут быть сжаты с 25МБ до 30-100КБ. Черно-белые документы 300 DPI обычно сжимаются до 5-30КБ. Это ставит размер качественно сканированных страниц в один ряд с обычными HTML страницами (занимающими обычно 50КБ)

Для цветных документов содержащих одновременно текст и картинки файлы DjVu обычно в 5-10 раз меньше JPEG файлов того же качества. Для черно-белых страниц DjVu файлы обычно в 10-20 раз меньше JPEG и в 5 раз меньше GIF. Также DjVu файлы в 3-8 раз меньше черно-белых PDF файлов, полученных из сканированных документов (сканировать цветные документы в PDF непрактично).

Помимо сканирования документов DjVu можно применять к документам, созданным другими программами, например Adobe PostScript или PDF. В этом случае размер файла варьируется от 15 до 20КБ за страницу 300 DPI.

DjVu Browser Plug-in доступен для стандартных браузеров (IE и Netscape) и работает на различных платформах (Windows | Mac OS X | Mac OS 9 | UNIX). DjVu Browser Plug-in позволяет легко перемещаться по многостраничным документам и увеличивать страницы. А также экспортировать страницы DjVu в формат BMP, что позволяет распознать изображение в программе распознавания текста, например, в FineReader'е. Уникальная технология распаковки "на лету" позволяет изображениям размером 25МБ занимать только 2МБ ОЗУ.

Обычные программы просмотра изображений перед показом распаковывают изображение целиком. Это непрактично для образов документов высокого качества, поскольку они исчерпывают оперативную память многих ПК, вызывая чрезмерный обмен с жестким диском. Напротив, DjVu никогда не распаковывает образ целиком, он хранит его в памяти в компактном виде и распаковывает фрагмент, видимый на экране именно тогда, когда его открывает пользователь. Крупные изображения как например 2500 х 3300 точек (обычная страница 300 DPI) могут быть загружены и просмотрены на очень слабых ПК.

Формат DjVu распаковывается поэтапно (прогрессивно). Первый набросок изображения пользователи получают очень быстро, с поступлением данных качество изображения постепенно увеличивается. Например на модеме 56K текст обычного журнала появится через три секунды. Через одну-две секунды появятся наброски картинок и фона. Затем, через несколько секунд формируется окончательная качественная версия страницы.

Технология DjVu разделяет изображение на задний слой (например текстура бумаги и фон) и передний слой (текст и рисунки). Традиционные методы сжатия отлично работают с простыми фотографиями, но они значительно теряют четкость цветовых переходов на насыщенных контрастных областях, посему и получают такие нечеткие результаты. Отделяя текст от фона DjVu хранит текст с высоким разрешением (таким образом сохраняя четкие края и максимальную читаемость), в то же время сжимая фон и изображения с более низким разрешением используя технологию сжатия вейвлет (wavelet).