Курсова робота на тему: «Технології формата DJVU»

Зміст

Вступ…………………………………………………………………………….3

1.Технологія DjVu …………………………………………………………….5

2. DjVu – алгоритми………………………………………………………….11

3. DjVu – використання.…………………………………………………….13

4. Основні властивості DjVu………………………………………………..16

Висновки……………………………………………………………………….21

Список використаної літератури…..………………………………………22

Вступ

За останні п’ять років Інтернет став загальновизнаним каналом поширення різноманітної текстової та графічної інформації. Електронні газети і журнали стали настільки ж звичайними як і традиційні. Багато видань виходять в електронному вигляді раніше, ніж на папері. Цьому сприяє повсюдне впровадження верстки на комп’ютері та використання формату PDF фірми Adobe, що став стандартом “де-факто” для розповсюдження електронних публікацій, у тому числі і радіоаматорських – радіосхем, довідкових таблиць і т.п.

Архівація графічних файлів з можливістю подальшої їх пересилання по мережі використовується як альтернатива PDF формату. Проте будь-яке закачування архівних файлів графіки, особливо технічних – це кіт у мішку. Перш, ніж цей файл можна проглянути – його необхідно завантажити! До розархівації файлу не можна напевно сказати – це те, що було необхідно, або ж це зовсім інший файл. Може не влаштувати якість зображення або повнота матеріалу, не кажучи вже про обсяг і витрачений час на скачування.

Кожен, кому часто доводилося сканувати чорно-білі схеми і пересилати їх через Інтернет, напевно, звертав увагу на відносно низький коефіцієнт стиснення інформації для файлів з подібними зображеннями.

Графічний формат DjVu (вимовляється “Дежавю”), розроблений фірмою AT & T, в першу чергу призначений для розміщення в Інтернет відсканованих зображень. Це можуть бути довідкові книги, рукописи, принципові схеми телевізорів, радіоприймачів, підсилювачів та інших пристроїв. Технологію DjVu забезпечує для файлів з чорно-білими монохромними зображеннями стиск порядку 500:1. Виграш у розмірі файлу в порівнянні з форматом GIF складає в середньому 20 разів. Суть технології DjVu полягає в автоматичному розбитті зображення на декілька ділянок (наприклад, текст, логотип фірми та растрова фотографія), для кожного з яких обирається оптимальний для даного графічного образу алгоритм стиснення. Право на комерційне використання технології DjVu продано компанії LizardTech.

Метою даної курсової роботи є дослідження технології формату DJVU та можливостей її використання.

1.Технологія DjVu

Нова технологія стиснення дозволить вирішити проблему публікації в

Інтернеті радіосхем, креслень, графіків, які раніше мали занадто великий час завантаження. Для того щоб мати можливість переглядати Радіосхеми в новому форматі, необхідно встановити спеціальний plug-in, який має розмір трохи менше дев’ятисот кілобайт. При цьому зроблений він дуже цікаво. Справа в тому, що на відміну від звичайних програм-переглядачів, DjVu не розшифровує стислий файл повністю, а тільки ту його частину, яку в даний момент демонструє. Це дозволяє переглядати файли величезного розміру і дозволу навіть на дуже слабких комп’ютерах.

Демонструвати ці схеми plug-in може поступово – у міру викачування:

протягом пари секунд можна повністю побачити макет сторінки, ще через пару секунд можна прочитати текст, а почекавши ще трохи – з’являються картинки.

Звичайно, web-сервер і так має те ж саме – спочатку текст, потім

поступово картинки, але те, що ми побачимо за допомогою DjVu – це повністю графіка, а не комбінація розпізнаного тексту і картинок!

Формат DjVu дозволяє швидко переглянути матеріал у відкритому вигляді, і

вже потім вирішити, чи варто його зберігати. Відразу можна оцінити зміст матеріалу, обмежившись просто його переглядом, не зберігаючи файл на своєму комп’ютері. Якщо врахувати, що сторінка чорно-білої графіки з текстом формату А4 займає в форматі DjVu близько 30 кб, а в кольорі близько 60 кб, то стає зрозумілою економія часу і грошей.

Якщо ж порівняти DjVu з популярним PDF форматом, то і тут є

переваги – зазвичай у користувачів встановлений тільки Acrobat Reader. Завантаження файлу для в Reader можлива тільки для перегляду, без його збереження. Є можливість “зберегти об’єкт як …”, але переглянути файл можна лише після повного завантаження, що не дуже зручно. У DjVu це поєднане – при використанні безкоштовного plag-in’а (його розмір -1.810 кБ) до браузеру http://www.lizardtech.com можна спочатку подивитися файл, а вже потім, клацнувши правою кнопкою миші, зберегти його при потребі. Використання формату DjVu – це економія при достатній якості.

Для прикладу наводимо схему змін до радіоли “Світ” у порівнянні з

радіоприймачем “Мир” в форматі DjVu. Статистика така:

  1. Екранний варіант цієї схеми (150 dpi gray) – 32 кб;
  2. Принтерний варіант цієї схеми (600 dpi b / w) – 43 кб;
  3. Схема у форматі DjVu (300 dpi b / w) – 9 кб.

Досить об’єктивна оцінка якості в порівнянні з вже відомими форматами

показує,що незначне погіршення якості на кольорових зображеннях повністю окупається ступенем стиснення, а на чорно-білих зображеннях взагалі не помітно.

Можливі конкуренти у вигляді tiff, gif, jpg сильно програють у обсязі.

Думається, що в найближчі роки цей спосіб посяде гідне місце в Інтернет. Радіоаматори можуть сміливо його застосовувати для пересилання схем, фотографій і всього іншого, при істотній економії часу і грошей.

Електронна друк і традиційна поліграфія – AT & T DjVu.

Корпорація AT & T просуває ідею “електронного паперу” і розробила

власний формат зберігання віртуальних документів – DjVu. На відміну від PDF, DjVu – формат чисто растровий, такий же, як і добре відомі GIF і JPEG.

Як і JPEG, DjVu упаковує графічні дані з деякою втратою інформації, однак

якість зображення при цьому знижується не так значно, а показник стиснення може складати до 300:1. Компресор DjVu відокремлює текстові області від напівтонове графіки і застосовує в першому випадку алгоритм BZ2, орієнтований на дворівневий сигнал, у другому – хвильовий перетворення (wavelet transform), добре підходить для фотозображень. Таким чином, DjVu перекриває за показниками не тільки старий добрий JPEG, але і значно більш просунутий формат WIF, розроблений фірмою Compression Engines.

У загальному і цілому DjVu – це чудова технологія зберігання великих

відсканованих зображень. Для створення архіву або сховища схем краще DjVu, мабуть, нічого й придумати не можна. Правда, тільки в тому випадку, коли до сканованого тексту неможливо або недоцільно застосовувати алгоритми розпізнавання. Втім, використовуючи відповідний софтвер з DjVu можна отримувати повноцінне графічне зображення у форматі, наприклад, BMP і потім вже його розпізнати.

DjVu позиціонується як конкурент PDF і пропагується, прикладом,

для публікації наукових статей на WEB. У даному контексті технологія DjVu працює набагато гірше: неможливість скопіювати хоча б малий фрагмент тексту сильно зв’язує руки читачеві. Крім того, якість відтворення літер в DjVu помітно нижче, ніж в PDF, а це швидко і сильно стомлює зір і знову змушує вдаватися до друку. Однак і це положення досить спірне!

Перекачавши по мережі порівняно невеликий файл у форматі DjVu, його

можна перетворити в BMP, GIF, JPEG і нарізати з них, наприклад в ADOBE PHOTOSHOP, стільки графічних фрагментів з текстом, скільки буде потрібно! Що ж стосується радіосхем, то, як правило, цього взагалі не потрібно. Схема рабдіолюбітелю потрібна цілком. Можливість перегляду в браузері на локальному диску (у тому числі і на CD) взагалі робить цей формат незамінним для створення електронної бібліотеки!

Теоретична основа формату просто вражає. Чого вартий один метод

вейвлетових перетворень для стиснення графіки або поділ картинок на шари для зменшення розмірів файлу. Через прогресивних можливостей стиснення даних і он-лайнового декодування вмісту багато аналітиків прогнозують, що в майбутньому дана технологія замінить HTML (поки він лише plag-in, надбудова). Теоретично сайт на базі Djvu буде набагато менше сьогоднішніх аналогів, навіть якщо ті використовують тільки форматований текст, позбавлений графіки.

Даний формат незамінний для публікації величезних пакетів

документації в Інтернеті або зберігання інформації на домашньому вінчестері. Він є також чудовим рішенням для публікації Інтернет-журналів. Особливо хороший цей формат для радіоаматорів!

  1. Архіватор Інтернет

Ідея перенесення документів з книг і журналів на простори мережі не

так вже нова. Але задумайтеся, скільки займає відсканований документ, збережений у форматі TIFF (цей формат не спотворює графічні дані і передає їх з достовірною точністю). У середньому файл з якістю близько 300 dpi може займати до 25-30 Мб. Якщо сканувати з меншим якістю, тобто приблизно в 100 dpi, то втрачається наочність. Так що TIFF відпадає, як носій інформації він неекономічний.

Тому найпоширенішим форматом збереження растрових даних в

Інтернеті став JPEG. Цей формат дозволяє досить прогресивно стискати дані. Порівняйте: 25 Мб у TIFF і 600 кб JPEG. Такий розмір більш-менш підходить для транспортування по мережі в умовах гарного і стабільного конекту. Єдина проблема: утримування прийнятної якості зображення – система компресії даних призводить до втрати інформації, яку вважає “зайвою”. Ми бачимо жахливі спотворення, різкі колірні переходи розмиті, про початки як можна забути – JPEG відпадає як формат для збереження документації в Мережі.

Багато пророкували велике майбутнє дітищу Adobe під назвою PDF.

В даний час більшість компаній викладає документацію про свої продукти саме в цьому форматі. Успіху сприяє використання об’єктів ActiveX, що дозволяють запускати Acrobat Reader прямо у вікні Internet Explorer. На жаль, PDF також “зайво ненажерливий”: середній розмір файлу найчастіше перевищує 100 кб.

Менш визнаним, а значить, менш популярним є формат стиснення даних

для факсимільних апаратів. Він дозволяє непогано стискати дані, хоча й з помітними втратами в якості. Правда, від факсів ніколи не було потрібно ідеального збігу з оригіналом.

Виходячи з перерахованих вище факторів, компанія AT & T вирішила

створити щось нове, здатне зробити революцію на ниві публікації в Інтернеті. Так, був створений формат DjVu, що стискає інформацію у вісім разів ефективніше, ніж JPEG. Якість ж картинки майже не змінюється. Кольорова сторінка з журналу, відсканована при 300 dpi, має розмір всього 20-79 кб. Чорно-біле зображення може взагалі опуститися до планки в 10 кб. Безумовно, на даний момент DjVu є найдосконалішим компресійним форматом.

Основна ідея формату, навколо якої і наростали інші можливості,

ґрунтується на тому понятті, що текст і картинки не є рівнозначними складовими документа. Для тексту існує велика кількість компресійних методів, причому відсоток стиснення інформація досить великий. Але, на жаль, дані методи не можуть архівувати графіком.

У DjVu застосовується спеціальна технологія, що відокремлює від

сканованого образу весь текст і стискаюча його, зберігаючи початкове якість. Картинки ж переводяться в 100 dpi і стискаються з техніки вейвлетів (дуже популярний сьогодні метод, що використовується для он-лайнової декомпресії даних). Додатково відбувається обробка фонових частин образу – так вдається виключити з кінцевого файлу фрагменти зображення, які просто не помітні (наприклад, стоять за картинками або за текстом).

Кожна картинка піддається деяким перетворенням, покликаним

скоротити розмір файлу. Перш за все, вона поділяється на кілька шарів, з яких можна потім її реконструювати. А найчастіше поділ відбувається на підкладку, маску і передній план. Для цього використовується досить простий алгоритм: растровий файл проглядається піксель за пікселем. Всі світлі крапки автоматично зараховуються до тла, темні – до маски або переднього плану. Всі пікселі, що виводяться на екран, отримують колір на базі логічних обчислень, побудованих на значеннях відповідних кольорів з усіх верств. Такий поділ допомагає найбільш ефективно стискати графіком. Маска, що має звичайно усього один колір, архівується за методом стиснення документів факсимільних апаратів, що зветься JB2. Ідея такого поділу не нова, вперше її запропонувала корпорація Xerox, що використовує подібний підхід при створенні формату XIFF.

Унікальною особливістю формату DjVu є надзвичайна компактність при

зберіганні зображень у високому дозволі (300 dpi і вище). На одній дискеті можна розмістити до двадцяти сторінок придатних для роздрукування на лазерному принтері. Крім того, цей формат оптимізований для передачі по мережі таким чином, що сторінку можна переглядати ще до завершення скачування. Таким чином DjVu є унікальним інструментом для відкриття Інтернет-доступу до радіоаматорській матеріалами, в першу чергу Радіосхеми і довідників. Окремо слід згадати законність публікації на сайті відсканованого тексту. Швидше за все, юридичне рішення проблеми ще є справою майбутнього

 

2. DjVu – алгоритми

В основі формату DjVu лежать кілька технологій розроблених в AT & T

Labs. Це:

  1. алгоритм відокремлення тексту від фону на відсканованому зображенні,
  2. вейвлетний алгоритм стиснення фону IW44,
  3. потужний алгоритм стиснення чорно-білих зображень JB2,
  4. ефективний універсальний алгоритм стиснення ZP,
  5. алгоритм розпакування “по запиту”,
  6. алгоритм “маскування” зображень.

Перші чотири алгоритму забезпечують надзвичайно високий ступінь

стиснення. Типовим є перетворення TIFF файлу розміром 25 Мб (формат А4 відсканований на кольоровому сканері 300 dpi) у DjVu файл розміром 80 кб, без видимої на око втрати якості. Для чорно-білого зображення, розмір файлу DjVu може вийти ще менше – приблизно 30 кб. Можливо подальше підвищення коефіцієнта стиснення, аж до відносини 1000:1, правда втрата якості стає досить помітною. Таким чином, на стандартну дискету 1,44 Мб можна розмістити 15-20 зображень високої якості. Додатково зауважимо, що викривлення вносяться вейвлетного стисненням істотно менш помітні в порівнянні з перекрученнями в JPEG файлах.

Алгоритми розпакування дозволяють показати частину зображення, не

розгортаючи всю картинку в оперативній пам’яті, а також легко масштабувати зображення. Це дозволяє швидко переглянути файл навіть на відносно слабкою машині – комп’ютер з процесором 486 і 16 Мб ОЗУ. Ще однією цікавою особливістю алгоритмів розпакування є інкрементального відновлення зображення. При перегляді через Інтернет спочатку виводиться тільки текст, потім фон у низькій роздільній здатності і тільки потім фон у високому дозволі. Це дозволяє швидко оцінити документ, не викачуючи його повністю.

Відділення тексту від фону надзвичайно підвищує його розбірливість,

особливо, якщо текст надрукований на кольоровому папері або розташований поверх малюнка. Можливий і окремий перегляд фону, причому алгоритм “маскування” відновлює ті частини фону, які були закриті текстом. Зображення не містять тексту можуть бути перетворені у формат IW4, який відповідає частині формату DjVu відповідальної за зберігання фону.

На початку 1999 року фірма AT & T оголосила про подальший розвиток

формату – DjVu 2.0. У новій версії передбачено об’єднання декількох зображень в один файл, з можливістю “перегортання” сторінок, а також нанесення на зображення так званих “гарячих точок”, ділянок зображення службовців гіперпосиланнями.

Тим, кого поки не задовольняє формат DjVu як такої, можна

порекомендувати набратися терпіння і “викачувати” оригінальне зображення, хоча навряд чи це доцільно. Але з поваги до прихильників традиційних методів, на нашому сайті будуть присутні матеріали у двох форматах (GIF і DjVu), за винятком тих випадків, коли вихідний файл вже був у форматі DjVu. При наявності відповідного софта завжди є можливість “розтиснути” DjVu в стандартні графічні формати (BMP, наприклад), однак, отримані файли будуть займати об’єм до 30-40 Мб.

 

3.DjVu – використання

Слід пам’ятати, що алгоритми закладені в DjVu оптимізовані для

зображень сканованих з високою роздільною здатністю. Якщо у вас є картинка 320×200 або 800×600 то вас цілком задовольнить JPEG або GIF. Оптимальними для стиснення DjVu є картинки відскановані на 300 dpi і вище. Для малюнків відсканованих на 100-200 dpi передбачений режим попереднього розтягування із згладжуванням для підвищення якості результуючого зображення. Також необхідно зауважити, що процес стиснення, на противагу до відтворення, досить критичний до вільної оперативної пам’яті. 32 Мб ОЗУ це мінімум необхідну для роботи. Фірмові керівництва рекомендують 64 Мб

Для того, щоб скористатися перевагами нового формату необхідно мати

дві речі: утиліту стиску для видавця і утиліту перегляду для читача.

Як прийнято в останні роки, утиліти перегляду DjVu поширюються абсолютно безкоштовно. Для тих, хто використовує Windows 95/98/NT, пропонується два продукти: Plag-in для веб-броузерів розповсюджуваний AT & T. Даний plag-in сумісний з Microsoft IE вер. 4.0 і вище, Netscape Navigator вер. 4.0 і вище і Opera вер. 3.26 і вище. Інсталяційний файл називається npdjvu.exe і має розмір приблизно 600 кб. Програма DjVuer для роботи з файлами DjVu від фірми Feith Systems and Software Inc. Інсталяційний файл називається DjVuerin.exe і має розмір приблизно 2.5 Мб.

Для інсталяції DjVu plag-in для веб броузера в Windows-95/98/NT

необхідно завантажити та запустити файл npdjvu.exe Програма інсталятор проводить пошук відомих їй броузерів по всіх дисках комп’ютера. Після завершення пошуку видається список усіх виявлених броузерів і пропонується вибрати до яких з них треба доустановіть DjVu plag-in. Перед завершенням інсталяції необхідно закрити вибрані броузери для гарантії коректної установки. Треба перезавантажитися. Після завершення встановлення можна сходити на http://djvu.att.com і подивитися невелику електронну бібліотеку в форматі DjVu.

Після завантаження Djvu-сайту стартує plag-in. Зовні він дуже схожий на

Acrobat Reader, схожість стосується навіть малюнків на кнопках. На самому початку панелі знаходяться меню вибору типу виводу – можна виводити текст тільки чорно-білим або тільки фон; наступне меню відповідає за розмір документа на екрані. Поруч розташовані Zoom In кнопки, Zoom Out, потім – панель контролера, керуючого перемиканням між сторінками та перемоткою взад і вперед (тобто від корінця до корінця).

Скролінг здійснюється “долонькою”. При цьому сторінка не блимає –

рухатися по документу легко і зручно. При збільшенні картинки якість майже не страждає, особливо якщо справа стосується тексту. Графічні зображення всередині документа можуть бути досить великими, але завдяки системам стиснення займають відносно мало місця. Щоправда, якість може помітно страждати.

В цілому враження від нового формату найкращі, особливо, з огляду на

швидкість завантаження. На жаль, функції збереження тексту з документа немає, можлива лише одна операція – читання. Не існує і функції копіювання в буфер обміну. Зате можна зберегти малюнок у файл і розпізнати її програмою для розпізнавання символів (OCR), щоб потім прочитати текст в Word.Можливо, це один з небагатьох недоліків формату DjVu, який, однак, не применшує його достоїнств.

Plag-in управляється і налаштовується через контекстне меню. Перші

пункти відповідають виключно за виведення зображення і за навігацію по документу. Save as зберігає файл на диску (він має розширення djv або djvu). Print – друкує. Page Information виводить віконце з ключовими параметрами файлу: розмір фону, маски, верхніх шарів, а також тексту, останнє значення таблиці вказує величину діапазону стиснення даних. Основні опції програми налаштовуються через пункт Preferences. Правда, параметрів достатньо мало, серед них яскравість картинки, гаряча клавіша для виводу гіперпосилань, розмір буфера декодування (корисний для слабких машин).

Формат DjVu передбачає наявність текстового шару, який містить текст

із сторінки. (Використовується для легкого копіювання тексту з документа при роботі з ним). У разі, якщо текстовий шар недоступний, єдиний метод отримання тексту – виконання оптичного розпізнавання (у сторонніх програмах).AT & T продали технологію компанії LizardTech, яка намагається використати її для своїх комерційних інтересів, але, завдяки відкритості формату, для створення та перегляду документів DjVu існує вільне програмне забезпечення, доступне для різних платформ. 1 липня 2008 LizardTech передав менеджмент DjVu батьківської компанії Celartem. а 10 червня 2009 Celartem передав права на технологію DjVu компанії Caminova.

Формат DjVu – відкритий формат, призначений для того ж, для чого

раніше використовувалися мікрофільми, тобто для переносу інформації з паперових носіїв у більш компактний вигляд. Зовні це нагадує формат Acrobat Reader: зображення призначене тільки для перегляду, присутні різні засоби навігації, текст сусідить з ілюстраціями і т.д. Кардинальна відмінність – напрямок “руху” інформації. Якщо формат Acrobat – це спроба за допомогою комп’ютера відтворити формат традиційної книги (так би мовити “електронний папір”), то DjVu – це саме відскановані сторінки звичайної книги, дуже компактно і на вічні століття за допомогою півдюжини алгоритмів і евристик упаковані у формат “електронної книги “.

 

4.Основні властивості DjVu

Ніхто ніколи не стверджував, що djvu – це альтернатива всім існуючим

графічним форматам, але в області створення і зберігання чорно-білої, напівтонової і частково кольорової документації, поки йому немає рівних. У першу чергу це стосується відсканованих паперових документів які називають носіями. Системи OCR, тобто розпізнавання тексту, звичайно, чудові речі, але поки вони ще не настільки інтелектуальні, щоб зуміти розпізнати багато сторінок без єдиної помилки, розрізнити, де малюнки, де текст, а де написи на малюнках.

Потрібно розглянути наявні на сьогоднішній день програми, за

допомогою яких можна дивитися, створювати і конвертувати файли djvu. Перші програми від творця цього формату, всесвітньо відомої фірми AT & T, були консольні, що аж ніяк не надихало, оскільки працювати було просто незручно. Але це було кілька років тому, з тих пір спливло багато води, а права на комерційне використання djvu були продані Lizard Tech. Не можна сказати, щоб після купівлі прав на djvu, з’явилися небувало зручні та швидкі кодувальники і конвертери, але принаймні, робота в цьому напрямку йде, хоча зникнення DjVu Solo з сайту Лізард незрозуміло, натомість нічого не з’явилося. На користь популярності djvu можна навести приклад відомих вюгерів, типу ACDSee, XNView, IrfanView та інших, до яких є djvu плагіни.

Для перших двох софт вони кілька кривуватий, мається на увазі, що

зображення при перегляді виглядає як відскановане з дуже низьким дозволом, хоча насправді це не так, djvu плагін до Ірфану було доопрацьовано і виглядає незрівнянно швидше і пристойніше. Мало того, в останній версії IrfanView 3.80 є можливість дивитися багатосторінкові файли djvu, правда, тільки першу сторінку, але теж прогрес.

Через певний час з’явився новий безкоштовний вьюер SlowView , в

якому є плагін кодера і декодера djvu, але на жаль, багатосторінкові файли він теж не підтримує, а кодер, швидше, здатний дискредитувати саму ідею, бо файл виходить більше за оригінал. Основним інструментом для перегляду djvu можна вважати плагін до Internet Explorer-у, який лежить на сайті самого Лізард. Працює він чудово, підтримує багатосторінкові файли, чого ніхто із згаданих вище софт не може. Істотно те, що плагін може розділити багатосторінковий файл на складові частини, це буває потрібно при конвертації в інші формати, наприклад для розпізнавання тексту та його перекладу на іншу мову. Після завантаження файлу багатосторінкового потрібно клацнути мишкою на “Save” і при збереженні вибрати “Indirect”. Конвертувати djvu файли можна тільки в bmp, але цього більш, ніж достатньо в більшості випадків. Є два варіанти з установки плагіна – завантажити дистрибутив або встановити плагін прямо в онлайні.

З програм, які можуть створювати та переглядати djvu, слід згадати

DjVuer (кілька версій) від фірми Feith. Він працює краще за всіх інших, але наявні версії не підтримують багатосторінкові файли, що не може не викликати подиву, причому це ж невміння збереглося і до цього дня! Якщо ж вихідні файли мають помірний розмір, то проблем не виникає. У плюс можна поставити можливість групової або пакетної (batch) конвертації, що дозволяє обробити відразу багато файлів, але бувають і вильоти при дуже великому (кілька сотень) кількість файлів.

Файл з повно кольоровим bmp при 600 dpi, розміром в 200 Мб був

сконвертований в djvu розміром 700 кілобайт за 6 хвилин на самому сучасному комп’ютері. На захист DjVuer-а можна сказати, що друга за рахунком розробка самої LizardTech під назвою DjVu Solo не може і цього, великі файли їй явно протипоказані, але зате вона може створювати багатосторінкові файли і робити гіперпосилання, що безумовно зручно, врахуйте тільки, що додавати сторінки в пакет потрібно з ОСТАННІЙ, це вже ляп розробників, втім запам’ятати цю особливість неважко. Судячи з консольному многостранічніку, для якого теж є GUI, ляп був закладений в незапам’ятні часи, оскільки ця особливість присутній і в консолі. Працює DjVu Solo в іншому непогано, залишається сподіватися, що її творці усунуть наявні недоліки в цій безкоштовній програмі, хоча, судячи зі зникнення її з сайту Лізард, як уже зазначено вище, навряд чи її будуть допрацьовувати. Комерційна версія дозволяє використовувати розпізнавання графічного тексту, але це не є проблема і без її купівлі, оскільки для такого завдання добре підходить IrfanView, яким можна отконвертіть djvu файли, крім багатосторінкових, в будь-який інший формат для OCR, наприклад tiff або bmp.

Оскільки переваги djvu позначаються саме на графічних файлах,

створених з великою роздільною здатністю, тобто 300-600 dpi, то проблеми при розпізнаванні конвертованого файлу не виникає, принаймні у мене все проходить гладко і помилок через конвертації практично немає.

Для конвертації pdf в djvu підходить пакет GhostScript + GhostView,

який дозволяє перетворити pdf в самі різні формати, наприклад у bmp з роздільною здатністю 600 dpi. Файл djvu після такої операції виходить прекрасної якості, але раз на п’ять менше оригіналу. До речі, для роботи з pdf згаданий пакет дуже зручний і корисний, оскільки інші софти складні і об’ємні. Але останній Акробат (повний), незважаючи на свою об’ємність, дуже добре конверт pdf в tif і працює краще, ніж попередня версія.

Друга можливість конвертації, і не тільки для pdf, це FinePrint, при

перегляді сторінки перед друком досить клацнути правою пахвою, з’являється меню з експортом зображення в bmp через кліпборд. Є ще кілька віртуальних принтерів, ознайомитися з порадами по скануванню і створення графічних файлів можна на сайті СКР.

Поради з підготовки матеріалів в електронному та паперовому вигляді.

Тепер про встановлення плагіна для IE. У Windows 98PE, виявилося, що після інсталяції плагіна, яка проходить дещо дивно – не видається вікно налаштування, файли djvu відмовляються відкриватися, хоча в типах файлів все прописано вірно, при Windows 98SE такого ніби не було. Після деяких мук було прийнято рішення встановити плагін в онлайні, прямо з сайту Лізард і тоді все пішло як по маслу. Різниця опинилася в різних папках розміщення плагіна після інсталяції, з чим це пов’язано, сказати важко, може бути стара версія віндовс, може бути ще що те. При невірної інсталяції, папка плагіна розміщувалася в папці самого IE, а при правильній – в окремій папці LizardTech – DjVuControl.

Отже, підіб’ємо деякі підсумки djvu-шного софту:

Перегляд будь-яких файлів djvu:

-Плагін до IE, DjVu Solo.

-Перегляд односторінковий файлів:

-IrfanView, DjVuer (Feith) – гарна якість;

-XN View, ACDSee – неважливе якість;

-SlowView – свої величезні djvu повільно, інші – погано.

Розпакування багатосторінкових файлів;

-Плагін до IE, DjVu Solo.

Створення односторінковий файлів djvu:

-DjVuer (Feith), DjVu Solo, кодер від AT &T;

-SlowView – поки пародія на створення, djvu файл більше ісходніка.

Створення багатосторінкових файлів:

-DjVu Solo з гіперпосиланнями;

-Багатосторінник від AT & T, тільки конвертація, без гіперпосилань;

Конвертація djvu в інші формати:

-Плагін до IE (тільки bmp);

-IrfanView;

-DjVuer від Feith (bmp, jpg, pnm);

-DjVu Solo (тільки bmp);

-Віртуальні принтери FinePrint, SuperPrint, ePrint, pdfFactory та інші.

Відновлення тексту для перекладу після конвертації djvu в bmp, tif etc:

-FineReader-http://www.abbyy.ru/

-CuneiForm – http://www.cuneiform.ru/ та інші.

Роздруківка у великому масштабі після конвертації djvu:

-Teulat, підтримуються файли ps, tif, jpg – http://www.femfum.com/

-Плагін до Акробат (повного) CrackerJack 4.1, підтримується pdf – http://www.lantanarips.com/

Друк djvu – категорично і настійно рекомендую застосовувати FinePrint –

http://www.fineprint.com/, особливо для багатосторінкових файлів, це допоможе уникнути багатьох помилок під час друку і заощадить вам час і папір. На сайтах, присвячених djvu є згадки про нові комерційних програмах,

але на жаль, вони не доступні для скачування і тестування.

Вважається що djvu не є графікою, а новим архівним форматом з

можливістю попереднього перегляду. Ніхто вам не заважає після закачування файлу djvu переконвертувати його в потішали ваше серце, рідний з дитинства і що радує око bmp, jpg, tif, gif, pdf або іншою, вам ще більш милий, формат. Якщо вихідний файл був з роздільною здатністю 300-600 dpi і був правильно відсканований і конвертований в djvu, то ніяких незручностей ви не випробуєте, чого не можна сказати про чорно-білих файлах, понівечених jpg-му чи кольоровим gif-му.

 

ВИСНОВКИ

Створена AT & T Labs технологія DjVu була на початку 2000 року продана американській компанії LizardTech, причому основною метою цього кроку було бажання розробників почати активне просування свого дітища на ринок. Нові господарі випустили набір рішень, орієнтованих на використання в електронних видавничих системах. Сьогодні LizardTech пропонує два основних продукту: пакет DjVu Solo 3.1 для малого бізнесу і DjVu Enterprise 3.1 для корпоративних користувачів. Обидва продукти відносяться до абсолютно нового напряму в видавничої індустрії – сфері електронних публікацій, а якщо говорити ще точніше, то до так званого Web-скануванню – технології перенесення документації в електронний формат з одночасною можливістю її розміщення під Internet.

Успішному впровадженню цих технологій сприяє надзвичайно компактний формат одержуваних файлів, можливість включення в DjVu-документ гіперпосилань і пошукових засобів, а також програмного інструментарію для візуального виділення найбільш важливих частин
документа.
Сполучною ланкою між цим новим поки форматом і Internet є звичайний Web-браузер, який легко «навчається» науці перегляду DjVu-файлів шляхом установки програмної надбудови – DjVu Web Browser, яку можна безкоштовно завантажити з Web-сайту LizardTech.

В процесі перекодування в DjVu-формат використовується технологія

розділення вихідного зображення на три шари: передній план, фон та чорно-білу маску. До кожного з цих шарів застосовуються власні алгоритми стискання.

Отже, використання технології DjVu є ефективним засобом створення та використання електронних бібліотек в мережі Інтернет.

Список використаної літератури

  1. Bruce Schneier Applied Cryptography. — Second. — John Wiley & Sons, 1996.
  2. Westley, Brian westley.c. IOCC 1989.
  3. Введение в криптографию / Под ред. В. В. Ященко. — М. : МЦНМО-ЧеРо, 2000.

Пестриков В.М. Енциклопедія радіоаматора. 2 вид. Доповнене і Перероблено. Навчально-практичний посібник. – СПб. : Наука і техніка, 2001. – С.349-354.

ЗАВАНТАЖИТИ

Для скачування файлів необхідно або Зареєструватись

Курсова DJVU (49.0 KiB, Завантажень: 1)

завантаження...
WordPress: 23.04MB | MySQL:26 | 0,434sec