FAQ по сборке (созданию) DjVu книги из сырых сканов

7 сообщений / 0 новое
Последнее сообщение
igoreck
Аватар пользователя igoreck
FAQ по сборке (созданию) DjVu книги из сырых сканов

Подскажите, пожалуйста, FAQ по сборке (созданию) DjVu книги из сырых сканов для Windows 7

ASA
Аватар пользователя ASA
А что именно интересует? И

А что именно интересует? И что не понятно?

Tov
Аватар пользователя Tov
Тема очень обширна. Но если в

Тема очень обширна. Но если в двух словах, то сырые сканы обрабатываешь в Scatailor, а уже из обработанных в ней файлов, делаешь в Finereader или другой какой.

palatinus
Аватар пользователя palatinus
Задавайте вопросы по ходу

Задавайте вопросы по ходу процесса, что именно не получается. Все обычные программы, используемые для изготовления книг, совместимы с Виднос 7.

prosams
Аватар пользователя prosams
следущие действия зависят от
следущие действия зависят от характера проделанных работ в программе Scan Tailor... в оновном, это будет отржаться от того, как вы далее будете кодировать тифы...
 
походу, сразу запомните несколько ОЧЕНЬ важных правил:
  • работать нужно только с форматом изображений tif (ни в коем случае с jpg)
  • на вход программе Scan Tailor нужно давать изображения минимум 300 dpi, а вот на выходе это должно быть только минимум 600 dpi - при сохранении в 600 dpi получается лучше качество... а вот если вы хотите чтобы djvu был меньше размером, после можно уже дополнительно уменьшить размеры готовых tif-изображений, но качество сохранится
  • если у вас сканы смешанного характера, то есть, на страницах и текст и изображения, то изображения нужно выводить в программе Scan Tailor в Смешанном режиме, определяя зоны изображений, сначала автоматом, а потом правя вручную если где нужно
  • на входе для Scan Tailor все изображения должны быть одинакового dpi
после, обработанные и выведенные tif-файлы кодируются в программе DjVu Small Mod, и вот с ней уже надо быть очень внимательным, при выборе не того профиля можно сильно увеличить размер djvu? либо, еще хуже, испортить качество страниц, это может выразиться, что буквы будут портиться, например, вместо буквы "и" будет в djvu буквы "н", или буквы с строках будут сильно плясаться... на этом этапе самая срупулезная работа...
  • за основу надо взять характер изображений, которые вы выводили в Scan Tailor - если изображения все черно белые, то в программе DjVu Small Mod, будет один профиль для всех страниц (типа Оригинальные -> Черно-белый, и профиль выбирать с нужным dpi), если на ряде страниц есть изображения, то можно часть страниц (которые только с текстом) закодировать одним профилем, а другая часть (которая с изображениями) другим профилем, а затем разные части склеить в программе DjVu Small Mod в режиме Декодировать djvu, выбрать Выходной формат для вывода при декодировании - djvu, затем нажать на Раскрыть файл, выбрать по очереди djvu с разными частями, программа сама расставит вс е страницы по алфавиту ... если страниц с изображениями в них много, то можно применить универсальные профили, типа Экстремальные -> C иллюстрациями, а в случае серых изображений, профиль Экстремальные -> Иллюстрирован-серый
  • но в большинстве случаев, надо для книг подходить индивидуально, каждый профиль вы можете быстро подправить для данной книги, изненив Опции в программе (к программе DjVu Small Mod, есть русская справка по опциями и подсказки по подходу к работе в программе)... 
я могу посоветовать только то, как я кодирую (правда в простом варианте, все несколько срупулезней я делаю, для чего нужны больше знаний, на начальном этапе нужно попроще, что и изложу)
возьмем для примера, сканы с серыми изображениями, которые мы обработали и вывели в программе Scan Tailor... я делаю так (основные шаги):
  • открываю одно готовое обработанное  tif-изображение в программе XnView, увеличиваю масштаб на весь экран, нахожу какую-нибудь зону в изображении, затем кодирую одну эту страницу в DjVu Small Mod профилем Экстремальные -> Иллюстрирован-серый, открываю кодированный djvu с одной этой страницей, увеличиваю масштаб, чтобы он был такой как открытое изображение в XnView, нахожу туже зону и всматриваюсь в то, какие я имею потери... в большинстве случаев, будет теряться резкость в изображениях... это можно избежать, меняя в Опциях, на вкладке Фон, значения параметров Качество и Размытие фона - чем больше Качетсво и меньше Размытие фона, тем лучше будет качество и резкость, но будет больше размер djvu... но даже это может не спасти... например, для книги Соприкасаясь с миром ислама, в которой много серый изображений, я спас изображения только с помощью изменения параметра Фильтр формы на вкладке Сегментация, поиграсаясь со значением (до значения 300) этого параметра в перемешку с Размытием фона и Делителем качества на вкладке Фон, ибо без использования Фильтра формы на серых изображениях появлялись явные артефакты, что было очень плохо... и файл получился на 700 страниц 17 мегов, зато спас изображения и общее качество, а 17 мегов для djvu с множеством изображений не так уж и много...
  • но в начале, можно пойти таким путем для страниц с серыми изображениями - взять одну страницу, выбрать для нее профиль Экстремальные -> Иллюстрирован-серый, закодировать, переименовать готовый djvu, открыть его, увеличить масштаб для сравнения, затем зайти в Опции профиля, предвариательно сбросив параметры кодирования на вкладке Общие, затем на вкладке Текст выберите Детализация -> Без потерь, закодируйте туже страницу, а затем сравните два djvu - один закодирован спараметрами профиля по умолчани, а другой с детализацией без потерь, и вы увидите какие потери вы имеете, если не критичные, то можете попробовать на страницах побольше кодировать готовым профилем, не забывая отключать ваши Опции... если большие потери, или качество вам не нравится, то поиграйтесь с разными параметрами Детализации, ибо при Без потерь, размер djvu может быть не оптимальный и не совсем оправданный...
вобщем, читайте Справку, пробуйте экспериментировать и менять профили с опциями при кодировании и так далее... и есть в инете темы, в которых идет обсуждение создания djvu, например, https://rutracker.org/forum/viewtopic.php?pg=1&t=4383540&start=870 - на этой странице можно скачать моды DjVu Small Mod 0.7.4 и ScanTailor Advanced и вести обсуждение... в указанном FAQ расписан другой способ вывода смешанного содержимого, Разделенный, через экспорт...
 
способов и путей может быть несколько, вы начните делать, и уже задавайте вопросы конкретно по какой-то проблеме, хотя в инете инфы много есть...
 
menahim
Аватар пользователя menahim
привет.
привет.
Пожскажите, есть ли в какой программе функция удаления серого фона, шума из плохого скана pdf ?
Maxim