Сканирование книг - Как это сделать правильно

4 сообщения / 0 новое
Последнее сообщение
DikBSD
Аватар пользователя DikBSD
Сканирование книг - Как это сделать правильно
Инструкция по сканированию
 
1. Почаще протирать стекло сканера. Желательно через каждые 100-150 страниц книги. Это предотвратит попадание пыли и / или мелких фрагментов бумаги на скан, а, следовательно, улучшит качество будущей жлекстронной книги.
 
2. Самое «проблемное» место на книге при сканировании - это разворот книги. Здесь качество скана может получиться плохим с нечеткими буквами.
Поэтому:
а). Желательно сканировать не разворотами, а по одной странице.
б). Тщательно прижимать книгу, особенно у разворота, к стеклу сканера, не раздавив при этом само стекло.
 
3. Параметры сканирования:
а). Разрешение - 300 dpi. Если текст книги очень мелкий (особенно еврейский или греческий), то разрешение - 600 dpi.
б). Формат изображения - tiff.
в). Ни в коим случае нельзя использовать формат изображения jpg,jpeg, так как этот формат - с потерями из-за сжатия, что приводит к искажениям букв и потерям их мелких деталей: перемычки букв, мелкие символы в греческом языке и иврите.
г). Черно-белые страницы книги, а также страницы с серыми картинками нужно сканировать только в режиме «серого».
д). Страницы с цветным текстом и / или обложки книг нужно сканировать только в режиме «цветной».
 
4. Постсканирование:
а). После сканирования желательно переименовать имена сканов по шаблону: 000.tif, 001.tif... nnn.tif (если используется png, то - аналогично). Где 000.tif - это верхняя обложка книги.
Причем 1-я страница книги должна соответствовать номеру 001.tif, 10-я - 010.tif, и т.д. Сделать это можно в Total Commander (Ctrl+M).
Это необходимо для отслеживания пропущенных при сканировании страниц. Проще переименовать сканы по номерам и досканировать недостающие страницы книги, чем потом искать отданную книгу и дрсканировать недостающее тем, кто будет заниматься обработкой сканов и изготовлением электронной книги.
 
esxatos
Аватар пользователя esxatos
А как сжимать и какой прогой
А как сжимать и какой прогой лучше это сделать, чтобы заливать на серверы архивы сканов для обработки другими людьми?  
А то новенькие закачивают огромные архивы по 2-5 Гб. dms
delphy
Аватар пользователя delphy
1) Какую программу для
1) Какую программу для сканирования + распознания текста рекомендуете?
 
2) После сканирования текста, если делать распознание текста, то я заметил 2 проблемы:
2.1. обычно в 10% программа поставит другие слова, не те которые в оригинал. И тут, как я понимаю только одно решение: надо прочитать весь текст, но это не реально.
2.2. теряется форматирование страницы, и если хочешь чтобы книга выглядела как оригинал, то надо самому потом в Word редактировать всё. Но это опять занимает много времени.
  
Если сохранить без распознания, то потом это просто фото, а не текст (не возможно искать что-то в нём, копировать...).
 
Как решить эти проблемы?
Помогите пожалуйста.
 
Спасибо!