Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: DikBSD
Дата сообщения: 20.01.2011 18:29
Иосиф внес меня в список разработчиков основной ветки. В дальнейшем форк STE - закрывается, а все уже сделанные в нем дополнения и новые возможности будут вливаться непосредственно в основную ветку Scan Tailora.

Добавлено:
В связи с этим - огромная прозьба - удалите, пожалуйста из шабки ссылку на форк STE, чтобы народ не путался.
Автор: StanFreeWare
Дата сообщения: 20.01.2011 20:19
DikBSD
Да там и сами можете подчистить, формат не сложный вроде.. Кнопка редактирования в левом верхнем углу. Но пока не влили изменения в оф. СТ думаю стоит погодить с этим. Может кому именно СТЕ-фичи потребуются...
Автор: DikBSD
Дата сообщения: 21.01.2011 17:55
Спасибо, не знал...
Автор: iit512
Дата сообщения: 23.01.2011 03:20
Заметил, что последняя сборка не пересчитывает полезную область после ручного изменения угла поворота. Это так и должно быть?
Автор: DikBSD
Дата сообщения: 23.01.2011 06:39
Не знаю - полезным контентом (точнее - задание определенного его размера определенным сканам) сейчас занимается Masahiro Kitagawa... Я сам пока не гонял контент. Надо будет посмотреть.

Добавлено:
Свежая сборка scantailor-1.0beta8.7z
http://www.onlinedisk.ru/file/595437/
Описание: Слияние официальной версии CT и форка CTE
Последние изменения в git на 23 января 2011 г.

Автор: Salvatorul
Дата сообщения: 23.01.2011 12:20
Есть несколько предложений по улучшению работы с деворпингом:
- При включении ручного деворпинга страница зачем-то заново обрабатывается. Гораздо логичнее было бы, если бы обработка происходила только внесения каких-то изменений на вкладке dewarping
- Если вносить какие-то изменения на вкладке "деворпиг" ДО переключения с off на manual, то эти изменения не учитываются, страница обрабатывается с "нулевым" выпрямлением (кажется, в первых сборках этого бага не было)
- И очень не хватает возможности скорректировать вручную результат автоматической обработки. Иногда программа ошибается самую малость, тут бы подвинуть направляющую на пару миллиметров, но приходится все начинать по новой.
Автор: DikBSD
Дата сообщения: 23.01.2011 16:47
Пожелания и сообщения о проблемах с деворпингом лучше отправлять прямо Tulon'у на его email. Он непосредственно занимается этим...
Автор: ycheff
Дата сообщения: 23.01.2011 18:37
Еще одно пожелание - нельзя ли ввести автосохранение пакета СТ.
А то при сбоях, зависании компа или отключении питания возникает проблема повторной процедуры обработки, что для больших книг требует много времени.
Самому часто сохранять пакет не очень удобно - это надо чуть-чуть параноиком быть.
Автор: DikBSD
Дата сообщения: 23.01.2011 19:36
В будущем планируется диалог Настроек (каждый под себя сможет установить базовый порог бинаризации, положение и размер полей, уровень чистки пятен и т.д. Будет и по-умолчанию). Туда можно будет разместить и опцию вкл/выкл автосохранения и как часто...
Автор: woodyfon
Дата сообщения: 24.01.2011 19:25
Developers, верните, пожалуйста, спсособность, когда выбираешь разрезку скана на одну страницу, выбирать либо левую либо правую. Сейчас при разрезке скана на две странице ST справляется на ура, а если на одну страницу, то справляется почти никогда
Автор: amosopher
Дата сообщения: 24.01.2011 22:51
есть ли какой-нибудь способ добавления большого кол-ва файлов в уже существующий проект ST?
а то способ через опцию контекстного меню "добавить в проект"получается только пофайлово.
Автор: DikBSD
Дата сообщения: 26.01.2011 18:40
Насколько я знаю - пока такого способа нет - иначе автор СТ - Tulon давно бы сделал. Но - надо изучить основательно архитектуру программы (код)...
Автор: Dimock
Дата сообщения: 27.01.2011 16:58
Попробовал программу. Отсканировал несколько страниц в ФайнРидере, сняв галки исправлять перекосы и делить развороты. Добавил файлы tiff в ST. Указал директорию, указал Выбрать все и Добавить выбранные файлы в проект. Программа написала - "Некоторые из файлов не загрузились. Либо программа не поддерживает их формат, либо они повреждены. Вам следует удалить их из проекта." Как решить проблему? Спасибо.

Добавлено:
Извините за оффтоп - я знаю несколько причин, почему не советуют сканировать в ФайнРидере - искажает строки и плохо сжимает файлы tiff. Какие еще недостатки Вы знаете?
Автор: DikBSD
Дата сообщения: 27.01.2011 18:05
Иногда помогает такие файлы после FineReaderа прогнать через IrFanView в пакетном режиме (нажатие кнопки b).
Конечно - самый оптимальный вариант - не сканировать через FineReader (его удобство слишком дорого часто обходится)
Те, что вы перечислили проблемы - они самые основные.Еще встречались такие (со слов некоторых пользователей) - проблемы с метаданными (не все программы потом с такими сканами работают), искажение не просто строк, но и букв...
Более подробно посмотрите в одной их частей форума Электронные книги: сканирование, обработка, сборка (вот ссылка на Часть IV http://72.233.112.78/topic.cgi?forum=93&bm=1&topic=3172#1 ) писали об этом (найти можно по поиски, предварительно открыв страницы форума в режиме "Версия для печати") - ссылка вверху справа шапки.


Добавлено:
Ваш вопрос лучше было бы задать именно в указанном форуме - там он был бы по теме.
Автор: StanFreeWare
Дата сообщения: 27.01.2011 19:12
Dimock
Еще может быть, что эти файлы - bmp, переименованные в tiff. Irfan это покажет.
Тогда нужно переименовать их в bmp и пакетно переконвертировать в tiff (ST с bmp не работает).
Автор: Dimock
Дата сообщения: 28.01.2011 12:45
StanFreeWare

Да, это bmp-шки.
Автор: Dimock
Дата сообщения: 01.02.2011 11:47
Обработал страничку (разворот) в ST, отсканированную в VueScan в режиме 300 серого RAW - http://www.onlinedisk.ru/file/601000/ Готовый файл (одна страница) и профиль в VueScan-е в одном файле. Получилась очень жирная страница. Режим вывода - 600 dpi, ч/б. Что я сделал не так?
Автор: woodyfon
Дата сообщения: 01.02.2011 18:30
Dimock

Уточни на каком этапе видишь такую картинку. После обработки, после применения CS. Также не мешало бы показать RAW файлик. Мне кажется, что применен какой-нить фильтр размытия.
Автор: Dimock
Дата сообщения: 01.02.2011 18:52
woodyfon

Естественно, что жирные буквы появляются на этапе вывода. Сырец вышлю позже - у меня Инет нестабильный.
Автор: DikBSD
Дата сообщения: 01.02.2011 20:54
На этапе вывода есть горизонтальный ползунок, регулирующий порог бинаризации (Тольще/Тоньше). Можно им подобрать нужную толщину букв экспериментально, потом задать через диалог (по кнопке Применить...) ко всем сканам, прогнать на автомате. АП потом - вручную подправить толщину букв на отдельных сканах.
Автор: rupinskiy
Дата сообщения: 01.02.2011 21:58
Подскажите каким способом очистить сканы от лишнего мусора - при сканировании отображалась ненужная подложка сканера - надо убрать только ее - не надо чистить поварачивать, резать - только подрезать по границе текста - пробую так сделать - текст иногда искажает - растягивает в одном месте, сужает в другом - как надо настроить программу.
Автор: amosopher
Дата сообщения: 01.02.2011 22:03
Помогите, пожалуйста, решить проблему. Обрабатываю книгу со множеством иллюстраций. Попадаются и сдвоенные (в разворот) - на одной половине страницы картинка, на другой (нижней) текст. Картинку обвожу одной зоной ("добавить к автослою"), а область текста другой ("вычесть из всех слоев"). Получаю на выходе из СТ четкий ч/б текст с картинкой. А когда кодирую в djvu (st separator-djvu small (bitonal 600)-djvu imager) получаю на таких страницах текст в оттенках серого. В чем дело? Как устранить 'ne проблему? Вот примеры таких страниц (одна ч/б для сравнения и две с серым текстом - извлек из получившегося djvu): http://www.onlinedisk.ru/file/601314/
Автор: U235
Дата сообщения: 02.02.2011 02:21
Dimock

Цитата:
Получилась очень жирная страница. Режим вывода - 600 dpi, ч/б.

У Вас оригинал книги имеет размеры 3х5 см?
Если нет, то разберитесь с разрешением и прикинте, какие размеры в пикселях будет иметь Ваш скан при заданом разрешении.


Добавлено:
amosopher
Нужен пример вывода страницы с картинкой из ST и вывод после seporator'a.
Вы, случайно, после ST ничего со сканами не делаете в какой-нибудь программе? Сжатие jpeg не используете?
Автор: amosopher
Дата сообщения: 02.02.2011 08:15
U235 Вот пример таих страниц: http://www.onlinedisk.ru/file/601413/ Как видно, серым текст становится после сепаратора. После СТ я со сканами ничего не делаю (сепаратор+djvu small+djvu imager). Сжатие jpeg не использую.
Автор: Dimock
Дата сообщения: 02.02.2011 11:07
U235

Размеры оригинала

Высота - 110 мм
Ширина - 170 мм

Я ошибся - сканирование было не в RAW, а в TIFF. Я еще несколько раз проверил, как ScanTailor преобразует эти 2 формата в режим 600 dpi ч/б - первый - прекрасно, второй - жирно. Инэт тормозит, к сожалению не могу пока выложить оригинал.
Автор: U235
Дата сообщения: 02.02.2011 13:26
Dimock
110 мм это 4.3 дюйма, при 600 точек на дюйм, высота страницы должна быть порядка 2600 пикселей. А у Вас что? Следовательно у Вас сканы не 600 dpi, а ниже. Попробуйте отсканировать для интереса страничку в другой программе или разберитесь с настройками VueScan, почему он выдает неправильное разрешение.
amosopher
Да, проблема после ST, такое ощущение, что он делает апсемплинг после бинаризации.
Выложите, пожалуйста, файл проекта, и исходный файл с картинкой. Какая у Вас версия ST?
Автор: amosopher
Дата сообщения: 02.02.2011 20:04
U235 Использую ST 1.0.0beta8 (последнюю из здесь выложенных). Вот исходник и файл проекта: http://www.onlinedisk.ru/file/601874/
Автор: U235
Дата сообщения: 02.02.2011 22:23
amosopher
У меня этот файл нормально обработался ST 1.0.0beta8 и в ранней версии. На выходе в смешеном режиме текст имеет яркость строго 0, а у Вас она немного плавала у контуров и из-за этого были артефакты. Все-таки, подумайте, может каким-нибудь просмоторщиком файлы после ST Вы открывали? Если один файл (тот, что Вы выложили) отдельно обработать в ST тоже самое будет?
Автор: DikBSD
Дата сообщения: 03.02.2011 07:30
Можно скачать scantailor-1.0beta9:
http://www.onlinedisk.ru/file/602024/
Автор: Dimock
Дата сообщения: 03.02.2011 12:43
To all

Забыл выслать оригинальный скан - http://www.4shared.com/file/Lg6XuQ_D/Scan-110131-0001.html

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.