Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor: Часть 2

Автор: kvesda
Дата сообщения: 25.04.2010 10:59
Tulon

Цитата:
kvesda
Я изначально планировал сделать переключаемую сортировку на ленте предпросмотра - по ширине рамки контента, по высоте, и обычную. Однако в итоге решил, что отношение сложности реализации к полезности получается черезчур высокое.
Ничего не обещаю, но подумаю над этим вопросом.

Спасибо! Это очень важно! Забыл написать, что урезание по ширине и высоте на некоторых сканах было не до номеров страниц, а до некоторых абзацев (по высоте), или урезка целых слов (по ширине)...
Еще раз спасибо!
Автор: Tulon
Дата сообщения: 25.04.2010 13:06
McAaron
Стандартный вопрос: падение воспроизводится? На проекте из одного файла можете воспроизвести?
В логе valgrind'а ничего интересного нет, а в трассировке стека из багрепорта на sourceforge видно, что упало при отрисовке интерфейса темой Oxygen. Возможно причина как раз в ней. Попробуйте переключить тему.

Добавлено:
kvesda

Цитата:
Забыл написать, что урезание по ширине и высоте на некоторых сканах было не до номеров страниц, а до некоторых абзацев (по высоте), или урезка целых слов (по ширине)...

Обрезание целого абзаца - это интересно. Выкладывайте пример.
Автор: LazyKent
Дата сообщения: 25.04.2010 17:15
Tulon, у меня такой вопрос.

Стоит ли мне пересобирать пакеты для openSUSE с учётом изменений, которые вы регулярно вносите в git? Или же ждать следующего релиза?
Пока я внёс патч касаемый despecling. Но смотрю, у вас в логах фигурирует слово Fix. Вот я и в раздумьях.
Автор: Tulon
Дата сообщения: 25.04.2010 17:54
LazyKent
Я как раз сегодня вечером планирую выпустить 0.9.8.1
Автор: monday2000
Дата сообщения: 25.04.2010 17:54
alihv

Цитата:
Зачем?

Если minidjvu будет под GPL 3+ - то смогу ли я, к примеру, скомпилировать его совместно с графической библиотекой FreeImage, идущей под GPL 2+?

Как Вы сами оцениваете - способен ли miniDjVu полноценно заменить коммерческие DjVu-кодировщики (хотя бы в части чёрно-белого кодирования)? Я считаю - нет, пока не способен. Причин как минимум 2:

- Плохой контур букв в DjVu, созданных посредством miniDjVu (рваный, зазубренный).

- Больший размер получаемого DjVu - по сравнению с коммерческими кодировщиками (в среднем на 13% при всех одинаковых условиях).

Скорость создания DjVu и потребность в оперативной памяти даже не рассматриваю пока.


Цитата:
На патенты, относящиеся к многостраничному сжатию, лицензия от LizardTech не распространяется

А что это значит? Что значит "многостраничное сжатие"? Его miniDjVu и использует - раз уж иное запрещено патентами?

Объясните, пожалуйста, ещё попроще - я всё равно ничего не понял в Ваших объяснениях. Какие такие "кластеры"? Что значит "выбрать из каждого кластера по представителю"?
Автор: anagnost96
Дата сообщения: 25.04.2010 20:06
monday2000

Цитата:
- Плохой контур букв в DjVu, созданных посредством miniDjVu (рваный, зазубренный).


Какая зазубренность, о чем Вы? Если включено усреднение образцов, то никакой зазубренности не может быть в принципе: все шероховатости отдельных знаков неизбежно сглаживаются.


Цитата:
- Больший размер получаемого DjVu - по сравнению с коммерческими кодировщиками (в среднем на 13% при всех одинаковых условиях).


Ну, положим, 13% -- это величина, которой можно пренебречь. Однако в моих тестах при максимальном уровне агрессивности minidjvu дает несколько большее сжатие, чем documenttodjvu. И мне припоминается, что в нашей с Вами переписке Вы это подтверждали.
Автор: Tulon
Дата сообщения: 25.04.2010 23:37
Вспомнил, что еще нужно обновить переводы. Так что с релизом придется несколько дней подождать.
Автор: Tulon
Дата сообщения: 27.04.2010 00:25
Выпустил релиз 0.9.8.1. Брать на оффсайте.
Автор: alihv
Дата сообщения: 27.04.2010 01:14

Цитата:
Если minidjvu будет под GPL 3+ - то смогу ли я, к примеру, скомпилировать его совместно с графической библиотекой FreeImage, идущей под GPL 2+?

Да. "+" означает "или любая последующая версия". Результат скрещивания Вы можете распространять под GPL 3 или GPL 3+, на Ваше усмотрение


Цитата:
Как Вы сами оцениваете - способен ли miniDjVu полноценно заменить коммерческие DjVu-кодировщики (хотя бы в части чёрно-белого кодирования)? Я считаю - нет, пока не способен.

Ну ОК. А вопрос был при чем-то или просто так?


Цитата:
А что это значит? Что значит "многостраничное сжатие"? Его miniDjVu и использует - раз уж иное запрещено патентами?

Это значит сжатие с учетом общей информации между страницами: они напечатаны одним шрифтом. Запатентовано не это, а некий способ это делать.


Цитата:
Объясните, пожалуйста, ещё попроще - я всё равно ничего не понял в Ваших объяснениях. Какие такие "кластеры"? Что значит "выбрать из каждого кластера по представителю"?

Идея сжатия в том, что из двадцати отсканированных вариантов одной и той же буквы мы показываем пользователю только один и надеемся, что он не заметит. Вот этот один вариант и надо выбрать. Кластер - это набор похожих друг на друга картинок, которые мы объявляем неотличимыми для пользователя.
Автор: StanFreeWare
Дата сообщения: 27.04.2010 03:30
Может быть будет интересно, что в новой версии:

Цитата:
Мелкие улучшения и исправления на стадиях "Компенсация наклона" и "Макет страницы"

это (как минимум)
1) на стадии Компенсация наклона появилась возможность быстрого вращения по Ctrl+колесико (в статусной строке - подробности)
2) на стадии Макет страницы связь между смежными полями (кнопка с изображением сегмента цепи) теперь остается разорванной при переходе на страницы с разными значениями смежных полей.

Автор: drcode
Дата сообщения: 27.04.2010 09:16
Since which year are the russian/soviet books in the public domain ?
Автор: Tulon
Дата сообщения: 27.04.2010 09:38
drcode
According to my information, foreign works published in Soviet Union before 1974 are not protected by copyright within Russia.
Автор: ndch
Дата сообщения: 27.04.2010 11:37
Tulon
После полугодовалой паузы могу сказать - не очень очевидно новичку как обработать для всех страниц несколько стадий.
Quick start в дистрибутиве - совсем бы не помешал.

Может ЭТИМ кто-то заняться ?
Особых спобностей вовсе не требуется: сделать скриншоты и написать текст. Потом загнать это в какой-либо формат и попросить Тулона добавить в дистрибутив.
Автор: Tulon
Дата сообщения: 27.04.2010 11:59
ndch
Я бы предпочел обучающий скринкаст с голосовым комментарием. Его и сделать проще, и для пользователей тоже удобнее. Я пожалуй и сам бы его сделал. Может кто-нибудь поделиться исходным материалом с истекшим копирайтом для этой цели?

А вообще, Quick Start имеется на Wiki.
Автор: drcode
Дата сообщения: 28.04.2010 01:00
спасибо Tulon.
What are all the arguments that can be employed to defend our rights to scan a book ? I am talking of purely the fact of scanning, just as google and many others have scanned books without obtaining any prior permission. Why do some of the Russian friends here and on russian websites cite DMCA signed by Bill Clinton and not a law in France or Russia or other sovereign nations when DMCA is not ratified by any of these countries ? Someone please enlighten.
Автор: terminat0r
Дата сообщения: 28.04.2010 01:56
Tulon

Цитата:
Обрезание целого абзаца - это интересно. Выкладывайте пример.

если внизу страницы не предложения, а формулы, то обрезает ВСЕГДА
Автор: StanFreeWare
Дата сообщения: 28.04.2010 06:52
Tulon
Хочу поднять проблему, связанную с форматом именования обработанных в СТ файлов - если начать вывод, а потом добавить или удалить файлы (страницы) проекта, то из-за сдвига в нумерации в папке out остаются ранее выведенные страницы.
Как Вы думаете, как поступить лучше - при изменении структуры проекта чистить папку Out (ведь сдвиг при таком изменении влияет и на все последующие страницы), или изменить формат именования (например на <имя скана>l + <имя скана>r) и удалять только те файлы, которые относились к измененным страницам?
При этом отмечу, что используемый формат именования мне нравится, т.к. позволяет сохранять последовательность файлов проекта, собранного из сканов с произвольными названиями (например obl1, page1,...., pageN, obl2).
Автор: Elezar
Дата сообщения: 28.04.2010 09:00
Как начинающий юзер Scan Tailor-а, прошу помощи у сведущих людей.
Как мне убрать зону картинки?
Например: картинкой определен кроссворд.
P.S. "Буквари" читал, в них такой случай не рассматривается.
(может,чего упустил)

Точно. Зоны картинок - называется. Приношу свои извинения
Автор: Tulon
Дата сообщения: 28.04.2010 09:36
Elezar
Если на странице вообще нет картинок, можно переключить ее в Ч/Б режим. В противном случае обводим ложную картинку ручной зоной и через контекстное меню выставляем ей тип "вычесть из авто-слоя". Обводить можно с запасом, лишь бы другие картинки не задеть.

Добавлено:
StanFreeWare

Цитата:
или изменить формат именования (например на <имя скана>l + <имя скана>r) и удалять только те файлы, которые относились к измененным страницам?

Я давно собираюсь перейти на такую схему именования, а пока придется таки сносить папку вывода (или ее часть, если не лень разбираться, какую имеено).
Автор: alpopo
Дата сообщения: 28.04.2010 11:42
Tulon Замечание. Сделал полную обработку с выводом например ч/б на автомате. Начинаю просмотр сделанного в режиме Вывод. Иногда меняю ч/б на смешанный. Так как Вывод уже сделан, страницы открываются на просмотр быстро. И вот в какой-то момент (вроде бы произвольный) иконки (все) на правой панели отмечаются знаком вопроса, хотя они в OUT есть. Теперь на просмотр они выводятся долго - перезаписывается Вывод. Теперь чтобы закончить просмотр результата в Выводе, надо на автомате сделать новый Вывод, хотя бы с точки сброса. При количестве стр. около 1000, это накладно. В более ранних версиях я с таким не сталкивался. (Как часто? Страниц 50 просмотрю и может это случится. Как будто для всех страниц сбрасывается или меняется режим Вывода). Что приходится делать - Первый Вывод сохраняю в документ DJVU, его просматриваю и в СТ корректирую только то, что не понравилось и окончательное сохранение в DJVU.
Автор: Tulon
Дата сообщения: 28.04.2010 12:25
alpopo
Вы уверены, что по ходу просмотра не применяли никаких настроек ко всем страницам?
Автор: alpopo
Дата сообщения: 28.04.2010 12:30
да уверен, не меняю. Такое впечатление, что это происходит произвольно (причем на двух разных компьютерах). Меняю только Полезную область, Макет и иногда режим Вывода для отдельных страниц.
Автор: StanFreeWare
Дата сообщения: 28.04.2010 12:41
alpopo
Меняете макет (или полезную область), значит меняете размер страниц. А момент кажется произвольным, т.к. повторный вывод нужен только тогда, когда изменяется ширина самой широкой или высота самой высокой страницы с учетом полей.
Автор: alpopo
Дата сообщения: 28.04.2010 13:08
StanFreeWare
Я Вас понял. Это действительно возможно. Ненамеренный выход за максим. пределы макета при увеличении полезной области (я это делаю для вертикальной центровки страницы, а макет у меня минимальный - под обрез текста). Благодарю.
Добавляю. Полезная область это одно ( навряд ли я выйду за пределы установленного макета) . Второе - На макете меняю прижатие Вверх или Вниз для отдельно взятой страницы - это может привести к потере всего Вывода? Если да, то это наверное не правильно. Буду стараться идентифицировать проблему.
Автор: Tulon
Дата сообщения: 28.04.2010 13:34
alpopo

Цитата:
да уверен, не меняю. Такое впечатление, что это происходит произвольно (причем на двух разных компьютерах). Меняю только Полезную область, Макет и иногда режим Вывода для отдельных страниц.

Все понятно. Если вы изменили полезную область так, что данная страница стала самой широкой или самой высокой, или наоборот перестала быть таковой, это приводит к изменению размера всех страниц, и соответственно к необходимости их всех перегенерить.
Автор: Tulon
Дата сообщения: 28.04.2010 13:41

Цитата:
при увеличении полезной области (я это делаю для вертикальной центровки страницы, а макет у меня минимальный - под обрез текста)

А почему бы не наращивать поля вместо наращивания рамки контента? Там вам хотя бы будет визуально видно, вылезли вы за обобщенные размеры или нет.


Цитата:
Второе - На макете меняю прижатие Вверх или Вниз для отдельно взятой страницы - это может привести к потере всего Вывода?

Это не может. Параметры Выравнивание всего-лишь опредеют, с каких сторон делать автоматическое наращивание полей чтобы довести размер страницы до обобщенного размера.
Автор: StanFreeWare
Дата сообщения: 28.04.2010 13:58
Tulon

Цитата:
А почему бы не наращивать поля вместо наращивания рамки контента?

Кстати, фич-реквест: неплохо было бы ввести какой-нибудь режим для наращивания только одного поля с автоматическим размыканием его связи со смежным. Например, с тем же нажатым Ctrl.
Существующая последовательность действий - попасть в миниатюрную кнопку с цепью, а уже потом тянуть за границу поля - очень замедляет работу.
И, кстати, так и не смог привыкнуть расширять поля, втягивая внутреннюю рамку. По-моему понятнее была бы возможность растягивать внешнюю рамку с одновременным масштабированием картинки. Ведь вправо и влево растянуть внешнюю рамку можно гораздо дальше, чем за границы страницы...
Автор: alpopo
Дата сообщения: 28.04.2010 13:58
StanFreeWareПохоже я понял когда это случается. Макет у меня минимальный. Но встречаются страницы где - текста мало (это полезная область), а внизу номер страницы, который хочу оставить не вошел в эту полезную область, а прижатие у меня к низу, к номеру страницы. Тут я переопределяю всю полезную область (чтобы номер страницы был виден) и могу выйти за максимальные рамки своего минимального макета. Еще раз благодарю за оперативную помощь и поддержку!!!
PS Это нарушение методологии.Раньше я контролировал работу в полезной области, а затем делал Макет и Вывод.А последнее время, после небольших книжек, стал контролировать сделанное по Выводу - хочется увидеть быстрее результат. Для многостраничных книг, когда надо иногда возвращаться для корректировки к Полезной зоне это и стало случаться
PSS-Tulon Теперь методология такова - Если при сделанном Выводе меняю полезную зону на странице, то дополнительно проверяю не стала ли она самой широкой или высокой
Автор: are
Дата сообщения: 29.04.2010 14:19
да, сначала лучше все макеты и полезные области правильно выставить, а потом - окончательный вывод.

вот обновленный "scan and share 1.07st", там добавлены основные сведения и примерный ход работы для scantailor. (на английском)
http://ifile.it/y8b41dw/Scan_and_Share_1.07st.pdf
Автор: StanFreeWare
Дата сообщения: 29.04.2010 14:46
alpopo
Главное в методологии - это случайно не уменьшить полезную область для самой высокой/широкой страницы. В таком случае только повторный вывод - попасть обратно в область практически невозможно.

Страницы: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061

Предыдущая тема: CmCkA v4


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.