Ru-Board.club
← Вернуться в раздел «Программы»

» Scan Tailor

Автор: Tulon
Дата сообщения: 17.12.2008 01:06
denver 22

Цитата:
У меня уже есть новые примеры на очередной книге. На этот раз - очень плохое определение зоны текста.

Ну давайте.
Автор: monday2000
Дата сообщения: 17.12.2008 09:00
Tulon

Цитата:
Я все-таки считаю, что без проблем можно разобраться без мануала. А раз можно разобраться, значит можно после этого и мануал написать. Конечно тонкостей вы не поймете, но для объяснения тонкостей есть я. Самому писать мануал от начала до конца мне в лом - я еще в школе терпеть не мог писать сочинения.

О - можно подумать, что это написал bolega. Логика практически та же.
Ну-ну - подождём, пока найдётся кто-то, кто напишет мануал к Вашей программе. По своему опыту могу сказать - трудно найти более унизительное и оскорбительное для себя занятие, чем писать хелп к чужой программе - при этом совершенно не зная, как она работает. И если в случае СК было просто некуда деваться (стиснув зубы, изнасиловав себя по полной, и посылая ему проклятья) - то в данном случае это уже не так.

Я лично из-за отсутствия хелпа воспринимаю Вашу программу исключительно как сборник полезных алгоритмов - а вовсе не как готовую программу.
Автор: denver 22
Дата сообщения: 17.12.2008 09:01
Lonely_Soul
Я новичок в Линукс. Что значит бинарник в этом случае? Его можно будет установить на любой дистр?
Tulon
Мда. У меня что не книга, так история... Оказалось, что 30% сканов были размерами в 2 раза меньше. Может и из-за этого плохо текст определялся. Короче сейчас все довольно неплохо.
Но просто скину несколько случаев:
1. Неправильное определение на Split Pages. Режет прямо по тексту, да ещё и под углом. Каким макаром он это делает?...
Сканы с таблицами на всю страницу, повернутые под 90 град. я не даю. Похоже программам их очень тяжело правильно определять. SK тоже на них спотыкается в 100%-х случаев. Это объяснимо и терпимо.
2. Неправильное определение на Select Content (мусор включен в рабочую зону).
Качать - http://narod.ru/disk/4439633000/Moskvitin.zip.html
Автор: monday2000
Дата сообщения: 17.12.2008 21:52
Я сделал новую заметку:

33. Бинаризация Bernsen Thresholding

http://www.djvu-soft.narod.ru/bookscanlib/033.htm
Автор: Tulon
Дата сообщения: 18.12.2008 01:07
monday2000

Цитата:
По своему опыту могу сказать - трудно найти более унизительное и оскорбительное для себя занятие, чем писать хелп к чужой программе - при этом совершенно не зная, как она работает.

К своей проге хэлп писать тоже мало приятного. Если программист пишет софт за бесплатно, значит скорее всего он получает от этого удовольствие. Только не все в этом процессе приносит удовольствие. Некоторые вещи весьма противны. И поэтому программист старается поменьше делать того, что ему противно. А иначе никак - если в общем и целом он не получает от своей работы удовольствие (или деньги), то такую работу он просто забросит.

А "при этом совершенно не зная, как она работает" - это просто оправдание, чтобы не делать того, чего вам делать не хочется. То есть реально это совершенно не проблема - если умеете пользоваться (а научиться не сложно) - значит можно это описать.

Добавлено:
denver 22

Цитата:
Что значит бинарник в этом случае? Его можно будет установить на любой дистр?

К сожалению не значит. В Линуксе очень тяжело собирать бинарники, которые работали бы на любых дистрибутивах. Тяжело но возможно - может и дойдут когда нибудь до этого руки.


Цитата:
1. Неправильное определение на Split Pages. Режет прямо по тексту, да ещё и под углом. Каким макаром он это делает?...

Не по тексту, а по линиям на картинках. В режиме "одна страница на скан", СТ пытается определить, а есть ли на скане вообще линия сгиба? Определяет он это, выделяя горизонтальные тени на границе книги. Если они есть, и доходят до края, значит и линия сгиба есть. Но отличить горизонтальные тени от просто горизонтальных линий на рисунках он не может. А у вас они как назло доходят почти до краев. Вообще проблему можно решить, добавив к режимам "разрезка разворота" и "отрезание огрызка соседней страницы", третий режим - "линии сгиба нет - резать ничего не надо".


Цитата:
2. Неправильное определение на Select Content (мусор включен в рабочую зону).

Бинарный мусор практически невозможно очистить, особенно когда он жирный и наезжает на буквы. Если только bolega какую идею подкинет (а на это надеятся не приходится), а так перспектив нет. Так что могу сразу сказать - Select Content с сильным бинарным мусором не справляется и справляться не будет.
Автор: monday2000
Дата сообщения: 18.12.2008 08:26
Tulon

Цитата:
А "при этом совершенно не зная, как она работает" - это просто оправдание, чтобы не делать того, чего вам делать не хочется.

Ну уж если Вам этого не хочется - то представьте, насколько ДРУГИМ этого не хочется - делать за Вас Вашу работу.

Цитата:
То есть реально это совершенно не проблема - если умеете пользоваться (а научиться не сложно) - значит можно это описать.

Ну вот и чудно - вот Вы и сделайте. Вы умеете пользоваться, Вы её создали - Вы и опишите, раз это "не проблема".

Цитата:
А иначе никак - если в общем и целом он не получает от своей работы удовольствие (или деньги), то такую работу он просто забросит.

Значит, надо научиться извлекать удовольствие из того, что не кажется интересным. Интересно - решить проблему, а не "заторчать от процесса написания кода".
Скажите - а зачем Вам публиковать программу, которой будете пользоваться только Вы один? Ну и не заводите тогда топик, не обсуждайте её работу с другими людьми. Пишите "в стол", и с другими не делитесь.

Подумайте - зачем всем начать разбираться с какой-там ещё одной незнакомой программой по сканобработке, неизвестно как работающей, с неизвестной идеологией работы, я бы добавил - асболютно не интуитивно-ясной? Худо-бедно - а уже есть СК, и даже кое-какая документация к нему есть.

Добавлено:

Цитата:
Если только bolega какую идею подкинет

Ага, подкинет. Догонит и ещё раз подкинет.

Добавлено:

Цитата:
а так перспектив нет.

Ну, не всё так мрачно. У нас есть в запасе CuneiForm OCR - с ним мы можем делать многое - вплоть до частичного распознавания и замены особо грязных букв распознанными (как самый тяжёлый, но и самый редкий случай). А чистить бинарный мусор рядом с буквами - тут даже и полноценный OCR не нужен - сойдёт самый примитивный OCR, коий имеется в избытке.
Автор: VovIK
Дата сообщения: 18.12.2008 09:21
Tulon
не парся
это просто monday2000 вот таким особенным образом выражает свою благодарность

monday2000
Вам надо понять одну важную вещь:
не надо указывать никому, что он и когда должен сделать.
Вы ведь не на работе и тут не ваши подчиненные

тут Вы можете только попросить что-то сделать, тем более что сами Вы почему-то не беретесь за написание полноценной программы.
раздавать советы легче, наверное
Автор: denver 22
Дата сообщения: 18.12.2008 13:43
Соглашусь с VovIK. Виктор, ну выражай ты свои пожелания по-мягче. Не надо требовательной интонации. Tulon делает серьезную программу на добровольных началах. И делает её уже качественно (в точки зрения функционала).
К тому же программа изначально open source, и автор давно уже приглашает людей подключаться к её развитию. Думаю, раз программа ещё недостаточно популярна, вот и не нашелся человек, готовый качественно сделать Хелп. А такие есть и найдутся. К SK уже несколько человек сделали Хелпы. Нашлись ведь и для такой неинтуитивной программы. А уж для ST тем более найдутся.
Может выражу тупую отмазку, но я искренне хотел бы сделать какой-то черновик такого Хелпа, но сейчас приоритеты на моё свободное время другие, да и боюсь качество его будет таким, что стыдно будет даже автору показать .
Автор: Tulon
Дата сообщения: 18.12.2008 18:22

Цитата:
Может выражу тупую отмазку, но я искренне хотел бы сделать какой-то черновик такого Хелпа, но сейчас приоритеты на моё свободное время другие, да и боюсь качество его будет таким, что стыдно будет даже автору показать .

Ну насчет качества можете не беспокоиться - я и подскажу, и поправлю, и дополню. Кстати логотип мне уже нарисовали - спасибо U235. Лежит тут: http://alexrey036.narod.ru/logoST.zip Смотрите, высказывайте свое мнение.
Автор: monday2000
Дата сообщения: 19.12.2008 10:13
На мой взгляд, главная миссия Scan Tailor - чисто психологическая. Это преодоление монополии СК. Я пока что не верю в то, что Scan Tailor когда-либо сможет заменить СК.

Причины:
1. Маленькое окошко при запуске.
2. Отсутствие "родного" хелпа.
3. Отсутствие скроллбаров.
4. Отсутствие сглаживания при отображении сканов.
5. Проблемы с поддержкой TIF.

Пока будет иметь место хотя бы одна проблема из данного списка - ни о какой замене СК не может быть и речи.
Автор: denver 22
Дата сообщения: 19.12.2008 10:35
Tulon, ты читал новость "Компания Qt Software начала бета-тестирование Qt Creator и Qt 4.5" - http://www.opennet.ru/opennews/art.shtml?num=19458 ?
Получается, скоро можно будет удобней компилить твою программу под Windows?
Или программа изначально должна быть реализована на Qt Creator?
Автор: Tulon
Дата сообщения: 19.12.2008 12:29
denver 22


Цитата:
Получается, скоро можно будет удобней компилить твою программу под Windows?

Нет, проще уже не будет. Qt Creator использует систему сборки qmake, а СТ - CMake, которая гораздо мощнее. Все что можно - уже автоматизировано. Проще чем СТ собираются только одноплатформенные приложения, да и то далеко не все. Разве что под удобством вы имели в виду сборку из визуальной среды разработки - так это и сейчас возможно. Другое дело что приличных сред разработки под Windows с поддержкой MinGW я не нашел, хотя не сильно и искал. Eclipse + CDT в принципе не плох, но в нем очень погано реализовано отображение ошибок gcc.

Добавлено:
monday2000

Цитата:
Пока будет иметь место хотя бы одна проблема из данного списка - ни о какой замене СК не может быть и речи.

А как насчет того, чтобы поучаствовать в разработке? Пункты 4 и 5 есть у меня в списке задач, Пункт 2 (хэлп) - хоть и нет, но вещь нужная.
А то странно получается - вы много лет просите bolega открыть исходники СК, а когда наконец появляется альтернатива с открытыми исходниками - никакого участия в проекте вы не принимаете. Реализации всяких там бинаризаций, вращений и масштабирований - вещи полезные в принципе, но бесполезные для СТ - потому что по этой части там все в порядке. Вот взялись бы, да реализовали вывод в TIFF например.
Автор: monday2000
Дата сообщения: 19.12.2008 22:11
Tulon

Цитата:
А как насчет того, чтобы поучаствовать в разработке?

Я не сторонник MinGW. Собственно, я на MinGW и компилировать не умею - и даже настроить дистрибутив MinGW (под винду) не смог ни разу, как ни пытался. Мне привычней и удобней в MS VC++. Хотя я согласен с мнением, что MFC - тупая гадость, но переучиваться на расхваленный Qt нет времени и сил.

Цитата:
Вот взялись бы, да реализовали вывод в TIFF например.

C моей точки зрения это бессмысленная трата времени и сил. Всесторонняя поддержка формата TIF уже и так великолепно реализована в библиотеке FreeImage. Кстати, я вообще сторонник FreeImage - мне пока не удалось встретить более лучшую графическую библиотеку.

Цитата:
Реализации всяких там бинаризаций, вращений и масштабирований - вещи полезные в принципе, но бесполезные для СТ - потому что по этой части там все в порядке.

В принципе, мне хотелось бы не то чтобы увидеть ту или иную новую альтернативу СК - нет, мне хотелось бы СОЗДАТЬ УСЛОВИЯ, при которых эти альтернативы стали бы появляться как грибы после дождя. Я пытаюсь создать те "кирпичики", из которых затем все желающие смогут делать свои альтернативы СК.
Автор: Tulon
Дата сообщения: 19.12.2008 23:15
monday2000


Цитата:
Я не сторонник MinGW. Собственно, я на MinGW и компилировать не умею - и даже настроить дистрибутив MinGW (под винду) не смог ни разу, как ни пытался. Мне привычней и удобней в MS VC++. Хотя я согласен с мнением, что MFC - тупая гадость, но переучиваться на расхваленный Qt нет времени и сил.

Сами исходники кросс-платформенны. Бесплатная версия Qt раньше поддерживала только MinGW, но с недавних пор поддерживает и MS VC++, хотя они это не особенно афишируют. В общем сделать поддержку MS VC++ вполне реально. Только не ждите что я сам это сделаю - у меня нет винды и нет возможности ее поставить. А что касается Qt - я его до СТ никогда не использовал. Зато использовал wxWidgets и Gtkmm, и не испытываю симпатий к им обоим. Поэтому взял книжку по Qt4 и быстро в нем освоился. Qt реально лучшая либа для кросс-платформенного GUI на C++. К тому же там и кроме GUI вкусностей хватает. Единственное, что мне в нем не нравится - это небезопасная по отношению к типам система сигналов / слотов. В Gtkmm сделано лучше.
А что касается FreeImage - вот вам первый и огромный его недостаток - он на С а не на C++. А это в свою очередь означает, что нужно тут и там вручную освобождать ресурсы. Создал или скопировал изображение - не забудь его потом освободить. В грамотном коде на С++ освобождений ресурсов практически нет. Например в СТ порядка 400 вызовов new и только 12 вызовов delete. И ни к каким утечкам памяти это не ведет. Кто не знал - читать про RAII вообще и про умные указатели в частности.
Автор: monday2000
Дата сообщения: 26.12.2008 13:46
Tulon

Цитата:
А что касается FreeImage - вот вам первый и огромный его недостаток - он на С а не на C++.

Я думаю - что это наоборот - достоинство. Потому что код на С гораздо более понятен, чем на С++. Когда я обсуждал на форуме sources.ru выбор графической библиотеки - все дружно настаивали на С-алгоритмах - в противовес С++-алгоритмам. Да я и по своему опыту сужу: понять чужой С-алгоритм гораздо проще, чем С++-алгоритм.

Мне ещё не нравится библиотека STL - исходя из той меры, в которой я с ней сталкиваюсь, у меня сложилось крайне неприятное о ней впечатление. По крайней мере, я уже точно могу сказать, что в алгоритмах сканобработки использование STL абсолютно нецелесообразно - и лишь неоправданно "затуманивает" код.
Автор: Tulon
Дата сообщения: 26.12.2008 15:00
monday2000


Цитата:
Я думаю - что это наоборот - достоинство. Потому что код на С гораздо более понятен, чем на С++. Когда я обсуждал на форуме sources.ru выбор графической библиотеки - все дружно настаивали на С-алгоритмах - в противовес С++-алгоритмам. Да я и по своему опыту сужу: понять чужой С-алгоритм гораздо проще, чем С++-алгоритм.

Для тех, кто с C++ знаком поверхностно - конечно C гораздо понятнее. Читать код на С часто действительно проще, чем на C++, но писать на нем - увольте. Одно только ручное управление ресурсами чего стоит.


Цитата:
Мне ещё не нравится библиотека STL - исходя из той меры, в которой я с ней сталкиваюсь, у меня сложилось крайне неприятное о ней впечатление. По крайней мере, я уже точно могу сказать, что в алгоритмах сканобработки использование STL абсолютно нецелесообразно - и лишь неоправданно "затуманивает" код.

Мне вообще сложно себе представить, где в алгоритмах обработки изображений можно использовать STL. Ведь STL - это контейнерные классы + небольшой набор алгоритмов общего назначения.
В общем я бы вам посоветовал получше изучить C++. Особо рекомендую книги Sutter'а - Exceptional C++, More Exceptional C++, Exceptional C++ Style, C++ Coding Standards. Все есть в русском переводе, все можно найти в электронном виде. Первые две в русском переводе сведены в одну - "Решение сложных задач на C++".
Пожалуй главная проблемма С++ в том, что его никто толком не знает.
Автор: juvaforza
Дата сообщения: 26.12.2008 15:23

Цитата:
приличных сред разработки под Windows с поддержкой MinGW

C::B не подошел?
Автор: Tulon
Дата сообщения: 26.12.2008 22:16

Цитата:
C::B не подошел?

Под виндой я его не пробовал. Хотел сейчас попробовать под Linux, так он падает при старте.
Автор: monday2000
Дата сообщения: 28.12.2008 15:37
Tulon

Цитата:
Пожалуй главная проблемма С++ в том, что его никто толком не знает.

Значит, он никому не нужен (т.е. в такой глубокой мере) - самый верный признак.

Цитата:
В общем я бы вам посоветовал получше изучить C++.

Нет нужды пока что. Зачем тратить время на то, что никогда не понадобится? В моём городе просто нет такой работы в принципе - где такие знания могли бы понадобиться.

Цитата:
Мне вообще сложно себе представить, где в алгоритмах обработки изображений можно использовать STL.

Используется в gamera. И с Java тоже трудней перебивать алгоритмы - т.к. и там всё на классах построено.

Добавлено:

Цитата:
но писать на нем - увольте.

В моём случае - написание консольных алгоритмов - задача ставится именно так, что код в первую очередь должен быть понятен посторонним - независимо от того, удобно мне так писать, или нет. Это когда пишешь GUI - то там да, без классов и т.п. никак не обойтись.

Добавлено:
Tulon

Цитата:
вы много лет просите bolega открыть исходники СК

Нет, Вы не поняли - я не прошу его раскрыть исходники - на ... они мне нужны, я и без них прекрасно обойдусь (так даже лучше - никто меня не упрекнёт, что я что-то там взял из СК). Я лишь хотел этим сказать - что программа сканобработки не имеет права быть с закрытыми исходниками - т.к. вопрос слишком серьёзен, чтобы позволить всем нам самим себе такую безумную роскошь, как закрытые исходники в сканобработке.

Ну, и заодно я хотел этим сказать - что закрысивание исходников - это не товарищеское поведение - в условиях, когда мы тут свободно друг с другом DjVu-книгами обмениваемся и т.п.

Уж по крайней мере я лично не опущусь до такой пошлости, как сокрытие исходников - во всяком случае во всём, что касается сканобработки, DjVu, и т.п.

Даже с чисто практической точки зрения - наша сила - только в максимальной взаимной открытости и свободе взаимообмена любого сорта информацией. И тот, кто не понимает этой простой истины - должен быть смётен веником в сторону.

Добавлено:
Tulon
Обратите внимание - появилось описание новой версии СК.
Я как-то сразу обратил внимание на необычность этого события. Слишком уж длинное описание - по сравнению с обычной практикой. Я думаю, что это неосознанная реакция на развитие СТ - да, это первые неуютные поёживания СканКромсатора от мысли, что он уже не один.

Добавлено:
Я сделал новую заметку:

34. Бинаризация DjVu Thresholding

http://www.djvu-soft.narod.ru/bookscanlib/034.htm
Автор: Tulon
Дата сообщения: 28.12.2008 18:37
А я тем временем реализовал высококачественный антиалиазинг и вывод в TIFF.
Автор: denver 22
Дата сообщения: 28.12.2008 21:28
Ух ты. Вывод в TIFF? Вот уж точно когда будешь готов делать сборку, свисти. Я готов помочь
Т.е. я слежу конечно за жругими изменениями , то вот как-то неуютно было от мысли, что надо после обрабоки лишний раз конвертацию формата делать.

Добавлено:
monday2000
По твоей последней ссылке это вроде не описание программы как таковое, а описание новых возможностей.
Но вот объем действительно удивил. И удивил приятно.
Автор: monday2000
Дата сообщения: 28.12.2008 21:53
Tulon

Цитата:
А я тем временем реализовал высококачественный антиалиазинг и вывод в TIFF.

Поздравляю. Это всё очень хорошо.

Я сделал новую заметку:

35. Бинаризация Tsai Moment Preserving Thresholding

http://www.djvu-soft.narod.ru/bookscanlib/035.htm
Автор: Tulon
Дата сообщения: 28.12.2008 23:34
Я тут занялся локализацией СТ. Прикручиваю русский перевод, ну и как следствие будет возможность переводить на любые другие языки. Завтра думаю закончить. Вот тогда и сборку можно будет сделать. Хотя в принципе ничто не мешает хоть сейчас собирать - антиалиазинг и вывод в TIFF уже в SVN.

Добавлено:
А еще добрые люди написали скрипт для создания инсталлятора СТ. Придется правда немного повозиться, чтобы интегрировать его в систему сборки, но после этого СТ для винды будет выпускаться не в виде zip файла, а с нормальным инсталлятором. Поскольку винды у меня нет, придется вслепую прикручивать этот скрипт. Вот тут то и понадобиться помощь тестировщиков.
Автор: ghosty
Дата сообщения: 28.12.2008 23:48

Цитата:
Я как-то сразу обратил внимание на необычность этого события. Слишком уж длинное описание - по сравнению с обычной практикой.

Абсолютно к любой новой версии следовало такое описание. Достаточно подробное.
Автор: Tulon
Дата сообщения: 29.12.2008 02:41
Ну вот, закончил с локализацией - можете собирать.
Обновляетесь из SVN, потом по инструкции начиная с шага 8. Сама инструкция не изменилась, только при упаковке в архив надо положить еще один файл - ru.qm, из той же директории, откуда берете scantailor.exe
Автор: denver 22
Дата сообщения: 29.12.2008 21:01
Хм. Установщик - это наверное хорошо. А лично мне нравится эта программа без установки. Исенно так у меня работают почти все программы для книгопроизводства. Так что может оставишь возможность качать и "портабельную" версию (как сейчас)?
Автор: Tulon
Дата сообщения: 29.12.2008 22:04
Может и портабельную версию оставлю. Вообще если прогу не таскать на флэшке - то зачем нужна эта самая портабельная версия?
Автор: denver 22
Дата сообщения: 29.12.2008 22:47
На шаге 8 пришлось полностью очистить папку c:\build\scantailor-build\. Иначе CMake выдавал ошибку (и постоянно ссылался на папку c:\build\scantailor-0.9.1\, которой уже нет (я обновлял SVN в новую папку c:\build\scantailor-0.9.2\ (версию пока не знаю какую ты поставил).
...блин, на п. 8 после Configure все строчки красные, хотя папки и файлы все на месте. Может все таки не с п.8 начинать? Или какте-то папки очистить?
Я даже на всякий случай переименовал папку опять в c:\build\scantailor-0.9.1\
На шаге 8 пришлось полностью очистить папку c:\build\scantailor-build\. Иначе CMake выдавал ошибку (и постоянно ссылался на папку c:\build\scantailor-0.9.1\, которой уже нет (я обновлял SVN в новую папку c:\build\scantailor-0.9.2\ (версию пока не знаю какую ты поставил). ...блин, на п. 8 после Configure все строчки красные, хотя папки и файлы все на месте. Может все таки не с п.8 начинать? Или какте-то папки очистить? Я даже на всякий случай переименовал папку опять в c:\build\scantailor-0.9.1\


Добавлено:
А я по другому сформулирую: если есть возможность не устанавливать программу, то зачем нужно делать установщик?
Разумеется, я приму любое твоё решение. Но ИМХО программа без установки - вещь более удобная. По крайней мере если вдруг потребуется её пользовать с флешки, то вот оно, есть.
Автор: Tulon
Дата сообщения: 29.12.2008 23:10
denver 22

Цитата:
На шаге 8 пришлось полностью очистить папку c:\build\scantailor-build\

Альтернатива - кнопка Delete Cache.


Цитата:
на п. 8 после Configure все строчки красные, хотя папки и файлы все на месте. Может все таки не с п.8 начинать?

Красные строчки - это не проблемные параметры, а всего-лишь новые. Жмете на Configure еще раз - они станут белыми.


Цитата:
А я по другому сформулирую: если есть возможность не устанавливать программу, то зачем нужно делать установщик?

Установщик создаст запись в меню, и к тому же программа не будет засорять десктоп (или куда вы там кладете проги без установщиков).
Автор: denver 22
Дата сообщения: 30.12.2008 00:40
Насколько я понимаю, даже после установки я смогу скопирывать эти файлы себе в локальную папку и юзать их портабельно?
Tulon, глянь в личку.

Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172

Предыдущая тема: Невозможно установить Acronis True Image Home v10.0.4940


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.