Ru-Board.club
← Вернуться в раздел «Программы»

» DjVuReader

Автор: vpp
Дата сообщения: 01.10.2004 07:46
Dickobraz

Цитата:
Закачиваю DjVuReader
версия 2.0.0.20 от 17 сентября 2004 г.


Спасибо огромное! Это уже вполне! Приятно работать.
Понимаю всю сложность задачи и Вашу занятость, но позвольте пофантазировать и нечто посоветовать. Поятно, что вопросы оптимизации движка и пр. важны, но важны и функции, которые может выполнять программа.
Как человек решает задачу? Открыто несколько книг, в нужных местах закладки, на полях заметки. Часто не помнишь где в книге нужное, лихорадочно листаешь и мельком находишь. Делаешь выписки для цитирования и перерисовываешь график. То есть:
1)Многооконность (многодокументный интерфейс) внутри программы, т.е фактически рабочий стол.
2)Нужны закладки/заметки и хранить их для каждой книги.
3)Автолистание.
4)Возможность скопировать текст и рисунок, например, в текстовый редактор.

Присоединяюсь к просьбе о Full screen и листании прокруткой.

Вот это будет ИНСТРУМЕНТ!
Автор: 4fatal
Дата сообщения: 01.10.2004 08:20
Dickobraz
А можно ли добавить функцию перегона книги в отдельные файлы (пример автоматом разбивает и конвертирует страницы в bmp), просто я не люблю электронные книги, а печатать порой страшно из-за качества сканирования
Автор: TCPIP
Дата сообщения: 01.10.2004 15:32
vpp

Цитата:
)Возможность скопировать текст и рисунок, например, в текстовый редактор.

Это тяжело будет... В том смысле, что я например еще не видел ни одного идеально распознанного djvu. Может, мало читал...
Автор: MorSe
Дата сообщения: 01.10.2004 22:08
vpp
TCPIP

Цитата:
Это тяжело будет... В том смысле, что я например еще не видел ни одного идеально распознанного djvu. Может, мало читал...

Вот я о том же говорил в своем последнем посте здесь. Распознавание текста - весьма непростая задача. Ясно, что в нашем случае не нужна такая мощная OCR-программа, как Finereader. Здесь на ум приходит программка типа Kleptomania...


Цитата:
Возможность скопировать текст и рисунок

А вот скопировать рисунок - задача на порядок легче.
Автор: musand
Дата сообщения: 02.10.2004 06:23
TCPIP


Цитата:
еще не видел ни одного идеально распознанного djvu. Может, мало читал...


не к чему этот ОКР-для научных текстов-одна ошибка-запяая н этам, циферка-и беда. фича копирования в графическии редактор-постранично, как это в дежавю про есть-было бы super

Добавлено
MorSe

Цитата:
программка типа Kleptomania

абломчик с этои клептоманиеи и дежавю- по кр. , мее у меня выходили одни каракули.. то что изначально техт, в виде, например названии аилов в папке-то клептомания дерет очень качественно, а вот дежавю-белеберда выходить
Автор: MorSe
Дата сообщения: 02.10.2004 10:21
musand

Цитата:
абломчик с этои клептоманиеи и дежавю- по кр. , мее у меня выходили одни каракули.. то что изначально техт, в виде, например названии аилов в папке-то клептомания дерет очень качественно, а вот дежавю-белеберда выходить

А я не говорил, что клептомания работает в дежавю. Просто предлагал сделать в дежавю-просмотрщике нечто подобное...
Автор: manfred
Дата сообщения: 02.10.2004 16:18
Клептомания работает только, если текст напечатан с использованием шрифтов, установленных в OS (т.е. если ты снесешь у себя например шрифт "Tahoma", Клептомания у тебя не будет распознавать тексты напечатанные этим шрифтом).

Можно прикрутить OCR например через "ABBYY FineReader® Engine 7.0",
но за нее просят $$$$$$$.

Посему будьте реалистами - OCR не будет (мое IMHO).

Но экспорт в TIFF/BMP был бы полезен.
И небольшой мануал.
Автор: Astra55
Дата сообщения: 02.10.2004 16:25
У меня тут спамеры ящик обвалили, поэтому неделю не читал посты. Клептомания может работать только с шрифтами, про djvu речи нет и быть не может. Прикручивать OCR движок - нужно иметь SDK, а кто его за так даст? ФР работает, может и не стоит заморачиваться.
Разбивка на отдельные страницы - лучший инструмент на сегодняшний день IrfanView 3.92, в нем наконец-то появился выбор формата при конвертации многостраничных файлов. Поэтому djvu можно в несколько кликов конвертнуть во что угодно.
Автор: MorSe
Дата сообщения: 02.10.2004 17:13
Astra55

Цитата:
Прикручивать OCR движок - нужно иметь SDK, а кто его за так даст?

Зачем что-то прикручивать? Самим надо сделать движок. И никому не платить.
Автор: TCPIP
Дата сообщения: 02.10.2004 20:20
manfred

Цитата:
Можно прикрутить OCR например через "ABBYY FineReader® Engine 7.0",
но за нее просят $$$$$$$.

Это, в известном смысле, проблема?
MorSe

Цитата:
Зачем что-то прикручивать? Самим надо сделать движок. И никому не платить.

Для этого нужет неполхой математик. Если он уже есть, то нужно приличное количество времени.
Автор: vpp
Дата сообщения: 04.10.2004 06:57
ALL

1)Многооконность (многодокументный интерфейс) внутри программы, т.е фактически рабочий стол.
2)Нужны закладки/заметки и хранить их для каждой книги.
3)Автолистание.
4)Возможность скопировать текст и рисунок, например, в текстовый редактор. [/q]

Согласен со всеми относительно 4, постепенно потом, да и идеальность ни к чему, все равно потом выверяешь.
Но вот 1,3 несложно и можно хоть сейчас.
Сложновато, но реализуемо 2. Единственная проблема где хранить соответствие между заметкой и книгой: связать с именем файла, встроить в файл сигнатуру, хранить заметки/ссылки в БД/в файле?
Автор: TCPIP
Дата сообщения: 06.10.2004 01:36
vpp

Цитата:
где хранить соответствие между заметкой и книгой

В базе данных

Цитата:
связать с именем файла, встроить в файл сигнатуру

Реализовать в программе подсчет контрольной суммы скажем по SHA1 (или MD5).

Цитата:
3)Автолистание.

Имеется в виду плавная прокрутка от страницы к странице? Было бы здорово!
Автор: vpp
Дата сообщения: 06.10.2004 12:36
TCPIP

Цитата:
Имеется в виду плавная прокрутка от страницы к странице? Было бы здорово!


Да плавная прокрутка необходима, но я имею в виду: нажал кнопку "Пролистать" (со скоростью кот. можно задать) и лист заменяет лист (или разворот) целиком без дальнейшего участия. Подобно слайд-шоу чтобы быстро найти нужное место в книге, которое вроде бы помнишь, но не помнишь где.

Жаль что автор программы не комментирует наши "фантазии"
Автор: Dickobraz
Дата сообщения: 06.10.2004 15:01
MorSe

Цитата:
Круто было бы, если б в программе были встроены средства распознавания

Есть у меня где-то несколько SDK OCR, но не вижу целесообразности, т.к. до FR им далеко. К тому же можн скопировать картинку в буфер и вставить ее в FineReader

max67

Цитата:
Проверить работу copy/paste текста из djvu с русским OCR.

Если текст в Win1251, все нормально. А если текст засунут с помощью утилиты от Генчо, то (как я проверял) он кодирует русский в уникод, а djvused как есть так и вставляет, поэтому при копировании кракозябры.

TCPIP

Цитата:
Ей-Богу, щелкать кажинный раз на кнопке перехода к следующей странице очень неудобно,

Затачивал под удобство работы с клавиатурой, поэтому клавиши PageUp и PageDown так и работают: при достижении конца или начала страницы - переход. А еще есть пробел и backspace, читайте, хоть иногда, мануал


vpp

Цитата:
2)Нужны закладки/заметки и хранить их для каждой книги.

думаю или txt или XML, но так, чтобы можно было без проблем сделать слияние при переходе на другую машину. Или так: на каждую книгу - свой файл, совпадающий по названию, и лежащий в папке /bookmark

Цитата:
4)Возможность скопировать текст и рисунок, например, в текстовый редактор.

предлагаю 4 варианта копирования:
1 - просто картинку
2 - текст, если есть
3 - набор картинок, которые ограниченны рамками с текстом, т.е. текст из картинок слов. Это для того, если есть распознанный текст, но кривой или битый, хоть что-то можно было скопировать. И или можно так копировать блоки текста, в который текста нет. Т.е. если нет желания возиться с утилитой от Gencho, распознать через DjVuEditor.
4 - как rtf или html. Т.е. в текстовых блоках, где текст - копируем текст, где блок пустой - картинка.

Цитата:
Реализовать в программе подсчет контрольной суммы скажем по SHA1 (или MD5).

А это не слишком долго будет? В смысле подсчет?

Цитата:
Жаль что автор программы не комментирует наши "фантазии"

Зато все читает
Проблема вот в чем:
1 - нет времени
2 - надоела старая работа, ищу новую .
3 - вся система построена на симбиозе VC&BCB, и сейчас возникли концептуальные траблы из-за несовместимостей компиляторов. Поэтому меня достало решать эти проблемы через одно место, т.к. хочется доделать прогу, а не думать как обойти ту или иную несовместимость. Поэтому доделываю эту версию до какого-то нормального вида и перехожу на wxWidgets&VC.
ALL
Пусть кто нибудь сделает хорошее дело - пройдет по всем постам и сделает To-Do list или, идеальный вариант, напишет ТЗ. Положу на сайт, буду хоть сам ориентироваться


Автор: MorSe
Дата сообщения: 06.10.2004 22:28
Dickobraz

Цитата:
Есть у меня где-то несколько SDK OCR, но не вижу целесообразности, т.к. до FR им далеко. К тому же можн скопировать картинку в буфер и вставить ее в FineReader

Да я согласен. Сделай пока только возможность копирования картинок.

Цитата:
Пусть кто нибудь сделает хорошее дело - пройдет по всем постам и сделает To-Do list или, идеальный вариант, напишет ТЗ.

Предлагаю примером для подражания сделать Adobe Reader. Старайся делать всё, как у него. В принципе, удобно, а главное, все уже привыкли с ним работать и будут по аналогии работать с твоей программой...
Автор: vpp
Дата сообщения: 07.10.2004 11:58
Dickobraz

Цитата:
до FR им далеко. К тому же можн скопировать картинку в буфер и вставить ее в FineReader


Так это уже есть? А как? Это было бы здорово.


Цитата:
думаю или txt или XML, но так, чтобы можно было без проблем сделать слияние при переходе на другую машину.


Наверное лучше (надежнее, понятнее, быстрее) txt?


Цитата:
на каждую книгу - свой файл, совпадающий по названию


Да, наверное. Долго искать/открываться будет, но потом нормально.
А вот MD5 для имени файла наверное хорошо! Хотя человече ни в жисть не догадается на какую книгу ссылка. Это если использовать как ID в БД.


Цитата:
и лежащий в папке /bookmark


А вот на счет БД нужно подумать. Все таки потом со структурированной инф. работать цивильнее (индексы, запросы и т.д.), сделать к ней интерфейс-картотеку (эк меня понесло!). Но это полностью зависит от Вашего желания возиться с сией байдой. Тем более, что файлы txt можно залить скриптом в My/PostgreSQL. Жаль связи с reader-ом не получиться.


Цитата:
3 - набор картинок, которые ограниченны рамками с текстом, т.е. текст из картинок слов.


Если я правильно понял: обводим курсором нужную область, копируем, получаем картинку bmp/jpeg, которую можно вставить хоть куда (в FR например). Я думаю этого было бы достаточно.


Цитата:
пройдет по всем постам и сделает To-Do list


Попробую. "Фантазии" по полной?
Под Linux кстати не планируете версию? Не плохо бы!
Автор: Dickobraz
Дата сообщения: 07.10.2004 12:14
vpp

Цитата:
скопировать картинку в буфер

Ну дык там же панелька есть. Нажимает на кнопку "Выделение", выбираем режим копирования : или графику или текст, если есть, обводим что надо(в режиме "картинка" работает shift для мультивыделения) и жмем ентер или кнопку копирования.

Цитата:
3 - набор картинок, которые ограниченны рамками с текстом, т.е. текст из картинок слов

текстовой слой в djvu храниться с двумя свойствами:
1 - текст
2 - прямоугольник, где этот текст расположен.
Так вот, выделяем область, и жмем кнопку что копировать: если есть текст, можно текст, если текст не хочется, то можно скопировать картинки из областей, где этот текст расположен.
Автор: vpp
Дата сообщения: 07.10.2004 14:05
Dickobraz

Цитата:
Нажимает на кнопку "Выделение"


Да, понял с графикой. Все таки нужны всплывающие подсказки! Тугодумы (это я про себя) объективная реальность

Куда залить ToDo?


Цитата:
текстовой слой в djvu храниться с двумя свойствами:
1 - текст
2 - прямоугольник, где этот текст расположен.
Так вот, выделяем область, и жмем кнопку что копировать: если есть текст, можно текст, если текст не хочется, то можно скопировать картинки из областей, где этот текст расположен.


Отлично! Видимо картинку Вы уже сделали, осталось текст?

Добавлено
Dickobraz

Меня не будет на форуме до Пнд, поэтому публикую препре-версию ToDo здесь:

- Убрать панель с единственной кнопкой Toolbars.
- Возможность выбора страницы прямым набором номера страницы в поле.
- Возможности быстрого перехода в Full Screen и обратно.
- Возможность выбора масштаба прямым набором значения в поле.
- Многооконность (многодокументный интерфейс) внутри программы.
- Реализовать хранение в БД для каждой книги:
- подчеркивание текста;
- заметок (выполняют также роль закладок).
- Картотека для работы с заметками:
- Карточка заметки имеет тему, текст, ссылку на книгу и страницу;
- Полнотекстовый поиск;
- Открыть djvu из заметки на связанной странице;
- Хранить в заметке текст и рисунок из книги;
- Прицепить к заметке файл, например rtf;
- Выгрузка группы заметок в rtf.
- Картотека книг:
- Авторы;
- Издательство и год;
- Название;
- УДК;
- Дополнительные данные: язык, кол-во страниц, даты чтения;
- Ссылки на заметки;
- Ссылка на файл книги и возможность ее открыть;
- Подключение утилит gencho и хранение текста книги.
- В Readme описать функции:
- настройка яркости и контрастности изображения;
- кнопок в меню;
- копирование текста и изображения.
- Всплывающие подсказки.
- По File-Save As сохранять диапазон страниц в файле.
- Прокрутка не только текста на листе, но и самих листов колесиком мыши.
- Печать диапазона страниц.
- Добавить плавное масштабирование по сочетанию клавиш, например, "+ и Ctl".
- версия для Linux.

Bugs:

- При переходе в недокачанном файле на следующую, несуществующую страницу происходит

сбой. После этого невозможно вернутся на предыдущие. Не закрывая Reader открываешь

заведомо исправный файл - просмотр невозможен.
- прокрутка текста при нажатии мышью на стрелки на линейке прокрутки крайне медленная.
Автор: TCPIP
Дата сообщения: 07.10.2004 16:40
Dickobraz

Цитата:
еще есть пробел и backspace, читайте, хоть иногда, мануал

Читал. Но и это не то. Хотелось бы, чтобы достаточно было колеса мыши, как в Adobe Reader. Только пожелания...

Автор: Dickobraz
Дата сообщения: 08.10.2004 11:31
vpp

Цитата:
Видимо картинку Вы уже сделали, осталось текст?

Текст тоже копирует, надо только кнопку TXT перед выделением нажать. Неудобно, но поправлю.
Автор: musand
Дата сообщения: 08.10.2004 19:46
U MENJA PANEL'KA adjust-content etc. kak zakrilas'. tak i ne otkrivaetskja bolee-sprava ne vitaskivaetsja ni figa-help, sho robit' v takih sluchajah?
Автор: TCPIP
Дата сообщения: 09.10.2004 00:26
musand
Видимо, вы нечаянно сняли флажок Service в кнопке Toolbars.

Dickobraz
Вам знакома программа WinDjView [http://sourceforge.net/projects/windjview]? Если скрестить ее возможности с возможностями вашей программы, было бы близко к идеалу. Например в ней есть возможность задания масштаба вручную. Пустяк, а приятно. Это несколько удобнее имеющихся в вашей программе кнопок увеличения. Если бы вы добавили такую возможность (оставив при этом эти кнопки увеличения/уменьшения) было бы неплохо. Но это пустяки, главное, на мой взгляд, преимущество WinDjView заключается в наличии у нее пресловутого Continuous Layout, что гораздо удобнее, чем использование клавиш PgUp/PgDown или соответствующих кнопок перехода на следующую страницу на панели инструментов. Было бы замечательно, если бы вы реализовали эту возможность в вашей программе!
Автор: musand
Дата сообщения: 09.10.2004 09:09
net-flazhok stoit.
vprochem, est' on ili net , nichego ne sluchaetsja beda, a takaja poleznaja tuzla
Автор: TCPIP
Дата сообщения: 11.10.2004 01:50
musand

Цитата:
net-flazhok stoit.

Значит вы ее слишком задвинули влево и она совсем скрылась, хотя и открыта. Дважды щелкните на ее гарнице, подведя указатель мыши к левой границе экрана. Панель должна вылезти (но в свернутом состоянии, так что будут видны только вкладки. Вам останется только вытянуть ее за границу до нужного размера).
Автор: musand
Дата сообщения: 11.10.2004 05:04
Не помагает, видимо, баг у меня или в проге
Кликаю справа-стрелка меняестя на -!!-, но растянуть не выходить

вот такая причуда
Автор: vpp
Дата сообщения: 11.10.2004 09:08
Dickobraz

Цитата:
Текст тоже копирует, надо только кнопку TXT перед выделением нажать.


В версии 2.0.0.20 от 17 сентября 2004 г. кнопка недоступна
Автор: Dickobraz
Дата сообщения: 11.10.2004 14:04
vpp

Цитата:
Куда залить ToDo?

opendjvu[s@baka]nm.ru
musand
панелька не выходит - это баг в проге. Единственное, что поможет
HKEY_CURRENT_USER\Software\DjVuReader\Control\PageControl1
снести нафиг
vpp

Цитата:
Текст тоже копирует, надо только кнопку TXT перед выделением нажать.
В версии 2.0.0.20 от 17 сентября 2004 г. кнопка недоступна

Ну текста в файле нет или , если он все-таки есть, стоит двухсторонний режим просмотра (не успел сделать пересчет координат).
Автор: musand
Дата сообщения: 11.10.2004 19:40
Dickobraz
спасибо все помогло
ек - макарек.

Автор: musand
Дата сообщения: 13.10.2004 07:28
только что заметил, что в проге не поддерживаются гиперссылки, сделанные в ДежаВю Про
Автор: dmitry686868
Дата сообщения: 19.10.2004 11:00
Все отлично!
Программа класс!
А как на печать страницу вывести????
Я кнопку не нашел!

Страницы: 123456789

Предыдущая тема: Сортировка папок по размеру


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.