Ru-Board.club
← Вернуться в раздел «Программы»

» каталогизатор документов

Автор: ironwit
Дата сообщения: 14.11.2003 16:01
mihas83

Цитата:
Ну и через GUI при нажатии соотв. столбца (как, например, в почтовиках)?


само собой все это через GUI
Автор: Ronin
Дата сообщения: 14.11.2003 19:47
ironwit

Цитата:
pdf chm держат?

Внешним только. Вряд ли кто-то будет делать новый просмотрщик для ПДФов, если есть Акробат.
В проге можно выбрать несколько вариантов просмотра (в т.ч. - внешней программой), думаю, ты уже заметил, если скачал.
Автор: ironwit
Дата сообщения: 15.11.2003 09:22
Ronin

Цитата:
думаю, ты уже заметил, если скачал.


Заметил... Но тут именно задумывается специализированная программа для каталогизации ebook - с чтением информации о книге из инета (по ISBN названию авторам...) - попытке отобразить несколько первых страниц прямо в себе. Поиске по содержанию, типу, языку... В общем банальный каталог.


Добавлено
Кстати - вчера подумалось. Если наша база будет у большого кол-ва народа. То можно будет и поиск прикрутить через какой то промежуточный сервер. То есть, кто хочет раздавать выкладывает свой список книг на сервер, кто хочет найти, запускает программу и ищет... В случае нахождения книги искателю выдается канал для связи с владельцем, либо владельцу выдается запрос на книгу либо еще как то. Как идея? Пойдет ли? Стоит ли?
Автор: mihas83
Дата сообщения: 15.11.2003 10:05
ironwit

Цитата:
Если наша база будет у большого кол-ва народа. То можно будет и поиск прикрутить через какой то промежуточный сервер. То есть, кто хочет раздавать выкладывает свой список книг на сервер, кто хочет найти, запускает программу и ищет... Как идея? Пойдет ли? Стоит ли?

Т.е. типа книжнoгo осла E-mule... Идея неплохая, но есть проблемы авторизации, безопасности..., что сопутствует неразберихе:

Цитата:
В случае нахождения книги искателю выдается канал для связи с владельцем, либо владельцу выдается запрос на книгу либо еще как то.

Не до конца понятен механизм...
Автор: ironwit
Дата сообщения: 16.11.2003 10:31
mihas83

Цитата:
Не до конца понятен механизм...


сейчас с напарником как раз разрабатываем спецификацию, так что чем больше пожеланий в топик, тем лучше и удобнее будет программа.
Автор: MorSe
Дата сообщения: 16.11.2003 11:57
Месяца три назад уже была тема про каталогизаторы (см. http://forum.ru-board.com/topic.cgi?forum=5&topic=9090#1), но активность там, к сожалению, быстра спала на нет.
В интернете ничего подходящего не находил. Поэтому будет здорово, если наконец появится такой каталогизатор.
Автор: nES
Дата сообщения: 17.11.2003 09:32
ironwit

Цитата:
вообще то хотелось бы конечный продукт иметь без кракнутых компонентов.


Хотелось бы, но как искать в pdf с защитой (от копирования и т.п.) тогда ?
Автор: ironwit
Дата сообщения: 17.11.2003 11:05
MorSe

Цитата:
Поэтому будет здорово, если наконец появится такой каталогизатор.


нам тоже хочется...

nES

Цитата:
Хотелось бы, но как искать в pdf с защитой (от копирования и т.п.) тогда ?


что сможем - будем выковыривать, а что нет.... Средствами официальных программ, либо подкладывать для импорта уже кракнутые версии pdf(посторонними продуктами)
Автор: neofit
Дата сообщения: 17.11.2003 12:11
Перенесено из дружественного форума, см страницы 62,63
http://irodov.nm.ru/cgi-bin/ikonboard/topic.cgi?forum=2&topic=2&start=620

Как временное решение подойдет готовый движок (если позволяет написать вокруг себя скрипты) и яндекс искалка.

На длительную перспективу нужна легальная библиотека с открытым доступом (типа Гутеберга: http://promo.net/pg/) которая будет ядром (полезность такой библиотеки конечно резко ограничена, некоторых областей просто не было 75 лет назад). Это позволит написать opensource OCR для кириллицы и поиск, для удобства всех желающих (комерческий OCR распространять нельзя, равно как и менять что-либо в коде яндекса). Вокруг библиотеки будет форум для обмена нужными книгами. Скачав движок, каждый сможет усторить домашную библиотеку по своему усмотрению.

Идея, с индексированием всей библиотеки поисковиками типа гугля очень хорошая, но копирайт не даст ее осуществить на практике для комерческих книг.

Кстати, можно пытаться выкладывать книги найденые в свободном доступе на интернете (например на сайтах авторов), с условием, что они будут сняты по первому требованию владельцев копирайта (принцип библиотеки Мошкова).

P.S. В идеале еще неплохо было бы иметь гипертекстовую структуру над всей библиотекой (типа такой: http://mathworld.wolfram.com/topics/Algebra.html)
Автор: vpp
Дата сообщения: 20.11.2003 12:52
NSentinel

Цитата:
Ты уже начал копать dtSearch, продолжай в том же духе.. Ты будешь приятно удивлен Она поймет сканированный текст и даже будет совсем неплохо искать в нем


Скачал, попробовал TIF, не распознает где грабли
Автор: NSentinel
Дата сообщения: 20.11.2003 22:53
vpp

Цитата:
Скачал, попробовал TIF, не распознает


Ты не внимательно прочитал и поэтому не совсем правильно меня понял:

Цитата:
Она поймет сканированный текст и даже будет совсем неплохо искать в нем


dtSearch не распознавалка текста, я говорил лишь о том, что если страничку распознать на автомате, например, тем же FineReader'ом, то dtSearch будет неплохо искать в полученном _тексте_, справляясь c неточностями ряспознавания.
Автор: mihas83
Дата сообщения: 22.11.2003 10:38

Цитата:
Есть сеть - в ней много фильмов - надо их все завести в базу фильмов. Сделать онлайн каталог - с авторизацией, новостями, статьями, файлами и самое главное с базой фильмов. Нечто в этом роде - http://vp.gatchina.ru.
Это с топикa "Нужен портал для создания базы фильмов" ("наткнулся" здесь ). По-моему, вполне созвучно...
Автор: ironwit
Дата сообщения: 24.11.2003 10:25

Цитата:
По-моему, вполне созвучно...


:non:
Автор: mihas83
Дата сообщения: 24.11.2003 17:49
ironwit

Цитата:
:non:

Имею в виду каталогизаторы... актуальны для очень многих вопросов...
Автор: ironwit
Дата сообщения: 25.11.2003 07:34
mihas83

Цитата:
Имею в виду каталогизаторы...


тады можливо...
Автор: mihas83
Дата сообщения: 25.11.2003 08:51
ironwit

Цитата:
тады можливо...

Я это имел в виду с самого начала...
Автор: tot ra
Дата сообщения: 28.12.2003 22:18
с радостью прийму компонент для создания p2p соединения для дельфи
пробовал на основе фтп это устроить, есть индексы в 900 с лишним книг (20 гб), хто поможет - буду благодарен
Автор: nES
Дата сообщения: 03.02.2004 00:46
Может пригодится :
Spy-CD-Wizard to build a search database for your CD.
Spy-CD-Wizard scans these file types:
Type Description Extensions Extra scan software Viewer software

HTML Web page *.htm *.html Browser
PDF Adobe™ PDF *.pdf Adobe Acrobat Reader
DOC MS Word document *.doc *.rtf MS-Word 97-XP Word,Viewer,WordPad
XLS MS Excel document *.xls MS-Excel 5/97-XP MS-Excel
PPT MS PowerPoint *.ppt MS-PowerPoint 97-XP MS-PowerPoint
document
TXT Non-word processed *.txt Browser
text

If you want to build a search database using a Java application, consult the Spyndex page. Spyndex also finds meta-data information for field searches, and also indexes RDF/XML meta-data files.

_http://phdcc.com/spy%2Dcd/starter.htm

Автор: ironwit
Дата сообщения: 03.02.2004 11:44

Цитата:
PDF Adobe™ PDF *.pdf Adobe Acrobat Reader



вот а этот он на содержание не сканирует ИМХО.
Автор: nES
Дата сообщения: 04.02.2004 00:35
ironwit

Цитата:
Adobe™ PDF
вот а этот он на содержание не сканирует ИМХО


Сканирует(не всё без проблем,но всё ж).Подробности см.тама
(_http://phdcc.com/spy%2Dcd/pdfsupp.htm)
Автор: ironwit
Дата сообщения: 04.02.2004 07:30
Лады, пошел рассматривать
Автор: mihas83
Дата сообщения: 04.02.2004 08:17
nES

Цитата:
Может пригодится...

Туда же... Новая (03.02.04) версия BookSeer 3.2.5 (каталог-читалка электронных книг). _http://www.msolt.chat.ru/Bookseer3.htm
Автор: ironwit
Дата сообщения: 26.02.2004 08:20
Нашел одну программу ИМХО немного похложе на то, что надо

_http://collectorz.com/book/

посмотрите...
Автор: mihas83
Дата сообщения: 26.02.2004 08:48
ironwit

Цитата:
Нашел одну программу ИМХО немного похложе на то, что надо

А как на счет:
Цитата:
The Pro edition of Book Collector costs US $3995, the Standard edition costs US $2495
Автор: ironwit
Дата сообщения: 26.02.2004 09:00
mihas83
а ты не знаешь?

http://forum.ru-board.com/topic.cgi?forum=35&topic=12793#1
Автор: mihas83
Дата сообщения: 26.02.2004 09:23
ironwit
Поскольку ты дал первую ссылку на "капиталистов", подумал что нашел только там...
Автор: penext2003
Дата сообщения: 19.04.2004 16:31
Есть ли подвижки данном направлении ?
Автор: ironwit
Дата сообщения: 22.04.2004 07:53
penext2003

Цитата:
Есть ли подвижки данном направлении ?


К сожалению практически нет. Все застряло... Надеюсь пока.
Автор: penext2003
Дата сообщения: 22.04.2004 12:32
Жалко конечно. А так то бы начать хотя бы с простого txt, но предусмотреть в самом начале
- плагины
- p2p эх, да еще на основе WASTE,
- единую база авторов и единый формат наименования файлов в базе....

и так бы все это дело пошло....


сразу замахиваться на пдф и прочее-неподъемная задача.

Автор: ironwit
Дата сообщения: 23.04.2004 09:10
penext2003
твои бы слова да БГ в уши

Страницы: 1234

Предыдущая тема: Переносы под QuarkXPress 6.0(WIN)


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.