Попробовал оптимизацию уменьшилось с 132мб до 94мб - это нормально?
» Adobe Acrobat Professional
Nizaury
Ну вы, блин, даете! (с) Я же не телепат, чтобы увидеть на расстоянии Ваш файл, сколько там страниц, сколько там растровой графики и тому подобное. Может там вообще сканы с текстовым слоем, их хоть заоптимизируйся, толку не будет, если исходный скан сделан плохо и не в том формате. Судя по сотне метров, растра там хватает с избытком. Или текстовых страниц десятки тысяч. Нет у меня ни одного pdf файла подобного размера, чтобы внутри был только вектор.
Ну вы, блин, даете! (с) Я же не телепат, чтобы увидеть на расстоянии Ваш файл, сколько там страниц, сколько там растровой графики и тому подобное. Может там вообще сканы с текстовым слоем, их хоть заоптимизируйся, толку не будет, если исходный скан сделан плохо и не в том формате. Судя по сотне метров, растра там хватает с избытком. Или текстовых страниц десятки тысяч. Нет у меня ни одного pdf файла подобного размера, чтобы внутри был только вектор.
Ладно, извините, я действительно не подумал о таком колличестве ньюансов.
А данная книга была просто отсканированный учебник по рисованию. Половина их у меня файлами размером не менее 50 мб.
А данная книга была просто отсканированный учебник по рисованию. Половина их у меня файлами размером не менее 50 мб.
Nizaury
Так я и знал! На будущее - сканированные изображения должны обрабатываться до помещения в контейнер pdf, поскольку инструменты для оптимизации растра уже находящегося в контейнере (CVista PdfCompressor и прочие), не слишком эффективны.
Если есть желание узнать побольше об обработке сканов, то зайдите сюда:
http://forum.ru-board.com/topic.cgi?forum=93&topic=1624&glp
и сюда
http://forum.ru-board.com/topic.cgi?forum=5&topic=24351&glp
Так я и знал! На будущее - сканированные изображения должны обрабатываться до помещения в контейнер pdf, поскольку инструменты для оптимизации растра уже находящегося в контейнере (CVista PdfCompressor и прочие), не слишком эффективны.
Если есть желание узнать побольше об обработке сканов, то зайдите сюда:
http://forum.ru-board.com/topic.cgi?forum=93&topic=1624&glp
и сюда
http://forum.ru-board.com/topic.cgi?forum=5&topic=24351&glp
прошу прошения за тупой вопрос, а Adobe Acrobat позволяет редактировать уде созданные pdf файлы?
lorents
Можно - в Pro - версиях. Могут возникать проблемы, если шрифта нет, но его можно заменять другим:
Tools -> Advanced Editing -> TouchUp Text Tool -> Выделить текст (текст будет в рамке) и редактировать.
Можно - в Pro - версиях. Могут возникать проблемы, если шрифта нет, но его можно заменять другим:
Tools -> Advanced Editing -> TouchUp Text Tool -> Выделить текст (текст будет в рамке) и редактировать.
ycheff
благодарю, тогда пойду скачивать
благодарю, тогда пойду скачивать
Цитата:
прошу прошения за тупой вопрос, а Adobe Acrobat позволяет редактировать уде созданные pdf файлы?
В шапке первая ссылка "Краткий FAQ и работа с плагинами" там всё написано.
Astra55
Большое спасибо.
Я тут немного почитал указанную ветку и задумался. Стало понятно, что лучше сканы обрабатывать до создания книг. Просто, когда страниц более 200 - лень было каждому уделять внимание. Думал всех вместе сжать родными средствами.
Отсюда созрел вопрос к тем, кто часто делает книги. А по сравнению со своим конкурентом Djvu, кто лучше сжимает графику не добавляя ей зернистости и иже с ними?
Добавлено:
ycheff
По поводу шрифтов (если их в системе нет, как их вытащить) обсуждалось, чуть-чуть выше.
И к слову, как это ни странно, но при наличии шрифтов можно вполне сносно редактировать сплошные тексты, где нет необходимости в выравнивании текста.
Большое спасибо.
Я тут немного почитал указанную ветку и задумался. Стало понятно, что лучше сканы обрабатывать до создания книг. Просто, когда страниц более 200 - лень было каждому уделять внимание. Думал всех вместе сжать родными средствами.
Отсюда созрел вопрос к тем, кто часто делает книги. А по сравнению со своим конкурентом Djvu, кто лучше сжимает графику не добавляя ей зернистости и иже с ними?
Добавлено:
ycheff
По поводу шрифтов (если их в системе нет, как их вытащить) обсуждалось, чуть-чуть выше.
И к слову, как это ни странно, но при наличии шрифтов можно вполне сносно редактировать сплошные тексты, где нет необходимости в выравнивании текста.
еще один вопрос при попытке редактировать текст мне выдает ошибку
Цитата:
что мне делать?
Цитата:
All or part of the selection has no available system font. You cannot add or delete text using the currently selected font.
что мне делать?
lorents
1) Найти в интернете и установить отсутствующий шрифт
2) Редактировать используя текущий шрифт.
3) Попытаться выдрать шрифты из файла и установить их в систему.
1) Найти в интернете и установить отсутствующий шрифт
2) Редактировать используя текущий шрифт.
3) Попытаться выдрать шрифты из файла и установить их в систему.
Цитата:
2) Редактировать используя текущий шрифт.
это не возможно
Цитата:
1) Найти в интернете и установить отсутствующий шрифт
надо поставить шрифты от adobe
Цитата:
3) Попытаться выдрать шрифты из файла и установить их в систему.
это как?
lorents http://forum.ru-board.com/topic.cgi?forum=5&topic=24211&start=0&limit=1&m=1#1 прочитал первый Q: и первый A:
zhe_zho
я нашел метод по легче, просто экспортировать в word, качество просто супер
тока не могу понять почему при экспорте у меня страницы в word'е размером А5, хотя в Acrobat'е А4
и еще один вопрос где функция сохранить файл (я не про save as) а чтобы можно было выбрать какая версия Adobe Reader может открывать, разрешить открыть через web и т.д.?
я нашел метод по легче, просто экспортировать в word, качество просто супер
тока не могу понять почему при экспорте у меня страницы в word'е размером А5, хотя в Acrobat'е А4
и еще один вопрос где функция сохранить файл (я не про save as) а чтобы можно было выбрать какая версия Adobe Reader может открывать, разрешить открыть через web и т.д.?
lorents
save optimized начиная с 8-й версии или pdf optimizer в 6-7
только остальные настройки не забудь посмотреть, по умолчанию меняется не только версия
save optimized начиная с 8-й версии или pdf optimizer в 6-7
только остальные настройки не забудь посмотреть, по умолчанию меняется не только версия
feuerloescher
а где это окно находится?
не могу найти
а где это окно находится?
не могу найти
Строка меню Дополнительно (Advanced)
zhe_zho
спасибо, что-то не увидел с первого раза
спасибо, что-то не увидел с первого раза
feuerloescher
Цитата:
Finereader и его специализированый собрат PDFTransormer открывают pdf напрямую.
Цитата:
Цитата: сохранить документ PDF в виде картинки
Finereader и его специализированый собрат PDFTransormer открывают pdf напрямую.
oshizelly
Часто при Вашем варианте решения проблемы возникает проблема резко ухудшенного качества вновь получаемого pdf-файла. Особенно при низком качестве исходного pdf. Получается, что 100%-ного решения нет.
Часто при Вашем варианте решения проблемы возникает проблема резко ухудшенного качества вновь получаемого pdf-файла. Особенно при низком качестве исходного pdf. Получается, что 100%-ного решения нет.
ycheff
Цитата:
Я не очень крутой спец, но IMHO такое просто невозможно. Алгоритм состоит в том, что мы вынимаем картинку из PDF, распознаем ее OCR-программе (скажем, в FR) и опять сохраняем в PDF. На выходе должы получить абсолютно ту же самую картинку, что была на входе. Если качество меняется, значит где-то по пути эту картинку кто-то пытается обрабатывать, и этого вредителя надо просто выявить и надавать по рукам.... в смысле, по настройкам.
Цитата:
Часто при Вашем варианте решения проблемы возникает проблема резко ухудшенного качества вновь получаемого pdf-файла. Особенно при низком качестве исходного pdf.
Я не очень крутой спец, но IMHO такое просто невозможно. Алгоритм состоит в том, что мы вынимаем картинку из PDF, распознаем ее OCR-программе (скажем, в FR) и опять сохраняем в PDF. На выходе должы получить абсолютно ту же самую картинку, что была на входе. Если качество меняется, значит где-то по пути эту картинку кто-то пытается обрабатывать, и этого вредителя надо просто выявить и надавать по рукам.... в смысле, по настройкам.
Вынуть картинки при помощи PDF Image Extraction Wizard Сам текст распознать в FineReader или PDFTransformer и сохранить в PDF. Далее при помощи Adobe Acrobat Professional вставить картинки, в настройках (Редактирование -> Установки -> Преобразование в PDF, Edit -> Preferences -> Convert to PDF) иследует избегать сжатия JPEG, тогда можно будет избежать лишних потерь.
zhe_zho
Цитата:
Э-эээ... В каком смысле "вставить картинки"? Куда вставить?
Цитата:
далее при помощи Adobe Acrobat Professional вставить картинки
Э-эээ... В каком смысле "вставить картинки"? Куда вставить?
В документ. Я так понял что в документе есть и картинки, ведь ycheff боится за потерю качества PDF. Если бы был только текст, то чего боятся, сделать так как было вами предложено
Цитата:
Цитата:
сохранение в TIFF и распознание
zhe_zho
Цитата:
Это-то как раз понятно. Непонятно, на каком этапе эти картинки куда-то делись, чтобы их надо было обратно вставлять? Если только я ничего не путаю, ycheff спрашивал о том, как избавиться от некорректного текстового слоя. Предложенный мной вариант сводится к следующим до боли простым действиям:
1) извлекаем из PDF изображения (можно это сделать штатными средствами Acrobat, а можно использовать одну из миллиона программ, предназначенных для этого, в т.ч.
PDF Image Extraction Wizard)
2) Затаскиваем файлы с извлеченными изображениями в OCR (FineReader, PDF Transformer, OmniPage и т.п.)
3) Распознаем.
4) Сохраняем картинки и распознанный текст в формат PDF.
Собственно, на этом все. Вы же предлагаете дополнить эту схему еще один шагом: открыть полученный PDF в Acrobat Professional и "вставить картинки". Не совсем ясно, какие картинки надо вставлять и для чего (кстати, я не уверен, что Acrobat Professional без плагинов вообще позволяет добавлять изображения в готовый документ, но это уже другой вопрос).
Цитата:
В документ. Я так понял что в документе есть и картинки, ведь ycheff боится за потерю качества PDF.
Это-то как раз понятно. Непонятно, на каком этапе эти картинки куда-то делись, чтобы их надо было обратно вставлять? Если только я ничего не путаю, ycheff спрашивал о том, как избавиться от некорректного текстового слоя. Предложенный мной вариант сводится к следующим до боли простым действиям:
1) извлекаем из PDF изображения (можно это сделать штатными средствами Acrobat, а можно использовать одну из миллиона программ, предназначенных для этого, в т.ч.
PDF Image Extraction Wizard)
2) Затаскиваем файлы с извлеченными изображениями в OCR (FineReader, PDF Transformer, OmniPage и т.п.)
3) Распознаем.
4) Сохраняем картинки и распознанный текст в формат PDF.
Собственно, на этом все. Вы же предлагаете дополнить эту схему еще один шагом: открыть полученный PDF в Acrobat Professional и "вставить картинки". Не совсем ясно, какие картинки надо вставлять и для чего (кстати, я не уверен, что Acrobat Professional без плагинов вообще позволяет добавлять изображения в готовый документ, но это уже другой вопрос).
почему при экспорте в ворд у меня таблицы экспортируются как тест?
Прошу прощения, я как следует не изучил PDF Image Extraction Wizard, думал что он может выдирать картинки из страниц.
oshizelly про то что Adobe Acrobat Professional умеет вставлять картинки я видел в сообщении Astra55, я так полагаю это функция "Вставить изображение как шпамп".
oshizelly про то что Adobe Acrobat Professional умеет вставлять картинки я видел в сообщении Astra55, я так полагаю это функция "Вставить изображение как шпамп".
lorents
Цитата:
Попробуйте экспортировать их не из Acrobat'a, а из FineReader'a, там фрагменту можно тип определить. Хотя сам не пробовал, может и не получиться.
Цитата:
почему при экспорте в ворд у меня таблицы экспортируются как тест?
Попробуйте экспортировать их не из Acrobat'a, а из FineReader'a, там фрагменту можно тип определить. Хотя сам не пробовал, может и не получиться.
ycheff
Цитата:
Тогда уж не из FR, а из Трансформера. В этом топике нужно забыть про ФайнРидер, как средство обработки pdf файлов, за исключением сканов, поскольку все равно произойдет конвертирование в растр и распознавание. Со всеми втекающими и вытекающими последствиями.
Конвертить вордовские файлы лучше сторонними программами, благо их полно, всегда можно подобрать наиболее подходящую.
Добавлено:
zhe_zho
Цитата:
Само собой может. Какие в этом сомнения? Причем делает это весьма корректно, на подправленных сканах показывает все области, даже замаскированные.
Цитата:
из FineReader'a
Тогда уж не из FR, а из Трансформера. В этом топике нужно забыть про ФайнРидер, как средство обработки pdf файлов, за исключением сканов, поскольку все равно произойдет конвертирование в растр и распознавание. Со всеми втекающими и вытекающими последствиями.
Конвертить вордовские файлы лучше сторонними программами, благо их полно, всегда можно подобрать наиболее подходящую.
Добавлено:
zhe_zho
Цитата:
он может выдирать картинки из страниц
Само собой может. Какие в этом сомнения? Причем делает это весьма корректно, на подправленных сканах показывает все области, даже замаскированные.
Astra55 я немного запутался и должно быть запутал вас. Я имел ввиду может ли с удаление этой картинки из pdf?
Страницы: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179
Предыдущая тема: проблема с отправкой писем
Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.