ycheff Цитата: Установил Acrobat 9.0 pro extended. Методом тыка не удалось удалить ocr-слой. Напишите чуть подробнее, как действовать. В палитре Layers кнопка Flatten layers не срабатывает - что-то не так далаю.
В 8-й версии удалить невидимый слой можно очень просто. В окне со списком скрытых элементов (вызывается через меню
Document -> Examine Document...) выбираем (ставим галочку) строку "
Hidden text", снимаем галочки со всех остальных элементов (конечно, если не хотим их удалять) и жмем кнопку в нижней части окна "
Remove all checked items". Всё. Сохраняемся, естественно.
А если кликнуть по команде "
Preview" справа от
Hidden text, то можно напрямую посмотреть скрытый текст и даже выделять и копировать отдельные его фрагменты. Правда окошко просмотра маленькое и неудобное, но все же лучше, чем ничего.
Подозреваю, что в 9-ке тоже должно быть что-то подобное.
ycheff Цитата: Спасибо, разобрался. Но для моих файлов эта утилита не помогает - у меня есть pdf-файлы, где вместо всех букв копируются и вставляются квадратики. Создается второй файл, но проблема осталась - поиска нет.
Нашел и такие, где не квадратики, а иные символы, но для них последовало "nothing to fix", и второго файла не создается.
А это случайно не та же самая проблема, которую мы с
feuerloescher обсуждали в этом топике пару страниц назад? Если та же самая, то там приведено одно из возможных (не универсальных) простых решений (предположительно, работатает в тех случаях, когда в документе имеется корректна таблица символов).
З.Ы.
Совсем уж лобовое, но 100% надежное и легко выполнимое решение: сохранить документ PDF в виде картинки (
File -> Save As... -> TIFF") и потом распознать картинку заново.