feuerloescher
Astra55
Провозился еще час и случайно нашел-таки корректное недокументированное решение, все оказалось до смешного просто.
Если сохранить этот испорченный документ при помощи диалога Save As... в один из форматов HTML (HTML 3.2 или HTML 4.01) или в формат XML 1.0 (и только в эти три, никакие RTF и TXT не дают такого же эффекта), то структура документа в ходе процесса сохранения изменяется, и он сразу же становится "нормальным", можно искать и копировать текст.
После этого остается просто сохранить исправленный документ под новым имененем (сохранить под тем же именем не получится, так как Acrobat, похоже, считает, что документ изменен не был.)
Не знаю, можно ли данное явление объяснить рационально, но несколько раз повторенные эксперименты не оставляют сомений в наличии причинно-следственной связи (feuerloescher может сам убедиться).
З.Ы.
Кстати, для извлечения текста в любой из предлагаемых Акробатом текстовых форматов (TXT, RTF, DOC, HTM, XML) оказывается, достаточно было сохранить документ через диалог Save As... в желаемом формате. И не надо было никаких ухищрений вроде перераспознавания через FineReader.
Цитата:
Как видишь, не совсем из порожнего и, позволю себе заметить, не совсем в пустое
Огромное спасибо обоим за помощь! Без ваших замечаний я бы, наверное, даже не сообразил, в какую сторону "тыкать".
Astra55
Провозился еще час и случайно нашел-таки корректное недокументированное решение, все оказалось до смешного просто.
Если сохранить этот испорченный документ при помощи диалога Save As... в один из форматов HTML (HTML 3.2 или HTML 4.01) или в формат XML 1.0 (и только в эти три, никакие RTF и TXT не дают такого же эффекта), то структура документа в ходе процесса сохранения изменяется, и он сразу же становится "нормальным", можно искать и копировать текст.
После этого остается просто сохранить исправленный документ под новым имененем (сохранить под тем же именем не получится, так как Acrobat, похоже, считает, что документ изменен не был.)
Не знаю, можно ли данное явление объяснить рационально, но несколько раз повторенные эксперименты не оставляют сомений в наличии причинно-следственной связи (feuerloescher может сам убедиться).
З.Ы.
Кстати, для извлечения текста в любой из предлагаемых Акробатом текстовых форматов (TXT, RTF, DOC, HTM, XML) оказывается, достаточно было сохранить документ через диалог Save As... в желаемом формате. И не надо было никаких ухищрений вроде перераспознавания через FineReader.
Цитата:
За то время, которое ушло на переливание их того самого пустого в то самое порожнее, я бы уже давным-давно сделал требуемое, может быть не одним способом.
Как видишь, не совсем из порожнего и, позволю себе заметить, не совсем в пустое
Огромное спасибо обоим за помощь! Без ваших замечаний я бы, наверное, даже не сообразил, в какую сторону "тыкать".