Возникла такая ситуация:
Имеется векторный pdf-файл (изготовлен в Adobe InDesign CS3, не мною). Содержимое - текст на русском с вкраплениями иностранных слов. При просмотре/печати - все нормально. Но при копированиии текста (в Блокнот, WordPad, MS Winword и др. текстовые редакторы) текст на 95% выглядит как кракозябры (или квадратики) - независимо от того, копируется кириллический текст или латиница. Ну и, соответственно, поиск по тексту не находит почти ничего.
Посмотрел в Асrobat'е шрифты документа - ничего экзотического (Ari, Arial, TimesNewRoman, KabelC, MinionPro, MiriadPro, Symbol). Правда, кодировки у шрифтов стоят - ANSI и Identity-H.
Проблема из-за кодировок? Если да, как и какими инструментами можно управлять кодировками шрифтов?
Если нет, то то в чем причина ненормальности текста? И можно ли ее исправить?
Уточнение: мне нужны не способы "вытащить" текст из этого файла (для этого, на худой конец, можно воспользоваться FineReader'ом), а "рецепты" исправления текста в самом pdf, чтобы копируемый текст из pdf выглядел нормальным текстом и поиск по тексту в pdf-файле работал нормально.
Вот
фрагмент файла: пароль на скачивание - "problemfile" (без кавычек).
Заранее извиняюсь за, возможно, глупую постановку проблемы - в вопросах работы со щрифтами в pdf я -
чайник.