Привет All!
(возможно кто-то это уже видел...)
Абзацем считается несколько предложений не разделенных переводом строки. Это видно в ФР или в Ворде, если включить отображение непечатаемых символов. Если есть перевод строки - это новый абзац.
Замечено, что ФР5/6/7 неверно распознают абзацы. Т.е. происходит либо склейка либо разделение абзацев. Самый простой пример - стихи - нет переводов строк... Другой пример - если абзац состоит из одного предложения, которое влезает в одну строку, т.е. заканчивается примерно на правой границе, то этот абзац непременно склеится со следующим. Есть еще другие варианты...
Для экспериментов скачайте тестовые TIFFы, на которых проявляются такие ошибки:
http://zpdd.chat.ru/files/test-tif.rar Результаты моих исследований можно посмотреть тут:
http://zpdd.chat.ru/files/test-txt.rar Пояснения: 4-5-6 - ФР4-ФР5-ФР6 (у ФР7 тоже самое что и в ФР6)
*.tx1 - сохранение из ФР в ТХТ с делением на строки
*.tx2 - сохранение из ФР в ТХТ без деления на строки, вот только test4.tx2 получен из test4.tx1 (на переносы не смотреть).
В test5.tx2 и test6.tx2 видно если смотреть по картинкам, где идет склейка абзацев!
*.tx3 - сохранение из ФР5/6 в *.rtf плюс пропуск через спец-программу. Видно, что абзацы, которые склеились в *.tx2 исправлены, но есть ложные срабатывания алгоритма - ложные абзацы...
И еще замечено следующее: если в ФР5 при сохранении в Word обычно используется выравнивание по ширине, то в ФР6/7 разработчики почему-то намудрили (наверное от слова "мудаки") и в тех же местах идет выравнивание влево, что я считаю вообще нонсенсом в DOC. Особенно это заметно на диалогах. Так еще ж в ФР6/7 появилось заполнение пробелами именно из-за того, что нужно же как-то растянуть строку, раз уж выравнивание влево... Два пробела подряд в файлах DOC - это тоже маразм!
Если в ФР5 на тех местах, где шла склейка абзацев, идет выравнивание влево, то такие склейки легко находятся полуавтоматически, например, в Wordе. То на ФР6/7 эти же склейки не отличишь от нормальных ситуаций...
У меня написана программа, которая из сохраненного в ФР специальным образом RTF файла, путем анализа этих самых выравниваний, делает текстовый файл с исправлениями склееных/разделенных абзацев. Так вот на ФР5 программа делает потрясающие результаты - в большинстве случаев после нее нет дополнительной правки абзацев. В то время как после ФР6/7 из-за таких заумностей, как выравнивание влево в нормальных абзацах, - делается много доисправлений...
Так вот, наконец, вопрос:
Есть ли у Allа какие-нибудь решения по этому поводу???
ФР4 не предлагать!
Это слишком просто (очень примитивно в век ФР5/6/7 и космических полетов).
Я знаю, что в ФР4 есть сохранение в TXT с сохранением форматирования при помощи пробелов. И видел, что там с абзацами таких проблем нету...
С уважением, Zmiy. --------------
http://zmiy.da.ru