bolega
Цитата:
Цитата:
Я придумал, как отличить нумерацию строк по бокам текста от мусора:
- все эти символы лежат на одной линии с символами строк.
- эти символы выровнены в столбик по левой стороне.
- еще один косвенный признак - нумерация идет то с левой стороны страницы, то с правой.
С этим можно что-то сделать?
Цитата:
Цитата:
В опциях draft на закладке Advanced есть этот регулятор: Text vert. sensitivity.Я почему-то был уверен, что этот регулятор именно для чувствительности по вертикали (как я ее понимаю) - т.е. для определения колонтитулов внизу и вверху страницы (напр., номеров страниц). Ошибаюсь?
Цитата:
На самом деле распознавание значков (номеров страниц, вынесенных буковок и т.п.), расположенных сбоку от основного габарита страницы - это самая сложная и нетривиальная задача.Спасибо за разъяснения.
Я придумал, как отличить нумерацию строк по бокам текста от мусора:
- все эти символы лежат на одной линии с символами строк.
- эти символы выровнены в столбик по левой стороне.
- еще один косвенный признак - нумерация идет то с левой стороны страницы, то с правой.
С этим можно что-то сделать?
Цитата:
Кстати, в версии 5.93 и далее усложнился также анализ горизонтальных краев. СК проводит теперь анализ на наличие номеров страниц, а также некоторых математических символов (интеграла и символа суммирования), т.к. под или над ними могут быть небольшие буковки-циферки (пределы суммирования или интегрирования).Т.е. теперь есть даже что-то внутреннего OCR-движка?