Ru-Board.club
← Вернуться в раздел «Программы»

» htm2chm

Автор: D1D1D1D
Дата сообщения: 03.03.2015 12:10
Foss

Цитата:
Кто сохраняет и кто портит?

Портит — программа, которая кириллицу в юникоде не воспринимает. Ну а решение переконвертации всех файлов в ANSI, по мне, так это сама собой разумеющаяся крайность.


Цитата:
IE вашу страницу сохраняет в ANSI совершенно корректно вместе с заголовком.
В ней сохраняйте и компилируйте.

Я пока так и делаю, но согласитесь, что необходимость из-за одного лишь кривого заголовка перекодировать множество файлов с возможно не одинаковой кодировкой (что тоже надо спецом выяснять) — это дело сильно избыточное. К тому же зачем там ANSI, когда в программе даже опции поиска нет? Вот в "HTML Help Workshop" ANSI оправдана, т.к. даёт возможность поиска по кириллице. А тут токмо заголовка ради)))
Автор: regist123
Дата сообщения: 04.03.2015 13:29
D1D1D1D 13:10 03-03-2015
Цитата:
Портит — программа, которая кириллицу в юникоде не воспринимает. Ну а решение переконвертации всех файлов в ANSI, по мне, так это сама собой разумеющаяся крайность.

Почему крайность? Если поищите в версии для печати, то увидите, что у меня раньше была точно такая проблема как у вас.
Теперь я конвертирую всё в ANSI создаю TOC файл, копирую и подкладываю его в папку с исходными юникодными файлами.
Автор: D1D1D1D
Дата сообщения: 04.03.2015 19:30
regist123

Крайность, потому что это может быть достаточно хлопотно. Например, если множество HTML-файлов содержат символы, допустим, арабского языка, которые нужно передать соответствующими кодами — так вот конвертация их исказит. Вы и сами можете проверить: любые символы, явно записанные в UTF-8 (не кодами) после перекодирования превратятся непонятно во что.
И я кстати не имел в виду TOC-файлы, т.к. независимо от кодировки обрабатываемых файлов, у меня они вроде создаются как положено, а имелось в виду вот эта вот графа из "Мастера преобразования", в которой отображается TITLE документа, или результат действия программы по команде преобразования страниц в отдельные CHM файлы.
Автор: regist123
Дата сообщения: 04.03.2015 19:41
D1D1D1D 20:30 04-03-2015
Цитата:
а имелось в виду вот эта вот графа из "Мастера преобразования", в которой отображается TITLE документа, или результат действия программы по команде преобразования страниц в отдельные CHM файлы.

не понял о какой графе речь, если не сложно сделайте скрин.
Цитата:
в которой отображается TITLE документа

TITLE как раз используется при создание Оглавления CHM файла, а это и есть .toc файл.
Автор: D1D1D1D
Дата сообщения: 04.03.2015 21:33
Всё-таки, по поводу того, что TOC генерируется правильно, был не прав: всё у меня как у людей))) Но если HTML файлы для TOC можно потом заменить на изначальные, избежав возможных искажений после декодирования, то для проблемы с тайтлом это не пройдет.

По графе вот:



а по TITLE смотрите на предыдущей странице.
Автор: regist123
Дата сообщения: 05.03.2015 09:53
Теперь понятно.
D1D1D1D 22:33 04-03-2015
Цитата:
Но если HTML файлы для TOC можно потом заменить на изначальные, избежав возможных искажений после декодирования, то для проблемы с тайтлом это не пройдет.
На самом деле тут тоже относительно легко решается (если только вы не создаете десяток разных CHM одновременно). Достаточно скомпилировать один раз скомпилировать с нужным вам названием, например после того как вы переконвертировали в ANSI и создали TOC файл взять и скомпилировать сборник (либо один раз скомпилировать вручную туда вписав название), а потом при последующих правках и компиляциях достачно выбрать нужное вам название из выпадающего списка в этой строке.
Автор: D1D1D1D
Дата сообщения: 07.03.2015 00:00
regist123
Спасибо, скрипт попробовал, но по обоим пунктам (TITLE и TOC) ничего не изменилось: видимо, при считывании заголовка, программа ориентируется на charset документа. Файлы были в кодировке (65001) UTF-8.
Автор: regist123
Дата сообщения: 07.03.2015 16:51
D1D1D1D
Проверил, на вашем файле, да не отработало. Там оказывается по умолчанию в скрипте включен учёт регистра букв.
Есть два варианта
1) Просто написать в Regular.txt

Код: word1=<TITLE>[^<]*</TITLE>
word2=\@{{{utf8toANSI}}}
Автор: D1D1D1D
Дата сообщения: 07.03.2015 20:47
regist123
Сработало, спасибо. Вполне юзабельно. Кстати, и не подозревал о такой возможности, думая, что общая кодировка "пересилит" кодировку фрагмента.
Автор: Foss
Дата сообщения: 15.03.2015 08:06
D1D1D1D
Я так и не уловил ваших проблем.
Вот, например, компилированный мною CHM с арабским оглавлением и контентом
http://www19.zippyshare.com/v/43JSmu0E/file.html
Автор: tulipp
Дата сообщения: 03.08.2016 17:45
[more] Здравствуйте. Проблема в следующем. С некоторых пор перестал сохраняться выбранный шрифт при компиляции, например:
редактирую документ в Office Word 2007, шрифт verdana, сохраняю как htm (при его открытии что в ворде, что в браузере - шрифт не изменен, т.е. такой же, какой был выбран в ворде - в данном случае verdana), а вот затем при компиляции его в chm программой htm2chm, в файле .chm формат текста уже какой угодно, только не verdana. Если повторно декомпилировать, открыть в Word'e и сделав любое исправление (ЛЮБОЕ! - например просто сделать отступ, потом вернуть и сохранить), и затем снова скомпилировать, тогда формат шрифта сохраняется (тот же verdana). Таким образом приходиться делать двойную работу.
Раньше такого не было. Все компилировалось с выбранным шрифтом с первого раза. Я уже и копался в настройках, и переустанавливал программу, и даже переустанавливал ОСь (правда по другой причине), но ошибка так и не пропала.

Вот скрины:
оригинал htm
http://s018.radikal.ru/i513/1608/b2/fc999d65d18ct.jpg

скомпилированный chm
http://s018.radikal.ru/i515/1608/6e/3962eb47b0dct.jpg

Подскажите пожалуйста, может кто сталкивался с подобным и как исправить, а то я уже "замахался" делать "двойную" компиляцию. [/more]
Автор: regist123
Дата сообщения: 03.08.2016 22:19
tulipp
1) Просьба не пользоваться эти каловым обменником. Такая просьба уже многократно была на форуме от разных форумчан. Вот к примеру, что я вижу при переходе по вашим ссылкам на скрины http://i80.fastpic.ru/big/2016/0803/ea/294cbbb054db5add7bb39571e400b7ea.png
2) Вместо скринов лучше выложите проблемный проект. То есть HTML файл со шрифтом verdana, который после компиляции у вас не verdana.
Автор: tulipp
Дата сообщения: 04.08.2016 13:26
Странно, щелкнул по представленным мной ссылкам (в моем посте) - у меня спокойно открываются полные картинки. Ну да ладно. А как здесь выложить HTML файл, тем более с папкой?
Автор: shadow_member
Дата сообщения: 04.08.2016 13:30
tulipp
В архиве на файлообменник, а сюда ссылку.

Страницы: 1234567891011

Предыдущая тема: Фото в ICQ


Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.