hammerxp1 Цитата: Подскажите пожалуйста оптимальные параметры для сжатия Файлов windows.
Никто не подскажет и тебе самому надо заморочиться тестами. Я бы обратил внимание на такие элементы цепочки, как dispack, delta, lzma, и конечно rep\srep.
lzma естественно последним звеном, а вот порядок остальных - спорный вопрос. Для delta я бы так же поигрался с размером блока и конечно бы побрутил параметры lzma.
На одном из моих тестов на бинарниках получилась такая цепочка:
-mdelta:b128m+dispack+lzma:a1:mfbt4:d128m:lc0:fb273:lp1:pb2:mc10000
Но там был не нужен rep\srep, а тебе он определенно нужен. И куда его вставить в звено, и как он повлияет на пред\пост фильтры - неясно. В принципе не так много комбинаций, так что всё в твоих руках.
Цитата: то есть все дополнительные навороты типа precomp и тд. использовать не могу
Можешь.
Цитата: и вот не получается ужать все версии win7 x86, 7x64, 8x86 и 8x64 до размеров одного dvd
Ты забываешь, что например внутри основного WIM файла есть winRE.wim, который можно пережать и сохранить порядка 80 МБ. Есть и еще трюки.
И вообще скажи как называются твои сборки, чтобы знать от чего держаться подальше.
Добавлено: Bulat_Ziganshin Цитата: или всё же сделать поддержку дедупликации файлов в формате самого архива...
Вопрос пофайловой дедупликации назревал уже давно и очень хорошо, что Эди высказал предложение вслух. Любому человеку вполне очевидно, что для того же tta в случае многих дупликатов, гораздо лучше сделать пофайловый дедуп, чем объединять файлы в один блок, пропускать через (s)rep и сжимать как raw. Для некоторых внешних компрессоров непофайловая дедупликация вообще недопустима.
Я лично за реализацию на уровне формата. Да, это вызовет несовместимость, но я не припомню когда это автор FreeArc боялся экспериментов.
Сам дедуп можно делать на том же blake2 с многопоточностью, а для сверх-параноиков ввести режим, когда помеченые как идентичные файлы будут сверяться побайтно.