enotus1 22:50 13-05-2005 Цитата: Interesny voprosy i kritika, t.k. schitau chto poluchilos neploho.
Действительно хорошо. Но вопросы есть.
Цитата: Чем больше порядок модели, тем выше степень сжатия
Насколько я понимаю, вообще говоря. То есть может быть и наоборот.
Цитата: Существует и промежуточный вариант, когда используются непрерывные блоки фиксированного размера. Потери сжатия получаются минимальными, но для извлечения одного файла, который находится в конце большого архива необходимо распаковать только один непрерывный блок, а не весь архив.
Ух-ты. Например?
Ну и мелкие рекомендации, несущественные придирки:
Хорошо бы пояснить в начале статьи, что кодирование есть преобразование данных, что лучший архиватор, архиватор осуществляющий тождественное отображение.
Цитата: При сжатии очередного элемента данных эта модель выдаёт своё предсказание или вероятность
Вероятность чего? --- спросит неподготовленный читатель.
Цитата: Не сжимаются почти все уже сжатые данные, например, архивы (ZIP, CAB), сжатые документы (PDF), сжатая графика и видео (JPG, GIF, AVI, MPG),
Почему? Тот же Zip поджимает заголовок RAR'а, jpg неплохо сжимаются Stuffit 9, ну а PDF вообще отлично жмется тем же LZMA или ALZ, если не сжат изначально. Впрочем, дальше вы поясняете о чем речь, но все же лучше смягчить, потому как вообще говоря непонято, почему выполнением еще одного преобразования не преобразовать полученные данные таким образом, что они не сожмутся еще. Именно поэтому хорошо бы вставить строчку почему невозможен вечный архиватор.
Цитата: Например, существует более десятка программ-архиваторов, которые могут создавать архивы в формате ZIP. В свою очередь, данные в формате ZIP могут быть сжаты различными методами: Deflate, Deflate64, BZip2.
Еще JAR можно упомянуть.
Цитата: Других архиваторов и архивов лично я не встречал.
Под виндосом. Но попадаются bz2 и jar (просто можно было бы кстати упомянуть, зачем нужна поддержка этих вещей)
Цитата: Например, при проведении тестирования была найдена ошибка в архиваторе WinRK (PWCM)
Кстати, PWCM это какое-нибудь контекстное моделирование с частичным взвешиванием? Что-то не нашел на сайте Тейлора расшифровку...
Цитата: данных архиватор 7-zip (LZMA) покажет худшие результаты, чем RAR, который имеет специальные методы для таких типов данных.
Не совсем корректно, на мой взгляд сравнивать 7-Zip с выбранным LZMA, когда известно, что RAR автоматом выберет PPM. Поэтому хорошо было бы упомянуть, что в 7-zip нужно просто самостоятельно заботиться о выборе порядка модели и используемой памяти, тогда как WinRAR все сделает сам.
Цитата: Такой малоизвестный архиватор DGCA
Здорово. Спасибо. Не знал об этой живности.
Цитата: Так как не все протестированные архиваторы поддерживают возможность сжатия папок, для них набор данных предварительно преобразовывался в архив ZIP с нулевой степенью сжатия.
Имеется в виду рекурсивный проход?
Цитата: Если же использовать архив ZIP с нулевой степенью сжатия, тогда на тестовых наборах exe и med степень сжатия получалась значительно хуже. Это объясняется тем, что архиватор Slim использует специальные методы для некоторых форматов файлов. Архив ZIP хоть и содержит несжатые файлы, для Slim представляется только как архив ZIP. Таким образом, для архиватора Slim тестовый набор txt и bak предварительно преобразовывался в архив ZIP с нулевой степенью сжатия.
Не понял? Возникает вопрос: зачем он преобразовывался в несжатый zip, если вы сами говорите, что в этом нет смысла?
Кстати, почему на IBM'овский tape archiver?
Цитата: Не поддерживается непрерывный режим. Архиватор не эффективен при сжатии большого числа маленьких файлов
Про Zip хорошо бы сказать, что у Deflate размер словаря фиксирован 32 килобайтами и умпомянуть по этому поводу Deflate64.
Цитата: Однако при максимальном сжатии может использоваться и используется симметричный метод для сжатия текста (PPM).
Это точно? То есть он выберет PPM даже если будет сжимать бинарные файлы?
При разговоре о проепроцессинге можно вспомнить о том, что внесение избыточности иногда позволяет достичь лучшего сжатия (могу врать конечно, наверное это можно доказать...).
Резюмируя: оч хорошо. Понравилось. Спасибо.