bredonosec 04:15 07-11-2004 Цитата: Всегда ли размер архива (данные) зависит от размера используемого словаря?
Насколько пробовал, иногда увеличение размера словаря помогает, иногда - нет.
Разумеется, нет. Если ему не набрать нужного количества записей для словаря (скажем, если в архиве одна фраза повторена мильон раз), то размер 4096 кбайт не нужен.
Другое дело: винрар сам подбирает нужный ему размер словаря! У меня по умолчанию установлен размер 4096 кбайт, но, тем не менее, достаточно архивов, в свойствах которых говорится, что размер их словаря 1024 кбайта! To be as smart as WinRar is...
Цитата из
David Salomon, Data compression, Springer-Verlag, 2004, 0-387-40697-2, Ch. 3 "Dictionary Methods":
Цитата: Statistical compression methods use a statistical model of the data, and the quality of сompression they achieve depends on how good that model is. Dictionary-based compression methods do not use a statistical model, nor do they use variable-size codes. Instead they select strings of symbols and encode each string as a token using a dictionary. The dictionary holds strings of symbols and it may be static or dynamic (adaptive). The former is permanent, sometimes allowing the addition of strings but no deletions, whereas the latter holds strings previously found in the input stream, allowing for additions and deletions of strings as new input is being read.
Про плагины: вас смущает то, что размер сжатого файла 2,5 Мбайта, а размер только словаря 4 Мбайта? Интересный вопрос. Что-то у меня заскок здесь случился. Тупо приходит на мысль: он сжимает словарь... (иногда такая операция действительно делается, --- файл сжимается с помощью какого-нибудь LZ -алгоритма, но модель такова, что после наполнения, словарь сжимается с помощью преобразования Барроуза-Вилера (Burrows-Wheeler Transform, BWT)).
http://www.dogma.net/markn/articles/bwt/bwt.htm http://www.data-compression.info/Algorithms/BWT/ Вот, кстати, несколько сайтов. Весьма рекомендую к прочтению, если интересна тема сжатия данных. Только осторожнее --- завлекает так, что не оторваться.
http://www.data-compression.com/theory.html;
http://www.maximumcompression.com;
http://www.arctest.com;
http://www.compression.ru/index.htm;
http://act.by.net;
http://geocities.com/eri32/ http://www.dogma.net/markn/articles/articles.htm.