regist123 Я лично тут бага не вижу ибо СР-437 (Lat-US, ANSI) содержит только символы с кодами 0х00 - 0x7F - латиницу и спецзнаки, а в CP-866 (Cyr-RU) используется два диапазона - латиница 0x00 - 0x7F и дополнительный на который и отображены символы кириллицы 0x80 -0xFF. При распаковке имена файлов будут воссозданы правильно, НО! кодовая страница ОС их не поддерживает и выводится мусор.
Реально проблема гораздо старше по возрасту и возникла в начале 60-х годов когда появилась сначала Symens 4004 и позднее как её развитие IBM S/360 с OS/360 PCP - ОС создавалась в США и в качестве основной таблицы символов была использована 7-и битная KOI-7 - существовавшие с 1949 года в США ограничения КОКОМ (формально частично отменены в 1993-м году, но основная часть ограничений действует до сих пор - "Дави конкурентов в зародыше!" ©Дядя Сэм
) запрещали экспорт высокопроизводительных ЭВМ в страны Варшавского Договора и Китай, а потому в ОС не предусматривалась поддержка языков с не латинским алфавитом. Позднее комплексы IBM S/360 были поставлены в СССР, в частности для системы АСУ "Москва" в середине 70-х были поставлены машины IBM S/360 mod 168 и тогда в OS/360 была сделана доработка - кодовую таблицу KOI-7 заменили на 8-ми битную таблицу DKOI-8 поддерживающую символы кириллицы в диапазоне адресов с 0x80 по 0xFF, и вот в этот период времени и проявилась данная проблема - не все комплексы имели одинаковую настройку локали и не все дисплеи имели прошивку знакогенераторов позволявших выводить на экран символы кириллицы. Всё закончилось аппаратно-микропрограммной доработкой ЭВМ, а в отечественной копии IBM S/360 - машинах ЕС ЭВМ Ряд 1 этот опыт был учтён ещё на этапе проектирования. Мы к примеру об этом узнали от самого А.М. Ларионова который привёл нам этот пример на лекции по системотехнике ЭВМ как пример первичной инженерной ошибки допущенной при проектировании систем Symens 4004 и позднее перекочевавшей в IBM S/360.
Добавлено: Ajaja Вот в этом и беда MD5 вероятность его ошибки коллизии алгоритма 2,7*10-4, да и я так думаю, что большинство всех этих шароварных шешесчиталок хорошо если часть файла обрабатывают - уже встречал случаи когда разные "считалки" на одном и том же файле разные MD5/SHA-1 формировали. Правда обычно авторы после дико извинялись и срочно правили баги, но факты были.