Главная
Новости
Строительство
Ремонт
Дизайн и интерьер




13.01.2022


29.12.2021


09.12.2021


09.12.2021


08.11.2021





Яндекс.Метрика





ZIP

04.05.2022

ZIP — формат архивации файлов и сжатия данных без потерь. Архив ZIP может содержать один или несколько файлов и каталогов, которые могут быть сжаты разными алгоритмами. Наиболее часто в ZIP используется алгоритм сжатия Deflate. Формат был создан в 1989 году Филом Кацем и реализован в программе PKZIP компании PKWARE в качестве замены формату архивов ARC Тома Хендерсона. Формат ZIP поддерживается множеством программ, в том числе операционными системами Microsoft Windows (с 1998 года) и Apple Mac OS X (с версии 10.3). Многие свободные операционные системы также имеют встроенную поддержку ZIP-архивов.

Архивы ZIP обычно хранятся в виде файлов с расширением «.zip» или «.ZIP» и используют MIME-типapplication/zip.. Для создания ZIP-архивов и извлечения (распаковки) содержащихся в них файлов могут использоваться специальные утилиты, например терминальные PKZIP и PKUNZIP или графические WinZip, WinRAR, Info-ZIP, 7-Zip, PeaZip и многие другие. При необходимости ZIP-архив может быть объединён с модулем-распаковщиком в единый исполняемый файл (так называемый SFX-архив).

История

В начале 1980-х годов развивались BBS и FidoNet, и компания Software Enhancement Associates (SEA) придумала формат сжатия ARC, основанный на кодах Хаффмана. Программа распространялась по модели shareware, при этом зарегистрировавшемуся поставлялись исходные тексты.

Программист Фил Кац написал свои программы для работы с такими архивами — PKARC и PKXARC. Работали они вдесятеро быстрее ARC (движок был написан на ассемблере), стоили дешевле, последняя была распаковщиком и распространялась бесплатно. Программы получили такой успех, что Кац бросил работу и основал компанию PKWARE.

SEA засудили Каца за плагиат, при этом онлайн-общественность была против — казалось, что они задним числом делают формат ARC проприетарным и «Голиаф» судит «Давида» (на поверку обе компании состояли из нескольких человек). Оказалось, что в исходном тексте Каца были те же орфографические ошибки, что у SEA. В результате пришли к такому соглашению: Кац платит более 60 тыс. долларов, отчисляет процент от всех будущих продаж ПО для ARC, делает окончательную программу PKPAK и переходит на новый формат.

Так и появился формат ZIP. Название «zip» (со значением «быстро двигаться») было предложено другом Каца, Робертом Махони (Robert Mahoney). Таким названием они подразумевали, что их приложение быстрее ARC и других архиваторов того времени. Наиболее ранняя известная версия спецификации формата ZIP — .ZIP File Format Specification — была опубликована как часть поставки PKZIP 0.9 в файле APPNOTE.TXT в 1989 году. При этом Кац пообещал, что любой может свободно писать свои реализации.

Репутация Каца как «хорошего парня» быстро сделала ZIP основным форматом архивов на BBS. А SEA не оправилась от плохого пиара и была свёрнута в 1992 году.

История версий

У каждой спецификации формата ZIP есть свой собственный номер, который может не совпадать с номерами версий PKZIP (особенно это справедливо для PKZIP 6 и более новых версий). PKWARE постоянно добавляет возможности в свой формат, но новая версия формата становится доступной только при выходе следующего старшего выпуска программы PKZIP.


Утилита WinZip (начиная с версии 12.1) использует файловое расширение .zipx для ZIP-архивов с современными методами сжатия. В ZIPX в дополнение к классическому Deflate могут применяться методы BZip, LZMA, PPMd, JPEG и WavPack. По этой причине файлы ZIPX могут не распознаваться классическими утилитами распаковки ZIP, в которых реализован лишь метод Deflate.

Структура

ZIP-файлы представляют собой архивы, хранящие несколько файлов. Составляющие архив файлы могут быть сжаты различными способами, в том числе, сохранены без сжатия. Сжатие файлов внутри архива независимо, что позволяет легко извлекать их или добавить новые, без необходимости распаковки или перепаковки всего архива. Такая возможность является явным преимуществом по сравнению с форматом сжатых tar-файлов, которые не допускают простой обработки содержимого с произвольным доступом.

В конце ZIP-файла располагается специальная секция, называемая каталогом. В нем хранится список файлов, находящихся в ZIP архиве, и данные о местонахождении каждого сжатого файла внутри архива. С использованием данных каталога приложения могут быстро получить полный список файлов из архива, не читая весь ZIP-архив. Файл ZIP-архива также может включать дополнительные данные, не связанные с хранением сжатых данных. В частности, эта возможность позволяет создавать самораспаковывающиеся архивы (SFX), состоящие из приложения-распаковщика и сжатых данных. Такие архивы начинаются с программного кода и распознаются операционной системой в качестве исполняемого файла. При запуске приложение находит ZIP-архив и его каталог и распаковывает файлы, что может быть удобным для передачи архивов пользователям, не имеющим установленных приложений для работы с форматом ZIP. Так как многие приложения распознают формат ZIP по наличию каталога в конце файла, становится также возможным применить простейший стеганографический прием для скрытия архива, добавив архив вслед за каким-либо безобидным файлом, например изображением формата GIF и поменяв расширение файла (по аналогии с так называемым методом «RARJPG»). Большинство приложений отобразит изображение, проигнорировав архив как незначимые мусорные данные, тогда как получатель файла сможет открыть архив после восстановления расширения «.ZIP».

Формат .ZIP использует 32-битный алгоритм CRC для контроля целостности. Также файлы архивов включают в себя две копии каталога архива в целях повышения защиты файлов от порчи данных в процессе передачи или хранения.

ZIP сегодня

В настоящее время формат ZIP считается общепризнанным форматом для многих приложений, включающих функции сжатия, резервного копирования и обмена данными. Наряду с большим количеством утилит, работающих с ZIP-файлами из командной строки, в середине 1990-х годов появились и графические программы для работы с ними. Поддержка формата ZIP включена во множество современных операционных систем.

На текущий момент существует ряд алгоритмов сжатия данных, выигрывающих у ZIP и в скорости, и в степени упаковки, и в дополнительных возможностях. Тем не менее, ZIP по-прежнему остаётся популярным методом сжатия данных.

Множество конкурирующих архиваторов, помимо своего собственного формата, также поддерживает формат ZIP.

Этот способ сжатия также широко используется в других программах и даже в некоторых форматах файлов. Например, файлы *.odt и *.docx — это в действительности ZIP-архивы, содержащие в себе XML-файлы разметки страницы и дополнительные ресурсы (например, изображения). Также ZIP-алгоритм может использоваться в распространённом файловом формате изображений − TIFF.

Существуют сторонние архиваторы, создающие ZIP-архивы с методом сжатия Deflate, но с большей степенью сжатия, чем у оригинальных утилит. Среди них — 7-Zip и модифицированный Кеном Сильверманом архиватор kzip.

Восстановление ZIP-архивов

Поскольку формат ZIP не поддерживает специальных данных для восстановления (в отличие от, например, RAR), следует помнить, что при повреждении ZIP-архива можно восстановить только его структуру (то есть сделать вновь доступным оглавление архива), но восстановить данные, пострадавшие из-за повреждения, не удастся. Для восстановления повреждённых ZIP-архивов существуют специализированные утилиты, например, бесплатные:

  • Object Fix Zip
  • DiskInternals ZIP Repair