phd_ru: (Linux)

pkunzip.zip

[personal profile] phd_ru 2015-12-21 12:55 pm (UTC)(link)
В zip бывает что-то, кроме cp866?! Ни разу не встречал.

Я себе вот такие утилитки написал: http://phdru.name/Software/Python/misc/

Re: pkunzip.zip

[identity profile] beldmit.livejournal.com 2015-12-21 12:58 pm (UTC)(link)
Не знаю я, что там бывает. Но что вчерашние купленные zip-архивы mp3 Олдей с русскими буквами внутри выдали крокозябрицу под Linux - подтверждаю.
phd_ru: (Linux)

RE: Re: pkunzip.zip

[personal profile] phd_ru 2015-12-21 01:03 pm (UTC)(link)
Естественно, будут крокозябры — cp866 надо перекодировать, unzip сам этого не делает. Я для того и написал свой unzip.py.
yurikhan: (Default)

Re: pkunzip.zip

[personal profile] yurikhan 2015-12-21 01:20 pm (UTC)(link)
По стандарту, там должен быть либо 437, либо UTF-8, выбирается одним битом в заголовке каждого файла. Но по истерическим перчинам при нулевом значении этого бита в имени может быть любая ересь.
ext_605364: geg MOPO4 (geg_MOPO4)

RE: pkunzip.zip

[identity profile] gegmopo4.livejournal.com 2015-12-21 04:19 pm (UTC)(link)
В ZIP бывает только cp437 и utf-8.
phd_ru: (Linux)

RE: pkunzip.zip

[personal profile] phd_ru 2015-12-21 05:06 pm (UTC)(link)
— Чем отличается теория от практики?
— Теоретически, нет никакого отличия.

:-D
ext_605364: geg MOPO4 (geg_MOPO4)

RE: pkunzip.zip

[identity profile] gegmopo4.livejournal.com 2015-12-21 09:53 pm (UTC)(link)
Да-да, именно это я и хотел сказать. :->

[identity profile] anonim-legion.livejournal.com 2015-12-28 12:56 pm (UTC)(link)
Что же бывает в японском zip?
phd_ru: (Linux)

[personal profile] phd_ru 2015-12-28 02:07 pm (UTC)(link)
Я кроме русских, ни с какими zip'ами не сталкиваюсь, так что я просто зарядил cp866 прямо в код (un)zip.py. Столкнусь — сделаю кодировку параметром.
ext_613079: Default userpic (Бритый небритый)

[identity profile] shaplov.livejournal.com 2015-12-21 01:03 pm (UTC)(link)
Аааа!!! yes!

Еще для rar'а такой хочу!
phd_ru: (Linux)

[personal profile] phd_ru 2015-12-21 02:26 pm (UTC)(link)
А в rar бывает не UTF-8?!
phd_ru: (Linux)

[personal profile] phd_ru 2015-12-21 02:33 pm (UTC)(link)
Офигеть!

[identity profile] beldmit.livejournal.com 2015-12-21 02:41 pm (UTC)(link)
А что мешает, в архивах, созданных в старые времена?

В новые, честно говоря, я не понимаю, зачем rar-ом вообще пользоваться.
phd_ru: (Linux)

[personal profile] phd_ru 2015-12-21 03:00 pm (UTC)(link)
Там разве не с самого начала был unicode?

Upd. Нет, с версии формата 2.9 UTF-16 little endian, а с 5.0 UTF-8.
Edited 2015-12-21 15:12 (UTC)