UTF-8 je štandardná metóda kódovania znakov na ukladanie v Unicode, ktorá je vyvinutá na zobrazovanie rôznych jazykov.
Vzhľadom k tomu, že Unicode a UTF-8 boli vyvinuté po roku 1990, počiatočná verzia formátu ZIP (vyrobená v 80. rokoch) nepodporovala UTF-8. Pretože sa formát ZIP stal štandardným archívnym formátom a vyžadovala sa podpora Unicode, bolo zavedených niekoľko spôsobov, ako spracovať reťazce UTF-8 na súboroch ZIP.
Bandizip podporuje dva z nich; jedným zo spôsobov je prevod súborov na UTF-8 a druhým je ukladanie ďalších názvov súborov UTF-8 do zvláštneho poľa hlavičky, zatiaľ čo pôvodné sa ukladajú do MBCS.
Bandizip ukladá názvy súborov do súborov ZIP a prevádza ich do UTF-8. Jedná sa o štandardný spôsob ukladania súboru definovaný APPNOTE, napriek tomu niektoré archivátory občas nedokážu rozpoznať súbory ZIP, alebo ich nesprávne spracovať a spôsobiť ich poškodenie. APPNOTE
Bandizip ukladá ďalšie názvy súborov UTF-8 do ďalšieho poľa hlavičky formátu ZIP, zatiaľ čo pôvodné ukladá do MBCS. Túto metódu tiež APPNOTE definuje ako „Info-ZIP Unicode Path Extra Field.“ Pretože používa ďalšie pole na ukladanie názvov súborov UTF-8, veľkosť súboru by bola o desiatky bajtov väčšia ako pôvodná. Avšak pôvodné názvy súborov sú uložené v MBCS a preto súbory sú bezpečnejšie a kompatibilnejšie.
Pretože väčšina archivátorov (napríklad 7zip, Winrar a Winzip) podporuje túto funkciu, zabráni poškodeniu vašich súborov v OS s iným jazykom systému.
Obrázok nižšie ukazuje rozdiel medzi používaním a nepoužívaním tejto funkcie pri odosielaní súboru ZIP komprimovaného v kórejskom OS do japonského OS.
Formáty TAR a TGZ sú archívne formáty používané hlavne v systéme Unix (ktorý používa názvy súborov UTF-8). Táto funkcia umožňuje rozbaliť súbory TAR / TGZ v systéme Unix bez problémov s názvom súboru.
POZNÁMKA: Niektoré aplikácie vo Windows môžu zlyhať pri správnom dekódovaní UTF-8 formátov TAR / TGZ.