![]() |
Šiam straipsniui ar jo daliai reikia daugiau nuorodų į patikimus šaltinius. Jūs galite padėti Vikipedijai įrašydami tinkamas išnašas ar nuorodas į patikimus šaltinius. |
Unikodas (angl. Unicode) – standartas, apibrėžiantis beveik visų kalbų abėcėlių bei papildomų rašto ženklų kodavimą kompiuteriuose.
Unikodas sukurtas siekiant pakeisti anksčiau naudotas įvairias ribotas simbolių koduotes. Pirmoji standarto versija (1.0) sukurta 1995 metais, nuo tada standartas beveik kasmet atnaujinamas – 2022 metais išleista jau 15.0.0 jo versija[1]. Šiuo metu Unikodas yra dominuojantis standartas pritaikant kompiuterines programas daugeliui kalbų. Unikodo palaikymas numatytas moderniuose standartuose (kaip XML), programavimo kalbose bei operacinėse sistemose. Šiuo metu standartas suteikia galimybę aprašyti iki 1 112 064 ženklų, o aprašo 149 186 ženklus.
Unikode kiekviena pozicija atitinka tik vieną konkretų ženklą, tačiau kai kuriais atvejais vienam ženklui skiriama keletas pozicijų. Pirmosios 256 pozicijos yra identiškos ISO 8859-1 koduotės ženklams, kad būtų paprastesnis keitimas iš egzistuojančių Vakarų Europos kalbų tekstų. Unikodo standarte numatyti ne tik raidės ir simboliai, bet ir pagalbiniai kodai nusakyti simbolio savybėms, teksto krypčiai bei kitoms reikmėms.
Unikode numatyta kombinacinių sekų galimybė, kai vienas vaizduojamas simbolis koduojamas dviejų ar daugiau kodų seka. Kai kurios raidės su diakritiniais ženklais gali būti užrašomos ir vienu kodu. Pavyzdžiui, kirčiuotoji raidė a (á) gali būti užrašoma tiek vienu Unikodo kodu (U+0301), tiek dviejų seka (U+0061, U+0301). Standarto požiūriu, abiem šiais būdais užrašyta informacija laikoma lygiaverte.
Toliau plėtojant standartą, laikomasi nuostatos nesuteikti atskirų kodų ženklams, kurie gali būti užrašyti kombinacinėmis sekomis. Siekiant supaprastinti darbą su dažniau pasitaikančiomis kombinacinėmis sekomis (pavyzdžiui, tokių duomenų perkodavimą iš kitų koduočių ar į jas), 2005-aisiais metais (4.1 versijoje) standarte įvesta vardinių sekų (named character sequences) sąvoka.[2]