Српски текст

Унесите српски текст у горњи прозор, па притисните „Конвертуј у Уникод“. У доњем прозору преузмите резултат са „copy-paste“. Ако не ради, инсталирајте програм JavaSkript!









Слово у Уникод формату почиње знаком „&“ за којим следи „#“ па децимални број и завршава са „;“.


Кодови UTF-8

Унесите полазну децималну вредност Уникода за 112 следећих кодова. Српска ћирилична слова су од 1026 до 1119.

Децимално:


Комплетна хексадецимална листа кодова UTF-8 ⋙

ASCII, ANSI

Уникод је стандард за приказ и руковање текстом из већине светских писама. Када дефиниција азбуке (charset) датог програма не садржи неке посебне знакове, тамо где требају допуњавамо их неким уникодом.

Сваки знак писма кодира се бројем n, овде децималним, који се у програм уноси као „&#n;“. Слова енглеског алфабета и одговарајући помоћни знакови у ASCII коду и Уникоду су исте вредности. Посебна латинична слова (č, ć, đ, š и ž, мала и велика) имају троцифрене декадне вредности, док су свим словима српске ћирилице придружени четвороцифрени бројеви од 1026 до 1119, хексадецимално од 402x до 45fx. Нису сви бројеви искориштени, нити они тачно следе азбуку.

Аски код (ASCII — American Standard Code for Information Interchange) представља слова, односно знакове, децималним ознакама од 32 до 127 (хексадецимално од 20x до 7fx). На та ANSI (American National Standards Institute), тзв. Windows-1252, додаје и слова кодирана од броја 128 до 255 (од 80x до ffx). Иначе, UTF-8 не користи вредности од 128 до 159 (до 9fx).


The top button deletes both windows. In the upper window enter the Serbian text, press the button below and from lower window take (copy-paste) the Unicode.

While the letters of English alphabet are coded by two digits, the same as ASCII, the Serbian Cyrillic and special Latin letters are coded by 3-4 decimal digits n. It enters as &#n; in the program text.

Уникод

UTF-8 (Unicode Transformation Format) је код нас најпопуларнији систем уникодације, јер обухвата сва нама потребна ћирилична и латинична слова.


UTF-8 is the most popular unicode system in our country, because it includes all the Serbian Cyrillic and Latin letters we need.

Complete hexadecimal list for UTF-8 ⋙