Loading...
Istilah

Unicode

Definisi Unicode – Unicode adalah standar pengkodean karakter yang universal. Ini mendefinisikan cara karakter individu yang diwakili dalam file teks, halaman web, dan jenis-jenis dokumen.

Tidak seperti ASCII, yang dirancang untuk mewakili karakter hanya bahasa Inggris dasar, Unicode dirancang untuk mendukung karakter dari semua bahasa di seluruh dunia. Karakter ASCII standar yang ditetapkan hanya mendukung 128 karakter, sedangkan Unicode dapat mendukung sekitar 1.000.000 karakter. Sementara ASCII hanya menggunakan satu byte untuk mewakili masing-masing karakter, Unicode mendukung hingga 4 byte untuk masing-masing karakter.

Ada beberapa jenis pengkodean Unicode, meskipun UTF-8 dan UTF-16 adalah yang paling umum. UTF-8 telah menjadi pengkodean karakter standar yang digunakan di Web dan juga encoding default yang digunakan oleh banyak program perangkat lunak. Sementara UTF-8 mendukung hingga empat byte per karakter, itu akan menjadi tidak efisien menggunakan empat byte untuk mewakili karakter yang sering digunakan. Oleh karena itu, UTF-8 hanya menggunakan satu byte untuk mewakili karakter bahasa Inggris umum. Eropa (Latin), Ibrani, dan huruf Arab yang diwakili dengan dua byte, sementara tiga byte digunakan untuk Cina, Jepang, Korea, dan karakter Asia lainnya. karakter Unicode tambahan dapat direpresentasikan dengan empat byte.

Tagged
Leave a Reply

Your email address will not be published. Required fields are marked *