Homoglif
Artikel ini memiliki beberapa masalah. Tolong bantu memperbaikinya atau diskusikan masalah-masalah ini di halaman pembicaraannya. (Pelajari bagaimana dan kapan saat yang tepat untuk menghapus templat pesan ini)
|
Dalam ortografi dan tipografi, homoglif adalah salah satu dari dua atau lebih grafem, karakter, atau glif dengan bentuk yang tampak identik atau sangat mirip dalam fon, tetapi mungkin memiliki arti yang berbeda. Penunjukan juga diterapkan pada urutan karakter yang berbagi properti ini.
Pada tahun 2008, Unicode Consortium menerbitkan Technical Report #36[1] pada berbagai masalah yang berasal dari kemiripan visual karakter baik dalam skrip tunggal, maupun kemiripan antar karakter dalam skrip yang berbeda.
Sebuah contoh penting dari kebingungan homoglif muncul dari penggunaan ⟨y⟩ untuk mewakili ⟨þ⟩ (thorn) ketika mengatur teks bahasa Inggris yang lebih tua dalam tipografi yang tidak mengandung karakter terakhir. Ini telah menyebabkan fenomena di zaman modern seperti Ye olde shoppe, menyiratkan secara tidak benar bahwa kata the sebelumnya ditulis ye /jiː/ daripada þe.
Contoh simbol homoglif adalah (a) diaresis dan umlaut (keduanya sepasang titik, tetapi dengan arti yang berbeda, meskipun dikodekan dengan kode titik dan (b) tanda hubung dan tanda minus (keduanya adalah garis horizontal pendek, tetapi dengan arti yang berbeda, meskipun sering disandikan dengan titik kode yang sama). Di antara angka dan huruf, angka 1 dan huruf kecil l selalu dikodekan secara terpisah tetapi dalam banyak jenis huruf yang diberikan bentuk yang sangat serupa, dan digit 0 dan huruf kapital O selalu dikodekan secara terpisah tetapi dalam banyak tipografi diberikan glif yang sangat mirip. Hampir setiap contoh pasangan karakter homoglif berpotensi dapat dibedakan secara grafis dengan glif yang dapat dibedakan dengan jelas dan titik kode terpisah, tetapi hal ini tidak selalu dilakukan. Typeface yang tidak secara tegas membedakan homoglif satu/el dan nol/oh dianggap tidak sesuai untuk menulis formula, URL, kode sumber, ID, dan teks lainnya di mana karakter tidak selalu dapat dibedakan tanpa konteks. Font yang membedakan glif dengan nol terpotong, misalnya, lebih disukai untuk penggunaan tersebut.
Istilah homograf kadang-kadang digunakan sinonim dengan homoglif, tetapi dalam pengertian linguistik biasa, homograf adalah kata yang dieja sama tetapi memiliki arti berbeda, properti kata, bukan karakter.
(Sinoglif adalah glif yang terlihat berbeda tetapi memiliki arti yang sama. Sinoglif juga dikenal secara informal sebagai varian tampilan.)
Referensi
[sunting | sunting sumber]- ^ "UTR #36: Unicode Security Considerations". www.unicode.org.
Pranala luar
[sunting | sunting sumber]- https://www.unicode.org/Public/security/latest/confusables.txt - recommended confusable mapping for IDN.