Java/יוניקוד
מראה
< Java
ניווט בנושא יסודות השפה
|
שפת Java משתמשת במערכת קידוד יוּנִיקוֹד (Unicode) לצורך קידוד הטקסט ועיבודו.
לפי ויקיפדיה, יוניקוד הוא תקן בין־לאומי לייצוג טקסט במערכות מחשב. התקן מגדיר מערכת תווים המקיפה את כל מערכות הכתב הנמצאות כיום בשימוש פעיל בשפות העולם, וכן מערכות כתב ותווים נוספים שבהם נעשה שימוש בתחומים מדעיים וטכניים, כגון מתמטיקה ובלשנות.[1]
ליוניקוד שיטות קידוד רבות, מהנמצאות בשימוש רב ביותר ביניהן היא UTF-8, המאפשרת קידוד של תו בודד באמצעות אחד עד ארבעה בתים. אולם מערכות רבות משתמשות בשיטות קידוד אחרות, כגון UTF-16 ו־UTF-32. שפת Java משתמשת ב־UTF-16 עבור אחסון תווים ומחרוזות, לכן גודלו של תו (Char) הינו 2 בתים.