פייתון/פייתון גרסה 3/תווי יוניקוד

מתוך ויקיספר, אוסף הספרים והמדריכים החופשי

יוניקוד הן רצף של מחרוזות שאותן פייתון יודע לתרגם לתווים מוכרים.

בכדי ליידע את פייתון כי ברצונו שתתרגם את המחרוזת לתו היוניקוד המתאים נרשום: '<המספר של התו>u\'u

דוגמאות[עריכה]

>>> u'\u05D0'
'א'
>>> u'\u05D1'
'ב'
>>> u'\u05D3'
'ד'

טווחים של יוניקוד[עריכה]

כפי שניתן לראות היוניקוד במחשב ממוספר בסדר רציונלי. להלן פירוט על טווחי היוניקודים הקיימים.

פירוט טווחים של יוניקוד
טווח בלוק
0000-007F לטינית בסיסית
0080-00FF השלמה של Latin-1
0100-017F לטינית מורחבת א'
0180-024F לטינית מורחבת ב'
0250-02AF אלפבית הפונטי הבינלאומי
02B0-02FF מרווח
0300-036F סימנים מבחינים מתחברים
0370-03FF יוונית וקופטית
0400-04FF קירילית
0500-052F השלמה של קירילית
0530-058F ארמנית
0590-05FF עברית
0600-06FF ערבית
0700-074F סורית
0780-07BF ת'אנה
0900-097F דוונגרי
0980-09FF בנגלית
0A00-0A7F גורמוכי
0A80-0AFF גוג'ראטי
0B00-0B7F אורייה
0B80-0BFF טאמילית
0C00-0C7F טלוגו
0C80-0CFF קאנדה
0D00-0D7F מלאיאלאם
0D80-0DFF סינהלה
0E00-0E7F תאית
0E80-0EFF לאו
0F00-0FFF טיבטית
1000-109F מיאנמר (בורמזית)
10A0-10FF גאורגית
1100-11FF ג'אמו (יסודות מתחברים) של הנגול (קוריאנית)
1200-137F אתיופית
13A0-13FF צ'רוקי
1400-167F קנדיות ילידיות מאוחדות
1680-169F אירי עתיק)
16A0-16FF רונית
1700-171F טאגאלוג
1720-173F הנונואו
1740-175F בוהיד
1760-177F טגבאנווה
1780-17FF ח'מר
1800-18AF מונגולית
1900-194F לימבו
1950-197F טאי לה
19E0-19FF סמלים לח'מר
1D00-1D7F פונטיות
1E00-1EFF לטינית מורחבת נוספת
1F00-1FFF יוונית מורחבת
2000-206F פיסוק כללי
2070-209F תווים עיליים ותחתיים
20A0-20CF סמלי מטבע
20D0-20FF סימנים מבחינים מתחברים בשביל סמלים
2100-214F סמלים דמויי אותיות
2150-218F צורות מספרים
2190-21FF חצים
2200-22FF אופרטורים מתמטיים
2300-23FF סימנים טכניים שונים
2400-243F תמונות של תווי בקרה
2440-245F סימנים לסורקי כתב (OCR)
2460-24FF סימנים אלפאנומריים מוסגרים
2500-257F סרטוט קופסאות
2580-259F יסודות של בלוקים
25A0-25FF צורות הנדסיות
טווח בלוק
2600-26FF סמלים שונים
2700-27BF קישוטים
27C0-27EF מתמטיים שונים א'
27F0-27FF השלמה של חצים א'
2800-28FF תרשימי ברייל
2900-297F השלמה של חצים ב'
2980-29FF סמלים מתמטיים שונים ב'
2A00-2AFF השלמה של סמלים מתמטיים
2B00-2BFF סמלים וחצים שונים
2EB0-2EFF השלמה של שורשי כתב סיני
2F00-2FDF שורשי קנגשי
2FF0-2FFF תווים לתיאור אידיאוגרפי
3000-303F סינית, יפנית וקוריאנית
3040-309F הירגאנה (הברות יפניות)
30A0-30FF קטקאנה (הברות יפניות)
3100-312F בופומופו (תווים ללימוד סינית)
3130-318F ג'אמו של הנגול לתאימות
3190-319F קאנבון
31A0-31BF בופומופו מורחב
31F0-31FF הרחבות פונטיות לקטקאנה
3200-32FF תווים וחודשים מוסגרים לסינית, יפנית וקוריאנית
3300-33FF תאימות לסינית, יפנית וקוריאנית
3400-4DBF אידיאוגרמות סיניות מאוחדות, הרחבה א'
4DC0-4DFF יִיגִ'ינְג
4E00-9FFF אידיאוגרמות סיניות מאוחדות
A000-A48F הברות יי
A490-A4CF שורשי יי
AC00-D7AF הברות הנגול (קוריאנית)
D800-DB7F ממלאי מקום גבוהים (ראו UTF-16)
DB80-DBFF ממלאי מקום גבוהים לשימוש פרטי
DC00-DFFF ממלאי מקום נמוכים
E000-F8FF אזור שימוש פרטי
F900-FAFF אידיאוגרמות סיניות לתאימות
FB00-FB4F צורות תצוגה לאלפבית
FB50-FDFF צורות תצוגה לערבית א'
FE00-FE0F בוררי צורות משנה
FE20-FE2F חצאי סימנים מתחברים
FE30-FE4F צורות תאימות לסינית, יפנית וקוריאנית
FE50-FE6F צורות משנה קטנות
FE70-FEFF צורות תצוגה לערבית ב'
FF00-FFEF צורות לאורך חצוי ואורך מלא
FFF0-FFFF מיוחדים
10000-1007F הברות של כתב ליניארי B
10080-100FF אידיאוגרמות של כתב ליניארי B
10100-1013F מספרים אגאיים
10300-1032F איטאלית עתיקה
10330-1034F גותית
10380-1039F אוגריתית
10400-1044F מורמוני)
10450-1047F שאוויאנית (הכתב שהמציא ג'ורג' ברנרד שו)
10480-104AF אוסמאניה
10800-1083F הברות קפריסאיות
1D000-1D0FF מוזיקליים ביזנטיים
1D100-1D1FF סמלים מוזיקליים
1D300-1D35F סמלי טאי שואן ג'ינג
1D400-1D7FF סמלים מתמטיים אלפאנומריים
20000-2A6DF אידיאוגרמות סיניות מאוחדות, הרחבה ב'
2F800-2FA1F השלמה של אידיאוגרמות סיניות לתאימות
E0000-E007F תגים
E0100-E01EF השלמה של בוררי צורות משנה
F0000-FFFFF אזור שימוש פרטי משלים א'
100000-10FFFF אזור שימוש פרטי משלים ב'