ארכיטקטורת מידע/ארגון מידע
פרק זה יעסוק בתכנון ומבנה המידע באתרי אינטרנט חיצוניים (web sites) ובאתרים פנימיים (intranet). מטרת הפרק היא לספק את הבסיס אשר בעזרתו נוכל להתמודד עם פרויקטים מאתגרים של ארגון מידע. מערכות ארגון מורכבות משילוב של תכנון ארגוני (סכמתי) ומבנה ארגוני. תכנון ארגוני מגדיר את המאפיינים של פריטי מידע משותפים ויוצר השפעה לוגית על השיוך לקבוצות של אותם פריטים. מבנה ארגוני מגדיר את הקשרים בין פריטי המידע לחלוקה לקבוצות. לפני שמתחילים יש להבין את ההקשר בין ארגון מידע לפיתוח אתרי אינטרנט. ארגון הוא מונח קרוב לניווט, תיוג ומפתוח. מבנה ארגוני היררכי של אתר אינטרנט משמש לרוב כמערכת הראשית לניווט באתר. מפתוח ידני (metadata tagging) הוא כלי לארגון פריטי מידע בקבוצות עד לרמה הנמוכה ביותר. על אף הקשרים החזקים בין הדברים, יהיה אפשרי ושימושי יותר להפריד בין עיצוב המערכת לארגון מידע לבין הבסיס למערכות ניווט ותיוג. כך נוכל להתרכז במשימת החלוקה לקבוצות ונוכל לבנות אתר טוב יותר.
שיטות לתכנון ארגוני
[עריכה]אנו משתמשים ביום יום במגוון רב של שיטות לתכנון ארגוני, אשר חלק מהן גורם לתסכול. שיטת הארגון של ספר הטלפונים היא שיטה מדויקת אלפביתית ואילו שיטת הארגון בסופר מרקט היא שיטה לא מדויקת.
סכימות ארגון מדוייקות
[עריכה]אלפביתי
[עריכה]השיטה האלפביתית היא השיטה הראשית לארגון מידע באנציקלופדיות ומילונים. ניתן למצוא את שיטת המפתוח האלפביתי כמעט בכל הספרים. ארגון פריטים על פי אותיות האלף בית משמש ספרי טלפון, קטלוג עיוני של חנויות וספריות. ניתן למצוא מידע מאורגן אלפביתית לפי שם משפחה, מוצר או שירות ולפי מחלקה ומבנה.
דוגמא לארגון על פי שם פריט מידע
כרונולוגי
[עריכה]חלק מסוים של פריטי מידע מאורגנים בסדר כרונולוגי. לדוגמא ארכיון של ידיעות חדשותיות יאורגנו בסדר כרונולוגי. על אף שהתאריך של הידיעה החדשותית חשוב ביותר, ייתכן שחלק מהמשתמשים ירצו לעיין בידיעות על פי קטגוריה אחרת כמו נושא, מיקום גיאוגרפי או מילת חיפוש. לעיתים תכופות נדרש שילוב של השיטות השונות לארגון פריטי מידע. ספרי היסטוריה, ארכיון מגזינים, יומנים ומדריכי טלביזיה נוטים להיות מאורגנים בסדר כרונולוגי. ארגון בסדר כרונולוגי יהיה פשוט וקל לתכנון ולשימוש, כל עוד ישנה אחידות בעניין ההתרחשות של האירוע.
גיאוגרפי
[עריכה]מיקום הוא לעיתים תכופות תכונה מזהה עבור פריטי מידע. בד"כ המידע יהיה לגבי חדשות או מזג האוויר באזורנו. סוגיות בנושאים פוליטיים, חברתיים וכלכליים מושפעות ממיקום גיאוגרפי. במקומות בהם הגבולות ברורים, שיטת הארגון הגיאוגרפי גם היא תהיה קלה ופשוטה לתכנון ולשימוש.
סכימות ארגון דו משמעיות
[עריכה]ניתן לחלק את המידע לקטגוריות שאין להן הגדרה מדוייקת. הסכימות נוצרו עקב בסיס דו משמעי של מילים בשפה. למשל "עגבניה", ניתן לסווג כירק או כפרי. קיימים שלושה סוגים בסיסיים של סכימות ארגון דו משמעיות. סיווג על פי מחבר, כותרת או נושא. מחבר וכותרת הן השיטות הכי קלות ליצירה ולשימוש. בסכימה לפי סדר אלף-בית, המילים מסודרות לפי אות ראשונה בלי שום משמעות המחברת ביניהן. במידה והמיון לפי סכימות אחרות יהיה יותר מדוייק, נקבל תוצאות יותר עשירות. הסיבה לשימוש בסכימות אלה היא מאוד פשוטה, מכיוון שלא תמיד יודעים מה מחפשים ולא ידוע אילו תוצאות נקבל לבסוף. לעיתים עולות תוצאות שלא צפינו אותן והן יכולות להוסיף הרבה ידע.
ארגון לפי נושא – TOPIC
[עריכה]דוגמא לסכימה מסוג זה נעשית בדפי זהב ובעיתונים. בעת יצירת סכימת TOPIC חשוב מאוד לארגן אותה בצורה יעילה בכדי שהמשתמש יוכל לאתר במהירות את התכנים הנצרכים לו.
ארגון לפי קהל יעד – AUDIENCE
[עריכה]סוג זה של סכימה יהיה יעל ביותר באתרי אינטרנט שאת התוכן שלהם ניתן לסווג באופן החלטי לקהלי יעד שונים ואשר המבקר בהם עושה ביקורים חוזרים באתר. ולכן ניתן לאפשר למבקר לעשות בחירה שתתאים את התוכן שיוצג באתר לקהל היעד אליו הוא משתייך ולקבע את הבחירה. סיווג על פי קהל יעד יכול לסייע גם באבטחת המידע שהאתר מציג לקהל יעד שמורשה להיחשף לתוכן ברמת סיווג זו או אחרת.
ארגון לפי משימה – TASK
[עריכה]משימה המכוונת על ידי סכימות המארגנות תכנים ואפליקציות בתוך מכלול תהליכים, פונקציות או מטלות. במילים אחרות, פעולות אינדיבידואליות מסודרות בתוך תפריט. לדוגמא, EDIT, INSERT, FORMAT. קשה מאוד למצוא אתר המבוסס רק על סכימת TASK.
ארגון לפי השאלה רעיונית-לשונית – METAPHOR
[עריכה]הצגת נושא לא מוכר על ידי הקשר לנושא יותר מוכר בקרב הכלל. ניתן לראות דוגמא לכך בשולחן העבודה של המחשב, כאשר מוצג בו המקום לפריטים שנמחקו כסל מחזור. כדי שארגון מסוג זה יעבוד בצורה הטובה ביותר, יש לעשות שימוש מושכל בקישורים ההשאלתיים כדי שנושא המקורי שהושאל לא יגרום דווקא לבלבול.
ארגון לפי סכימות משולבות – HYBRID
[עריכה]שילוב של סכימות שונות. ארגון מסוג זה עלול לעיתים לגרום לבלבול. עם זאת, בהרבה אתרים משתמשים בשיטת ארגון זו באופן יעיל בעמוד הראשי ובגלישה הגלובאלית באתר. קשה להחליט מה היא השיטה הכי יעילה ליצירת אתר אינטרנט, לכן אפשר להציג בנפרד סכימות שונות כדי לאפשר גמישות ולמנוע בלבול.
שלושת המודלים הארגוניים
[עריכה]לפני שמתחילים ליצור אתר אינטרנט צריך לתכנן מה המטרה של האתר, למי מיועד ואילו תכנים יהיו כי דווקא בגללם נחליט באיזה סכמה נשתמש. האפשרויות הן:
- עץ או היררכיה. מהעמוד הראשי (שורש) נפתחים ענפים שכוללים עמודי ווב (עלים)
- מבנה קווי. מהעמוד הראשי יש רצף עמודים כמו בספר
- מבנה רשתי. יש קשר בין העמודים כמו ברשת, אין סדר היררכי.
המודל הלוגי
[עריכה]קשרים יכולים ליפול לתוך שלוש קטגוריות כלליות:
- קשרי "אחד לאחד" או מבנה קווי.
- קשרי "אחד לרבים" או מבנה היררכי.
- קשרי "רבים לרבים" או מבנה רשתי.
כאשר קשרים אלו נמצאים בין מקרים של אותה ישות, הם נקראים "יחסים רקורסיביים" (recursive relationships).
מבנה היררכי
[עריכה]
היררכיה: היא קולקציה של הורים-בנים מקושרים. מתחילים מקטגוריה לתת-קטגוריות שגם בהן יש תת-קטגוריות. כשעובדים עם היררכיה חייבים לשקול בין רוחב לעומק.
רוחב: כמה תת-קטגוריות יש במקום אחד, למשל: אם באתר יש הרבה לינקים מפוזרים שמובילים לדפים מסוימים זה יעזור למשתמשים להגיע ליעד הרצוי, אבל אם הם לא יודעים את היעד הרצוי יכול להביא אותם לאיבוד.
עומק: כמה שכבות או תפריטים צריכים להקליק כדי להגיע למידע השימושי. רצוי להגיע למידע עם שלושה קליקים או פחות. אם ייקח יותר מחמישה קליקים מאבדים את המשתמשים.
בהחלט יתכן, כי הבעיה שהכי קשה לספק לה תמיכה במודל היחסי, היא מידע היררכי. היררכיה לפי וובסטר, הינה "קבוצה של אנשים או נושאים המסודרים על מנת לסווג דרגה, מחלקה, מעמד וכו'. דוגמאות הן מבנים ארגוניים, יחסי עובד - מעביד, ויחסי לקוח אל לקוח.
ישנן שלוש סוגיות הנוגעות למידע היררכי:
- כיצד לייצג אותו לוגית?
- כיצד לעצב זאת פיזית?
- כיצד לכתוב שפת שאילתות מובנית שתנווט אותו?
כמו שקורה לעיתים קרובות, קהילת עיצוב המידע משבחת את הטוהר הלוגי של הפתרון שלה, הלא הוא רקורסיה. קהילת מסדי הנתונים מתקוממת בצדק, מכיוון שפתרון זה גורר בעיות ביצועים רציניות. קהילת ה-SQL יוצאת בטענה שצריך להיות הודיני כדי להוציא את המידע החוצה.
קורא הבקיא לחלוטין ברקורסיה יכול לבחור לסרוק את החלק העוסק במודל לוגי, ולהמשיך לחלק העוסק בישום פיזי.
מבנה קווי
[עריכה]ליניארי: מבנה שיש בו רצף. המבנה הליניארי יכול להיות כרונולוגי, סדרת נושאים מסודרים מהכללי לפרטי או מסודר לפי אלף בית. מבנה כזה רק יכול לתפקד באתרים קטנים. במידה שהסדרה הכלולה במבנה זה נהית מסובכת יותר צריכים מבנה יותר גדול כדי להמשיך להיות מובן.
מבנה רשתי/היפרטקסטואלי
[עריכה]מארגן מידע בבלוקים בעלי תכנים שונים הקשורים ביניהם על ידי סידרת קישורים. מאפשר למשתמש לגלוש חופשית כדי להגיע למידע הרצוי.
קשר ה"רבים לרבים" הרקורסיבי, הנקרא לעתים גם עץ תוצר (פירוט הירארכי של המרכיבים הנדרשים להכנת תוצר עד לרמת התשומות הבסיסיות – Bill of material, או BOM), הוא יותר מורכב. מבנה זה נקרא גם "מודל הקרבה" (adjacency model). לעת עתה, נשאר עם המונח עץ תוצר (BOM). השימוש בו נפוץ. הוא גם מתאר בצורה מפורטת ייצור ממשי של עץ תוצר. אע"פ שניתן להחיל אותו על מספר רב של מצבים רקורסיביים אחרים, עץ תוצר ממשי מהווה דוגמא טובה להבנת הקונספט.
המונח עץ תוצר (BOM) הוטבע במקור בייצור, וכמה ממערכות ייצור מסדי הנתונים הראשונות נקראו BOMP (Bill Of Material Processor) ו-DBOMP (Data Base Bill Of Material Processor).
עץ התוצר מתאר אילו חלקי רכיבים מכילים חלק עליון ולתוך אילו חלקים עליונים הולך חלק רכיב.
המבנה דורש ישות ראשית, כמו למשל ITEM (פריט), וישות אסוציאטיבית, כמו למשל ITEM BOM (פריט עץ תוצר). ה-ITEM מייצג את החלק שמחוץ להקשר. כל הפריטים, ללא קשר לתפקידם ולאסוציאציות הנלוות אליהם, מוצגים לראשונה ב-ITEM. ה-ITEM BOM מפרט את הקשרים הקיימים בין כל פריט לרכיביו. להלן מבנה עץ תוצר טיפוסי.
האם קיים צורך ממשי בקשרי הגומלין המרובים בין שתי הישויות? האם מדובר בדבר לגיטימי?
ב-ITEM BOM, דרושים שני ה-ITEM Nos (מספרי ה-ITEM). ITEM NO (מספר ITEM) אחד מתאר מקרים בגזרת האב, וה-ITEM NO השני מתאר את המקרים בגזרת הצאצא.
שילובם של השניים מתאר את הקשר. כתוצאה מכך, לכל אחד משני ה-ITEM NO תפקיד שונה. ישנם קשרים מרובים בין שתי הישויות.
קשרים מרובים הגיוניים כאשר מתקיים לפחות אחד מהתנאים הבאים:
- חוקי העסק שונים.
- הנקודות העיקריות שונות.
- המקרים שונים.
במקרה זה, המקרים יהיו שונים, מכיוון שנקודה אחת הולכת למקרה האב, והנקודה האחרת למקרה הצאצא. אין זה משנה איזו תכונה נבחרה, ואיזה תפקיד אותה תכונה נבחרה לגלם – אב או צאצא. האב אינו חייב להיות הראשון, והצאצא אינו חייב להיות שני. עם זאת, ברגע שנבחרה, תפקידה של התכונה קבוע. מספר השורות ב-ITEM BOM יהיה זהה למספר החלקים בעץ התוצר. לכל צאצא יכולים אף להיות חלקים המהווים צאצאים שלו. אז ישמשו הם כאבות עם צאצאיהם שלהם ע"מ להרחיב את המבנה.
ניווט עץ התוצר
[עריכה]אם אסופה מנווטת כלפי מטה מכל אב נתון, היא בדרך כלל תיקרא "התפוצצות". ניתן לזהות את כמות החלקים הנדרשת על מנת ליצור אסופה. נוכל לשאול, לדוגמא, מה הם כל הפריטים המרכיבים חלק זה. אם נסתכל לכיוון מעלה מנקודת מבטו של כל צאצא נתון, הדבר יקרא "התכנסות". ניתן לזהות את הכמות הנדרשת בתוך כל אסופה. נוכל לשאול, באילו חלקים נעשה שימוש בחלק זה? יש לציין כי גם עבור ההתפוצצות וגם עבור האסופה, הכמות תלויה בחלק הצאצא הנוכחי (ITEM), במסגרת חלק האב הנוכחי (גם כן – ITEM). במילים אחרות, הכמות תלויה בשילוב של אב וצאצא.
מבנה עץ התוצר, המורכב מהישות הבכירה, כמו ITEM, וישות אסוציאטיבית, כמו ITEM BOM, הוא מבנה נורמאלי לחלוטין.
עץ התוצר הקלאסי מספק את היכולת לנווט מכל אב לכל החלקים המרכיבים אותו. ייתכן ויהיה צורך לנווט ולבצע הרבה תפניות חדות בקשרי אב-צאצא על מנת להגיע לשם, אבל זה בהחלט אפשרי. חשוב לציין דבר אחד אחרון: עץ התוצר הקלאסי מכיל קשרי גומלין רק בין כל אב לצאצאיו הישירים. אחזור (retrieval) עץ התוצר בשלמותו עבור חלק נתון, דורש ניווט דרך רצף של יחסי אב-צאצא, החל מהאב האולטימטיבי להתפוצצות, או הצאצא האולטימטיבי להתכנסות.
התנהגות זו אף מראה לאלה הבקיאים ביישומי מחשב נוכחיים של עץ תוצר שהמושג הוא, למעשה, רשת ולא היררכיה.
היררכית אסופה ועצי מבנה תוצר
[עריכה]
התייחסו לדוגמא של מטוס. למטוס היררכיה של רכיבים. אם פשוט נפרק מטוס אחד לרמות פירוט גבוהות יותר ויותר, הדבר יתגלה כהיררכיה. עם זאת, כאשר נסתכל על כל טווח המטוסים עבור יצרן, המבנה אינו היררכיה כי אם רשת של חלקים. כלומר, קשר רבים לרבים. במילים אחרות, חלק נתון או אסופה, כמו למשל סוג של קרבורטור, יכול לשמש במספר סוגים שונים של מנועים. בדומה לכך, מנוע יכול לשמש במספר סוגים רב של מטוסים, וכן הלאה, מכאן שלכל אסופה נתונה יכולים להיות הרכבות משנה מתחתיה והרכבות אחרות מעליה.
זאת ניתן לתאר במה שנקרא עץ מבנה תוצר כנראה בדוגמא. כל פריט יכול להיחשב לאסופה או לחלק, תלוי בקשריו עם פריטים אחרים. לדוגמא, פריט C הוא חלק בתוך אסופת B, אך הינו גם אסופה המורכבת מחלקים 2, D ו-4.
נימוקים בעד ונגד
[עריכה]התועלת במבנה הרקורסיבי, במיוחד עבור מודל לוגי, היא האלגנטיות, הפשטות וחוסר המורכבות שבו. המבנה ניתן להרחבה ללא גבול. נוכל אפילו להוסיף רכיבים באמצע מבלי לפגוע בשאר המבנה. בכדי לבצע זאת, ניישם את הדברים שלהלן:
- נוסיף את החלק ל-ITEM במקרה הצורך
- נוסיף את קשריו עם צאצאיו ל-ITEM BOM
- נשנה את קשרי האב-צאצא הקודמים ב-ITEM BOM כך שיצביעו על החלק החדש
ניתן ליישם שיטה זו בקלות כפתרון למגוון רחב של בעיות. לדוגמא, ניתן ליישמה בעץ תוצר מהחיים האמיתיים, למבני ארגונים ופועלים, לקשרים פיננסיים וכו'.
בטכנולוגיית מסדי נתונים עכשווית, רקורסיה יכולה להדגים שתי בעיות עיקריות: ביצועים ומורכבות תכנות.
היישום הפיזי
[עריכה]דרך אחת לפשט בעיה זו, היא למנוע השתנות. ישנם שני סוגי יישומים פופולריים הנוגעים לנושא זה, במיוחד באחסון מידע, הנקראים "המבנה המשוטח" ו"פתית השלג". כמובן, פתרונות אלו אינם ייחודיים לאחסון מידע.
פתרונות קבועים
[עריכה]הפתרון הראשון הוא היררכיה קבועה, כמו זו שניתן לראות בפתית שלג. בגישה זו, בדומה לפתית שלג אמיתי, הרמות השונות בהיררכיה נשמרות בטבלאות שונות. כל רמה קבועה.
קלייב פינקלשטיין (Clive Finkelstein), בספרו "Introduction to Information Engineering", מציג דרך זו לעתים קרובות.
להלן דוגמא לפתית שלג או היררכיה קבועה:
במבנה המשוטח, הרמות השונות בהיררכיה מצומצמות לקבוצות של עמודות שונות בשורה בודדת. דמיינו היררכית תוצר המכילה (בשורה בודדת), תוצר, רכיב, תת-רכיב, אסופה, תת אסופה וחלק. דבר זה אינו נורמלי, אבל אם המבנים קבועים, הוא עשוי לעבוד.
להלן דוגמא של מבנה דיווח משוטח (למטה מימין).
הפרק הקודם: התנהגות מידע וצורכי מידע |
ארגון מידע | הפרק הבא: תוויות |