Semalt: כיצד Wiki עובד בשפות שונות?

אוליבר קינג, מנהל הצלחת לקוחות Semalt , אומר שלוויקיפדיה יש מגוון נרחב של נתונים, מאמרים ותכנים בשפות שונות, והעורכים מעודדים ליצור את המאמרים החסרים באנציקלופדיה ענקית זו. אפשר לומר שוויקיפדיה קיימת ביותר משלוש מאות שפות, אך רובן אינן שלמות וקטנות יחסית. אנשים מכל חלקי העולם מבקרים מדי יום בוויקיפדיה וקוראים יותר מ -300 מהדורות השפה שלה. חלקם מחפשים מאמרים ותכנים ספציפיים שנכתבו על ידי מאות עד אלפי סופרים מתנדבים שאחראים לבנות ולתחזק את האנציקלופדיה המפורסמת והחופשית הזו. המבקרים בוויקיפדיה מחפשים בעיקר במאמרים בשפה האנגלית, והשפות האחרות מהוות Wiki 30 מיליון ערכים.

דמוקרטיזציה של הגישה לידע

כדי לעזור לסופרים ולעורכים של קהילות לשוניות שונות להעריך את המאמרים החסרים, מומחי המחשבים בקרן ויקימדיה וסטנפורד יצרו בהצלחה כמה כלים. אחד מהם עוזר בזיהוי המאמרים החשובים שעדיין לא קיימים בשפה מסוימת. עורכים משתמשים בהמלצות אלה כדי ליצור מאמרים חדשים. אם העורכים והכותבים הם רב לשוניים, אז קל למצוא מאמרים בשפה שנייה ולתרגם אותה לשפה המקומית עבור קוראי ויקיפדיה.

אז מערכת זו תזהה תחילה את עורך מדגסקר שרוצה לכתוב בשפה הצרפתית ותבקש מהעורך להשלים את החלקים החסרים במאמר ולקבל אותו להתפרסם בוויקיפדיה המלאגית. בדרך זו העורכים יכולים ליצור מאמרים עבור אנשים שונים בעולם, אשר בתורם יכולים להשפיע על חווית המשתמש הכוללת.

חוקרי קרן וויקימדיה, לילה זיה ואלרי וולצ'ין, שיתפו פעולה עם הסטודנטית של אוניברסיטת סטנפורד, רוברט ווסט, בכדי להציג דו"ח בכנס העולמי העולמי, במונטריאול. לטענתם, בוויקיפדיה יש כמות גדולה של נתונים, ויש קשר חזק בין מאמריה.

המדענים החלו ליצור את רשימות המאמרים בשפות שונות ולהפנות את הרשימות כדי לגלות אילו מאמרים חסרים באילו שפות. אז הם העריכו את המשמעות של כל המאמרים החסרים על סמך הרלוונטיות הגאוגרפית והתרבותית. הם שואפים לפרסם את המאמרים החסרים בהקדם האפשרי ולהשיג אותם בדרגות טובות יותר.

מחבר את הפערים

חוקרים בדקו את ההנחה עם מגוון ניסויים. הם התחילו את הפרויקט עם למעלה מ -4 מיליון מאמרים שנכתבו בשפה האנגלית וגילו כי למעלה מ- 1.5 מיליון מאמרים חסרים בחלק הוויקיפדיה הצרפתית. לאחר מכן בחרו המומחים ב -300,000 המאמרים החשובים בשפה האנגלית ותרגמו אותם לשפה הצרפתית. המאמרים חולקו לשלוש קבוצות עיקריות של יותר ממאה,000 מאמרים כל אחת ונמסרו לעורכים הטובים והמנוסים ביותר. עיקר הניסוי כלל שתי קבוצות עיקריות של ששת אלפים עורכים וסופרים שערכו עריכות מרובות בשפה הצרפתית והאנגלית תוך שנים עשר חודשים לפני סיום הניסוי. ביוני 2015, כל העורכים קיבלו דוא"ל שהצביע על המאמרים החסרים הייחודיים והם התבקשו לתרגם את רשימת המאמרים השלמה מאנגלית לשפה הצרפתית. חודש לאחר מכן המומחים ניגשו ליצירת המאמר החסר וגילו שהם יכולים להעלות את שיעורי יצירת המאמר האורגני. על סמך כל התוצאות הללו, קרן ויקיפדיה פיתחה כמה כלים ניסיוניים שבהם העורכים והכותבים יכולים למצוא את הפערים בשפותיהם המקומיות ולהצביע על ערכים ספציפיים.

mass gmail