מדוע מדברות שפות שונות במהירויות שונות?

אם אי פעם ניסיתם לצפות בסרטים בשפה זרה, בטח שמתם לב שהם נשמעים מהירים בצורה בלתי רגילה. וזה נכון – שפות רבות מדברות במהירויות שונות. הפורטל popsci.com אומר למה.

מדוע מדברות שפות שונות במהירויות שונות?

מחקר משנת 2011 מדד את מהירות הדיבור של שבע שפות, והיפנית הגיעה למקום הראשון. מדענים מצאו שדוברי יפנית מפיקים בממוצע 7.84 הברות בשנייה, לעומת 6.19 הברות בלבד בשנייה באנגלית.

התוצאות אינן מפתיעות כשחושבים על איך אנחנו מדברים בשפות אלו. לאנגלית יש הברות רבות המכילות צלילים רבים, בעוד שביפנית ובשפות רבות אחרות יש פחות הברות לכל הברה. כלומר, מהירות הגיית ההברות בשנייה גבוהה יותר. בתרגום הנתונים הסטטיסטיים למספרים, היפנית מהירה בכ-20% מאנגלית, אך דוברי השפות הללו עדיין יכולים לצפות בסרטים מדובבים עם זמני ריצה מקבילים. זה נובע בחלקו מהקול היצירתי, אבל זה גם עניין של איך שתי השפות מעבירות משמעות.

באמצע המאה ה-20, הפולימאט האמריקאי קלוד שאנון תרם רבות למתמטיקה, הנדסת חשמל ומדעי המחשב באמצעות מחקריו בתורת המידע. שאנון, שטבעה את המונח "ביט" כדי להתייחס ליחידת מידע, חקרה כיצד דיבור אנושי מעביר משמעות. ב-1951, הוא הכריז שהשפה האנגלית מיותרת ב-80% – ניתן לגזור ארבע מתוך חמש אותיות מבלי לאבד משמעות.

החישובים של שאנון היו קצת קשים – מאמצים אנליטיים עדכניים יותר שינו את הנתון מ-80% ל-50%. עם זאת, התיאוריה הבסיסית שלו עמדה במבחן הזמן: כל שפה מעבירה משמעות בצפיפות שונה, וניתוח פשוט של קצב הדיבור מפספס את האלמנט הבסיסי הזה.

בשנת 2019, חוקרים מאוניברסיטת ליון ניסו לקבוע באיזו מידה החילוף בין קצב הדיבור וצפיפות המידע מופץ באמצעות הדוגמה של 170 אנשים שקוראים את אותו טקסט ב-17 שפות. מהירות הקריאה האיטית ביותר הייתה 4.3 הברות לשנייה, בעוד שמהירות הקריאה המהירה ביותר הגיעה ל-9.1, והדגימה מהירויות שונות מאוד.

אבל הדבר המעניין ביותר הוא ניתוח צפיפות המידע של כל שפה. מדענים בנו על התיאוריה המקורית של שאנון כדי לחשב את האנטרופיה המותנית של הברות בשפה – במילים אחרות, כמה קשה לחזות את ההברה הבאה על סמך הקודמת. לכן, וייטנאמית היא אחת השפות האיטיות ביותר אך יחד עם זאת אחת השפות העשירות ביותר מבחינת צפיפות המידע. דוברי וייטנאמית צריכים לבטא פחות הברות כדי להעביר מידע מאשר דוברי ספרדית.

על ידי שילוב שני המדדים, חוקרים צרפתים יצרו פרמטר חדש – מקדם המידע, שקובע את כמות הנתונים ששפה יכולה לשדר בשנייה. יתר על כן, מקדם זה משתנה כל כך מעט בין שפות שמדענים יכולים להגיע לערך "אוניברסלי" – 39 סיביות לשנייה. לדבריהם, מספר זה עשוי להיות תקרה משוערת למהירות עיבוד הדיבור של המוח האנושי.

עם זאת, הניסוי באוניברסיטת ליון לא היה אידיאלי. הוא לא שיחזר את הניואנסים של הדיבור היומיומי מכיוון שכל המשתתפים בניסוי קראו טקסטים שנקבעו מראש. חוקרים עדיין לא קבעו אם קצבי המידע משתנים בסביבות שפה טבעיות יותר.

אולי גם תאהב