המתמטיקה שמאחורי ניחושי מילים

צומת המקור: 1765787

מבוא

במשחק הפשוט של Wordle, השחקנים צריכים לנחש מילה סודית בת חמש אותיות בשישה או פחות תורות בהתבסס על רמזים לגבי נוכחות ומיקומן של אותיות שנחשפו מהניחושים הקודמים שלהם. בעוד שמשחקים דומים הופיעו בעבר, כל מי שמשחק ב-Wordle ביום מסוים צריך לגלות את אותה מילה סודית, מה שמקל על שיתוף הניסיונות שלך ולדון במשחק בין חבריך. המבנה וההצגה הייחודית של המשחק היוו השראה לשאלות האחרונות שלנו חידת תובנות. התשובות נדון להלן.

מפתח אחד לשחק משחק Wordle טוב הוא לבחור מילת התחלה חזקה. ניתוחי מחשב מגלמים טכניקות של תורת המידע מציעים שמילות התחלה כגון "צפחה" ו"עגורן" מאפשרות לך (או לאלגוריתם מחשב, בכל מקרה) לפתור Wordles במספר הפחות סיבובים בממוצע. עם זאת, פותרים אנושיים רבים מרגישים יותר בנוח לבחור במילה עשירה בתנועות כגון "אדיאו", "שמע" או "להרים". לתחושה הזו יש גם בסיס אינטואיטיבי וגם רציונלי. ראשית, תנועות ממוקמות מאפשרות לך למצוא "עמוד שדרה" של תנועות שיכולה להגביל את מספר העיצורים שאתה צריך לחפש. לדוגמה, אם אתה יודע שהמילה נראית כמו _AI_E אחרי שאתה משחק "להעלות", נשארו רק כמה מילים אפשריות: "נאיבי", "וויתור" ו"תירס". שנית, התנועות ממקסמות כמות שניתן לכנותה "כיסוי" - בין חמש התנועות בלבד ל-Y, נוכל לקבל לפחות אות חיובית אחת בכל אחת מ-2,309 התשובות. כדי לקבל סוג זה של כיסוי מושלם עם עיצורים, תצטרך לנסות את כל 20 מהם, מה שידרוש לפחות חמישה סיבובים.

הפאזל הראשון שלנו אתגר את הקוראים להבין איזו אחת משלוש המילים העשירות בתנועות היא הניחוש הראשון הטוב ביותר.

פאזל 1 

הטבלה הבאה נותנת את התדירות שבה מופיעות שמונה האותיות במילים "adieu", "שמע" ו"הגבהה" בכל מיקום על פני כל רשימת התשובות של Wordle של 2,309 מילים. בהתבסס על טבלה זו, קבע כמה ירוקים וצהובים אתה יכול לצפות כדי לעבור את כל רשימת התשובות של Wordle עבור כל אחת משלוש המילים ההתחלתיות העשירות בתנועות: "adieu", "אודיו" ו"הגבהה". (ב-Wordle, אות מוצגת עם רקע ירוק אם היא במקום הנכון, ורקע צהוב אם היא במילה אבל במקום הלא נכון.) מה זה אומר לך על הביצועים הצפויים שלהן כמילות התחלה ?

קורא רוב קורלט הראה כיצד לחשב את מספר הירוקים והצהובים הצפויים מטבלה זו. עבור "adieu", A היא האות הראשונה הנכונה עבור 140 מילים, D היא האות השנייה הנכונה עבור 20 מילים וכן הלאה. המספר הכולל של הירוקים על כל התשובות האפשריות של Wordle הוא הסכום של אלה. אז "adieu" מקבל סך של 140 + 20 + 266 + 318 + 1 = 745 ירוקים. עבור צהובים, עלינו להתחיל במספר הפעמים שהאות מופיעה לפחות פעם אחת במילה (906 עבור ה-A ב-"adieu") ולהחסיר את הפעמים שהיא ירוקה (140) כדי לקבל את מספר הצהובים (766). . הוסף את המספרים עבור כל אות במילה כדי לקבל את המספר הכולל של הצהובים. אנו יכולים לחלק את המספרים הללו במספר הכולל של התשובות (2,309) כדי לקבל את הציפייה לירוקים ולצהובים לסיבוב בודד, אך מכיוון ששלב זה משותף לכל מילות הפתיחה שלנו, אנו יכולים פשוט לעבוד עם הסכומים להשוואת שלושת שלהם. מכיוון שבחרנו את המילים הללו במיוחד למציאת עמוד שדרה של תנועות, נוכל גם לחשב כמה מהירוקים מגיעים מהתנועות. הנה התוצאות.

כפי שאתה יכול לראות, אין מה להשוות! "הגבהה" עדיפה על "אדיאו" בכל מידה, נותן יותר ירוקים וצהובים ומניב יותר תנועות במקומות הנכונים שלהם, בלי לומר כלום על העובדה שאתה גם תופס או פוסל שניים מהעיצורים הנפוצים ביותר. "אודיו" הוא שליש רחוק בכל המדדים הללו. שים לב שבעוד שאתה יכול לקבל קצת מידע על אילו אותיות נעדרות גם אם אינך מקבל שום צהוב או ירוק, כקורא מקס דייויס ציין, אתה בהחלט מקבל יותר מידע כאשר אתה מקבל אחד או יותר צהוב וירוק. אז, משתמשי "אדייה", אולי הגיע הזמן לומר אהוד.

שאלה 1

זו הייתה שאלה לגבי כמה עלינו להעריך ירוקים ביחס לצהובים: כמה צהובים שווים לירוק בודד? האופי המובהק של התוצאות שלנו לעיל מייתר את הצורך לענות על כך עבור ההשוואה לעיל, אבל זו שאלה מעניינת. יש שני היבטים להערכת שווי זו. הראשון הוא ההיבט האנושי: כמה משקל אתה נותן למאמץ הנפשי הנדרש כדי להבין את כל הדרכים השונות שבהן ניתן להציב אות צהובה? אין להכחיש שפגיעה בהרבה ירוקים הופכת את החיים לקלים יותר ונותנת לנו יותר דחיפה של דופמין. מנקודת המבט של תורת המידע, תצטרך לעבור על כל מילה מתחילה עבור כל מילת תשובה ולהשוות כמה סיבובים יידרש כדי לפתור את החידה כאשר אותן אותיות היו ירוקות לעומת כשהן היו צהובות בכל מקרה.

אמנם זו משימה ענקית, אבל הצלחתי לעשות את זה בשביל מילת ההתחלה הטובה ביותר האפשרית של המחשב (המילה הלא ברורה "tarse", שפירושה בז זכר, שעץ הפתרון האופטימלי המלא שלו היה פורסם באינטרנט מאת המתמטיקאי אלכס סלבי). התשובה מפתיעה. מספר הסיבובים הממוצע הנדרש לפתרון מחשב באמצעות מילת תשובה שיצרה רק ירוקים בפנייה הראשונה היה 3.34, בעוד שמספר הסיבובים הנדרש כאשר היו רק אותיות צהובות היה 3.51, עלייה של 5% בלבד! ברור שלאלגוריתם מחשב, הצבת האותיות הצהובות, שנראית כל כך מאיימת לנו, בני האדם, יכולה להתבצע ללא עונש גדול מדי. הייתי משער שההבדל יהיה גדול יותר עבור פותר אנושי לא רק במספר התורות הנדרש, אלא גם במאמץ המנטלי ובזמן הנדרש לפתרון.

פאזל 2

א) אם אתה מקבל את כל חמשת הצהובים בתור הראשון שלך, מה המספר המקסימלי של סיבובים שיכול לקחת כדי למצוא את התשובה, בהנחה שהמשחק הטוב ביותר?

As רוב קורלט ו סם רודס אם נאמר נכון, התשובה התיאורטית היא חמש: שילוב צהוב מלא של אותיות כמו ABCDE יכול להתנגד לגילוי במשך ארבע סיבובים נוספים, שכן ייתכן שיהיה עליך לעבור דרך BCDEA, CDEAB ו-DEABC לפני שתגלה שהתשובה היא EABCD. אולם בפועל, "מילים" מחזוריות כאלה אינן אפשריות בדיוק בגלל שלמילים אמיתיות יש תבניות תנועות ועיצורים שלא ניתן למתוח אותן באופן שרירותי. אפילו מילים עם הרבה אנגרמות יכולות להיפתר בלא יותר משלושה ניסיונות, כפי שהדגים רוב קורלט ב"נתח".

ב) האם זה אי פעם שהאות בעמדה מסוימת הופכת לצהובה יותר חשובה מלראות אותה הופכת לירוקה? אם כן, האם תוכל לתת דוגמה ולהסביר מדוע זה צריך להיות?

כן, אות שעולה בצהוב יכולה, במקרים נדירים, להיות בעלת ערך רב יותר מאותה אות שעולה בירוק, אם זו אות שמופיעה רק לעתים רחוקות בשאר העמדות. זה קורה לעתים קרובות עם Y, שנמצא ברובו המכריע בסוף מילה. נניח שאתה מתחיל עם "בטן", וגם B וגם Y עולים בירוק. נשארו לך אפשרויות רבות: "שקש", "ביטי", "בובי", "שלל", "בושי" וכו'. אבל אם גם B וגם Y מופיעים צהובים, יש רק אפשרות אחת: "תהום".

שאלה 2

האם לאדם עם אוצר מילים טוב של מילות Scrabble לא ברורות יש יתרון או חיסרון בנגינה של Wordle?

בתור שחקן Scrabble לשעבר בטורניר שבילה לא מעט שעות בשינון מילים לא ברורות, אני חושב שזה גם יתרון וגם חיסרון. כשהתחלתי לשחק ב-Wordle, מצאתי את עצמי רואה לעתים קרובות את האפשרות ומנסה לשלול מילים לא שכיחות שלימים הבנתי שאין להם כמעט סיכוי להיות נכונות. (בטרמינולוגיה של גולף, שבה קבוצת Wordle שלי משתמשת לעתים קרובות, אנו מתייחסים לזה כאל מונע על ידי מפגע דמיוני.) כפי שתיארתי בעמודת החידה, תשובות Wordle נשאבות מרשימה של מילים פשוטות, שרובן ידועות לכל דוברי אנגלית שפת אם. אפילו מילים שהן מעט נדירות אך אינן סתומות אינן ברשימת התשובות של Wordle. לדוגמה, לאחרונה בזבזתי תור על משחק "לטקס", מילה נפוצה למדי שמתגלה כתשובה אפשרית של Wordle. לכן, כמו כל שחקני Wordle, נאלצתי לבנות מודל מנטלי של סוג המילים שעשויות להיות תשובה של Wordle ולהתעלם ספציפית מסוגי המילים הנדירות והמעורפלות שבהן הייתי משתמש בשמחה כדי לצבור נקודות נוספות ב-Scrabble. מצד שני, הידע של המילים הנדירות הללו מועיל ב"עיצורים גורפים", שלעיתים צריך לעשות כדי להימנע מלבזבז תורות רבות בניחוש של חבורה של מילים דומות אחת אחת. לדוגמה, אם יש לך _RA_E ואתה מסתכל על חבורה של מילים אפשריות המכילות D, G ו-K, כגון "בריק", "דריק", "דראפ", "כיתה" ו"ענב", זה עוזר לדעת לשחק את המילה "קדג'", שיכולה להבטיח מציאת הפתרון בשני סיבובים נוספים (למשוך פירושו להזיז ספינה על ידי הפלת העוגן שלה למרחק ואז משיכה בה בחבל חזק).

קבלת אותו פאזל Wordle כמו כולם בכל יום מעודדת משחק חברתי. אבל ספוילרים יש בשפע באינטרנט, וזה ידוע כמה אנשים בוגדים בדיווח על הציונים שלהם. הפאזל הבא עוסק בשאלה מתי חשדות לבגידה בקבוצת וורדל מוצדקים רק על סמך חוסר הסבירות של הניקוד של אדם. שוב, הפאזל הזה ממוסגר במונחי ניקוד גולף: פתרון Wordle בשלושה סיבובים נקרא ציפור, קבלת אותו בשני סיבובים הוא נשר וקבלת מילה בסיבוב הראשון הוא, כמובן, hole-in-one. .)

פאזל 3

קריטריון מדעי מסורתי לחקירה נוספת הוא אם ההסתברות לתוצאה מתרחשת במקרה (ה ערך אלפא) הוא פחות מ-5% או פחות מ-1%, בהתאם למטרות החוקרים. לאחר מכן, התוצאה נחשבת למובהקת סטטיסטית ברמה של 5% או 1%. מכיוון שזה לא נחמד לחשוד באנשים בבגידה כשהם לא, הבה נבחר ברמה השמרנית יותר של 1% בחקירה הזו.

נניח שאתה שייך לקבוצת Wordle של 10 שחקנים שחולקים תוצאות זה עם זה כל יום במשך 200 ימים. נניח ששחקן אנושי טוב מאוד יכול לצפות לקבל ציפורית כל 2.5 משחקים, נשר כל 40 משחקים, ו-hole-in-one כל 2,000 משחקים (שהם הערכות סבירות בעולם האמיתי).

א) כמה ציפורי ברציפות יהיו משמעותיים ברמה של 1% בקבוצה שלך בזמן זה?

ב) כמה נשרים ברצף?

ג) כמה חורים באחד ברצף?

המפתח כאן הוא להבין שיש לך גודל אוכלוסייה של 2,000 משחקי אדם. לכן, כדי להגיע לרמת המשמעות הזו, תצטרך לראות אירוע שיתרחש פחות מפעם אחת ב-200,000 משחקי אדם אך ורק במקרה.

א) רצועות ציפורי או טובות יותר: ההסתברות לקבל ציפורי או טוב יותר במשחק בודד היא 2/5 + 1/40 + 1/2,000 = 0.4255, שזה 1 מתוך כ-2.35 משחקים. בואו נקרא לזה B. העוצמה הנמוכה ביותר של B שעולה על 200,000 הוא B15, שהם יותר מ-368,000 (B14 הוא בערך 157,000). אז, רצף ציפורי או טוב יותר של 15 או יותר עבור כל אחד בקבוצה יעמוד בקריטריון המחמיר הזה, אבל אחד מ-14 לא. אם חשדת בשחקן בודד, תצטרך לראות אירוע שמתרחש בתדירות נמוכה יותר מפעם אחת ב-20,000 משחקים, מה שיקרה עם רצף ציפורי או טוב יותר של 12. (שים לב שמספר ההזדמנויות בפועל לרצף של רצפים של האורכים האלה מעט יותר קטנים: זה למעשה 1,850 משחקים לקבוצה ו-188 משחקים לשחקן בודד, אבל זה לא משנה במקרה הזה).

שימו לב שאלו הם התדרים של שחקנים מומחים, והרצפים החשודים עבור רוב הקבוצות והיחידים יהיו קטנים יותר. כדי ליישם קריטריון זה בפועל, תצטרך לקבוע את תדרי הציפורי, הנשר והתדרים המתאימים שאתה רואה וגם לקחת בחשבון את מספר המשחקים ששיחקו בקבוצה שלך.

ב) פסים של נשר או טוב יותר: ההסתברות לנשר או טוב יותר היא 1/40 + 1/2,000 = 0.0255, או בערך 1 ל-39.2. אורכי הפס החורגים מרמת המשמעות שלנו הם 4 עבור הקבוצה ו-3 עבור אדם חשוד.

ג) פסי חור-באחד: אורך הרצף החורג מרמת המשמעות שלנו הוא 2 הן עבור הקבוצה והן עבור אדם חשוד.

יש הסתייגות לשתי התשובות האחרונות: מדובר באירועים נדירים, וגודל המדגם קטן מאוד, אז צריך להיזהר. רוב הסטטיסטיקאים בדרך כלל היו מחכים עד שהם ראו לפחות חמישה מקרים או יותר של נשרים או חורים-באחד, לאו דווקא כחלק מרצף, לפני שהם היו נוחים ליישם מבחן מובהקות.

שאלה 3

בהחלט ייתכן שתדירות התוצאות הטובות בקבוצה שלכם גבוהה משמעותית מהתדירות שחזויה במקרה, מבלי שאף אחד יבגוד. איך היית מסביר את זה?

סיבה אפשרית אחת לכך, כמו רוב קורלט מסביר, יכול להיות ש"השחקנים כולם שומרים תיעוד קפדני של כל תוצאה". כפי שהסברתי בהקדמה לפאזל 4, תשובות Wordle לא אמורות לחזור על עצמו במשך חמש שנים בערך תחת ההגדרה הנוכחית. אז גם אם אף אחד לא מרמה או יודע את כל המילים ברשימת התשובות, המידע הזה עדיין יכול לעזור לכל אדם או קבוצה לבצע ביצועים טובים יותר בהדרגה.

אבל יש גם סיבה נוספת: ייתכן שהרשימה אינה אקראית היטב. כששיחקתי את Wordle במהלך החודשים האחרונים, שמתי לב שבכל פעם שיש בחירה בין שתי מילים או יותר, סביר יותר שהמילים הפשוטות יותר יהיו נכונות מהמילים הפחות נפוצות. לדוגמה, אם היו לך A, N ו-E והאפשרויות שנותרו לך היו מילים כמו "התגנב", "צבוע" ו"חוקן", היית יכול ללא היסוס לנגן את המילה הפשוטה ביותר ("להתגנב" במקרה זה) והיית לתקן לעתים קרובות הרבה יותר ממה שהיית מצפה במקרה טהור. למעשה השתמשתי ברשימת תדירות מילות פרוזה באנגלית כדי לבדוק עד כמה נפוצות התשובות שנתקלתי בהן במשך חודשיים בהשוואה למילה ממוצעת ברשימת התשובות של Wordle. התשובות שנתקלתי בהן היו נפוצות בכ-25% מהמילה הממוצעת ברשימת התשובות של Wordle, וחשוב מכך, עבור המילים הנדירות ביותר ברשימה (10% התחתונות), רק שליש ממספר התשובות הופיעו כפי שאמור היה. ל. נשרים התרחשו בתדירות קרובה יותר ל-1/20 ולא ל-1/40 על סמך סיכוי טהור. אז נראה שרצף התשובות של Wordle אינו אקראי טוב, או שהוא עמוס במילים פשוטות יותר או שבמקרה אנחנו עוברים על חלק מהרשימה שמורכב ממילים פשוטות יותר.

שינוי משמעותי לאחרונה הוא זה ניו יורק טיימס מינה עורך Wordle כדי לתכנת את מילת היום החל מה-7 בנובמבר. מאז, הסרת מילים קשות או פוגעניות מהרשימה המוגדרת מראש הפכה לנפוצה יותר, כולל החלפה, מאחורי הקלעים, של מילים כמו "אומברה", "הקאה" ו- " עַכּוּז." אמנם אני מבין את הצורך ב- פי כדי לחטא ולפשט מילים של Wordle כדי למנוע זעם ממיליוני האנשים שמשחקים, זה הופך את המשחק לפחות אקראי ולהרבה יותר צפוי. גרוע עוד יותר היא הנטייה העריכה המצערת בשבועות האחרונים לבחור מילה המתאימה ליום, כמו "משתה" ביום חג ההודיה ו"מדליה" ביום הוותיקים. זה מסתכם במתן רמז נוסף על המילה עוד לפני שהמשחק מתחיל, מה שהופך את הפאזל לקלה יותר ופוגע בחיבור העשיר של תורת המידע. אני מקווה שזו סטייה זמנית מכיוון שאקראיות היא מרכיב חיוני של המשחק הזה. רוב האנשים אשר נתן משוב ל ניו יורק טיימס לגבי בחירות העריכה הללו הרגישו באותו אופן.

הפאזל הרביעי שלנו התבסס על העובדה שתחת הארכיטקטורה הנוכחית שלו, פתרונות Wordle לעולם לא יחזרו עד שהרשימה תיגמר לאחר חמש שנים בערך.

פאזל 4

שקול אדם עם זיכרון מושלם של פתרונות עבר. לאדם כזה, התשובה תהיה ברורה ביום האחרון ברשימת 2,309 המילים של Wordle. האם אתה יכול להעריך במהירות כמה חורים באחד האדם הזה היה מצפה לקבל לאורך כל הרשימה, מבלי לבצע את החישוב בפועל? ואז אם אתה יכול, נסה לעשות את החישוב בפועל.

רוב קורלט ענה על זה בצורה מושלמת, בהערכת לוגית את התשובה ל-8.25, ולאחר מכן חישב את התשובה ל-8.32. חישובי המפתח של קורלט מובאים להלן. אתה יכול לבדוק את ההערה עבור טכניקת האומדן המעולה.

אם יש לך m מילים ואתה מניח אז הסיכוי לקבל את זה נכון הוא 1/m. אם יש לך מילה אחת הסיכויים הם 1/1, 1 מילים 2/1, 2 מילים 3/1 וכו'. אם תחבר את אלה יחד תקבל את המספר הצפוי של חורים-באחד! …

[זה] צריך שנחשב את סכום ההדדיות של כל המספרים מ-2309 עד 1. עשיתי זאת בגיליון אלקטרוני ומצאתי שהסך הכל הוא 8.32, קרוב באופן מספק להערכה שלי!

השאלה האחרונה שלנו שאלה כיצד לשפר את האקראיות של Wordle של מילים תוך שמירה על עיצוב "צד הלקוח" שלה. לפני מינויו של עורך Wordle, לא הייתה אקראית יומיומית של מילים: המילים הגיעו מרשימה שהורדה מראש, שלא הייתה אקראית במיוחד, כפי שציינתי למעלה. לאחר מכן נוצרה מילת הפתרון של Wordle במכשיר הלקוח (של המשתמש) מרשימת המילים בהתאם לתאריך הנוכחי, וכל הפאזל נשפט גם במכשיר של המשתמש. הקוד לעשות את כל זה מוריד כבר בפעם הראשונה שמשתמש מתחבר לאתר בכל יום. המשתמש לא חייב להיות מקוון לאחר מכן.

שאלה 4

איך הייתם מעצבים את Wordle כך שתשמור על העיצוב בצד הלקוח, ויבטיח שכולם יקבלו את אותה מילת פתרון ביום נתון, אבל יחלק את התשובות בצורה אקראית בצורה הגיונית מבלי לדרוש שינוי בקוד כל יום?

היו כמה תשובות טובות לשאלת האקראיות. כמה קוראים הציעו להשתמש במספר פסאודו אקראי עם סיד מוגדר מראש כדי ליצור אינדקס לרשימת התשובות של Wordle. מומינטרולט אפילו כתב תוכנית שמערבבת באקראי חמש רשימות תשובות של Wordle (נמשכות 32 שנים), ומוודאת שאף מילה לא תחזור על עצמה תוך שנה. מבחינתי, ההליך המושך ביותר הגיע BlindThemis, שהציע שהסיד האקראי המשמש להליך האקראי צריך להיות ארבע הספרות האחרונות של מספר האנשים ששיחקו במשחק עד זמן מסוים. (מכיוון שניתן לנגן את Wordle בכל מקום בעולם, זה יצטרך להיעשות באזורי זמן במזרח האוקיינוס ​​השקט, החל מקו התאריך הבינלאומי!) הדבר הגדול בזה הוא שאף אחד, אפילו לא ניו יורק טיימס עורך Wordle, היה יודע מה הייתה המילה יום לפני השימוש בה.

אף אחד מהמנגנונים האלה לא יכול להיעשות לחלוטין בצד הלקוח, כמו טים רוס ציין. המילה הבאה תצטרך להיווצר על ידי השרת, ואת המילה הזו או את מספר האינדקס שלה יהיה צורך להוריד, אולי בצורה מוצפנת עם שאר הקוד. כפי שציין רוס, נכון לעכשיו 2,309 מילות התשובות נראות בבירור בסדר תאריך בקוד המקור, שכל דפדפן יכול לחשוף. גישה אחת יכולה להיות להצפין את רשימת מילות התשובות ולשמור אותה בסדר אלפביתי ולא בסדר תאריך.

בעוד שהשיפורים המוצעים באקראי יעזרו, ההצפנה לא תשנה כלל, מכיוון שעדיין יהיו מספר ספוילרים באינטרנט ודרכים מרובות לרמות.

תודה לכל מי שתרם לדיון המעניין הזה. פרס התובנות עבור פאזל זה מגיע לרוב קורלט. מזל טוב! הפאזל הבא שלנו יופיע בפברואר. עד אז, חג תמוה שמח!

בול זמן:

עוד מ קוונטמגזין