יום רביעי, 1 בפברואר 2012

איך חישבנו את איכות תחנות תל אופן

(אם אתם לא גיקים ו/או לא אוהבים מספרים, אתם יכולים לדלג על הפוסט הזה)

בעקבות פניות ששואלות (בצדק) על המתודולוגיה של חישוב איכות תחנות התל אופן בפוסט הקודם, הנה השיטה בה פעלנו:

24 שעות ביום, 5 ימים בשבוע (א-ה) אנחנו דוגמים את אתר תל אופן כל 15 דקות כדי לברר את מצב האופניים בכל תחנה. עבור כל תחנה יש 6 מצבים שהיא יכולה להיות בה: "תקינה", "אין אופניים", "יש 1-2 אופניים", "אין תחנות עגינה פנויות", "יש 1-2 תחנות עגינה פנויות" או "לא תקינה".

את הנתון הזה אנחנו מעדכנים בגליון הענק הזה - עבור כל שעה ביום, ועבור כל תחנה, יש לנו ספירה כמה פעמים התחנה היתה בכל אחד מהמצבים לעיל.

חוץ מזה, כדי לתת משקל גדול יותר לדגימות חדשות על פני דגימות מלפני זמן רב, אחת לשבוע אנחנו מכפילים את כל המספרים שכתובים בגיליון ב - 0.840896, שזה שורש רביעי של חצי. כך, כל דגימה הולכת ומאבדת מחשיבותה ובתוך כחודש שווה חצי מדגימה חדשה.

על מנת לחשב "ציון תחנה" אנחנו מתמקדים בשעות הלחץ (שכרגע מוגדרות כ- 6:00-10:00, ו- 15:00-20:00).
עבור כל רובריקה בשעות הללו, אנו מסכמים "נקודות רעות": כמה פעמים התחנה היתה לא תקינה (כלומר לא היו בה אופניים או לא היו בה תחנות עגינה) ועוד חצי ממספר הפעמים שבתחנה היו רק 1-2 אופניים או רק 1-2 תחנות עגינה. 

אנחנו סופרים חצי מהדגימות הללו מהסיבות הבאות:
  1. אנחנו דוגמים רק כל 15 דקות, לכן סביר להניח שלעתים בין הדגימות אזלו האופניים או תחנות העגינה.
  2. פעמים רבות אתר תל אופן מציג שיש זוג אופניים כשבעצם הם אינם או שהם תקולים, או שהוא מציג שיש תחנת עגינה אבל היא אינה עובדת. 


את סיכום ה"נקודות הרעות" אנחנו מחלקים בסה"כ מספר הדגימות שדגמנו באותה תחנה, וזהו ציון התקלות של אותה תחנה.


איך צובעים את התחנות? כרגע לפי אחוזונים. ה- 25% הטובות ביותר נצבעות ירוק, ה- 25% הגרועות ביותר אדום, והשאר צהוב (אפור זה כשאין לנו נתונים, בד"כ תחנות חדשות שמופיעות באתר אבל עוד לא נפתחו).

אשמח להסביר יותר או לענות להערות כאן.

20 תגובות:

  1. משאב נדיר! מחקר מאוד איכותי. אני אישית צריך את האופניים גם לא בשעות השיא, ולכן אני לא מסכים עם ההתעלמות מהם, אבל ניחה.

    השבמחק
  2. תודה רבה מתן!
    אני בהחלט מבין את הצורך שלך באופניים גם בשעות אחרות. בשביל לקבל יותר אינפורמציה לגבי שעות אחרות, אתה יכול ללכת ל- telofast.com ולהסתכל על תחזית לכל שעה שהיא ביום (זה נכון לימים א-ה).
    שים לב שפונקצית התחזית עוברת טוב יותר בדפדפן כרום, אם יש לך גישה אליו.

    השבמחק
    תשובות
    1. יפה, לא בדיוק הבנתי מהי "התחזית". בעצם בשעה הנתונה בימים א-ה, אתה נותן ציון לתחנה. איך מחושב הציון הזה?
      בנושא התחזית: האתר שלך מחשב בכל בקשה את הציון הזה לכל התחנות וכתוצאה האתר ממש איטי. אתה יכול לעשות את החישוב פעם ביום ולתת תחזית מעודכנת. כן אני גולש עם כרום.

      מחק
    2. התחזית מחושבת ע"י כך שאנחנו מסתכלים על הנתונים ומחשבים כמה מהפעמים התחנה היתה תקולה בשעה הנבחרת.
      המהירות של הפיצ'ר הזו היא אכן בעיה. נרצה בעתיד לשפר אותה.

      (כרום צריך רק בשביל שסרגל בחירת השעה יעבוד, לא בגלל המהירות במקרה זה).

      מחק
  3. אהבתי מאוד וההסבר ברור ונהיר.
    שתי הערות קטנות:
    - עוד סיבה לספור את המצב שיש רק 1-2 אופניים תחנות היא שיש מצבים בהם 2-3 אנשים רוכבים ביחד - וזה מונע זאת מהם.
    - לדעתי החלוקה לטובות, בינוניות וגרועות צריך להיות אבסולוטי. לצורך העניין - אם תל-אופן ישפרו את השירות, הייתי רוצה לראות את זה במפה (ובכל מצב תמיד יהיו 25% תחנות גרועות). הייתי מגדיר רף למצויין (90%?) ולבינוני (80%?).

    השבמחק
  4. תודה ארז על הנקודות המעניינות.

    לגבי החלוקה - אתה צודק שעדיף סקלה אבסולוטית, העניין הוא שאני לא מרגיש שיש לי מספיק ידע על הדומיין בשביל לקבוע מה רף הציפיות האבסולוטי הנכון - אתה יודע מה הרמה בה הוא צריך להיות, ולמה?

    מה שכן אני עושה, זה חישוב אבסולוטי של טיב כל התחנות ביחד. זה יתחיל השבוע ומדי שבוע נחשב את הציון השבועי. כך נוכל לאורך זמן לבדוק האם רמת השירות אכן משתפרת.

    השבמחק
    תשובות
    1. נראה לי שבתור התחלה אפשר לקחת את הרפים הנוכחיים (וכמובן לעגל אותם קצת לפי החישוב שלך זה יצא כרגע 95 ו-80, אם רוצים לתת להם קצת גרייס - אפשר להוריד את הציון הירוק ל-90).
      העניין הוא שכך אפשר לראות האם יש שינוי לאורך זמן.

      מחק
    2. אם אני מבין נכון, מה שאתה מציע להראות הוא כמה טובות התחנות לאורך זמן. אני מקווה שהמדד האחיד לכל התחנות יספק את הצורך הזה. אתמול הוא נדגם פעם ראשונה ותוך שבועיים-שלושה כשיהיו מספיק נתונים אני מקווה לפרסם אותו.

      המדד הנוכחי הוא אחר - הוא מודד את ההשוואה *בין* התחנות. נניח שנקבע שירוק זה 90: זה אומר, בקירוב, שבשעות הלחץ כל תחנה שריקה/מלאה/תקולה 10% מהזמן היא ירוקה.

      יכול להיות שלך זה נראה מספיק, וזה לגיטימי. אני, בתור משתמש תל אופן, רוצה לראות רף גבוה יותר - תל אופן הוא משהו שאני רוצה להסתמך עליו לגמרי, ועדיין לא יכול. לא ברור לי תחנה שריקה פעם ב- 10 ימים היא "טובה" או לא. והאמת - ממש לא נראה לי ניצול טוב של הזמן למצוא את עצמי מתווכח בעתיד עם משתמשים שיטענו, בצדק, שהסף צריך להיות גבוה יותר או נמוך יותר.

      הנתונים האבסולוטים נגישים - גם באתר telofast.com, וגם - אם מישהו ירצה אותם בשביל לבנות ממשק נוסף, למשל מפה אחרת - אשמח לפתוח אותם לשימושו.

      מחק
    3. אני מסכים עם השיקולים הללו, 90% יכול להיות בסדר עם יש הרבה תחנות קרובות, אבל בדרום העיר, אם התחנה שלי לא עובדת אני תקוע, וצריך ללכת 15-20 דקות. כדאי לעשות משהו אבסולוטי, אבל שישאף להביא תוצאות שמתאימות למשתשמים שתלויים בתל-אופן, ולא מספרים נחמדים כמו 90%.

      מחק
  5. מעניין מאוד. מה לגבי הטענה כי המחקר לא מתחשב באינטנסיביות השימוש בתחנות השונות, ובכך יוצר עיוות לרעת תחנות שהשימוש בהן רב?

    באנלוגיה, אם ניקח מכונית שנוסעים בה כל יום ומכונית שנוסעים בה רק פעם בשבוע, סביר להניח שהמכונית שמשתמשים בה כל יום תתקלקל יותר. זה אומר משהו על ההבדל בין האיכות של שתי המכוניות? ודאי שלא.

    אני תוהה אם הנתונים הפתוחים לציבור מאפשרים ביצוע הערכה לגבי אינטנסיביות השימוש בתחנות - למשל, תחנה שמציגה שינויים תכופים יותר במספר האופניים הפנויים בה היא כנראה תחנה פעילה יחסית. אם יש נתון כלשהו שאפשר לעבוד איתו, כדאי מאוד להתחשב בו בשקלול הכללי, וכך ניתן יהיה להפחית במידה ניכרת את ההטיה הנ"ל לרעת תחנות פעילות.

    מה דעתכם?

    השבמחק
  6. תודה naidav על ההערה החכמה.
    אני רוצה להבהיר מה אני מודד ומה לא. ניקח את הדוגמה הבאה: נניח שאנחנו מודדים ביצועים של רשת סופרמרקטים. אפשר לטעון, ובצדק, שהרבה יותר קשה לנהל סופר גדול - יש הרבה יותר אנשים שבאים, הם לוקחים יותר מוצרים, והרבה יותר קשה למלא אותם מחדש על המדף.

    כל זה נכון, אבל כשאני בא למדוד את איכות השירות ללקוח, אני חייב להתעלם מזה. זה עניינה של רשת הסופרמרקטים איך להתמודד עם הביקושים השונים - ייתכן שבאיזורי ביקוש צריך לפתוח עוד סניפים (ובהשאלה - עוד תחנות תל אופן), ייתכן וצריך להגדיל את כמות הסדרנים בסניף הגדול על חשבון הקטן (לשנע יותר לדרום העיר על חשבון צפון העיר), אני באמת לא יודע - אני לא מומחה לסופרים, וגם לא לניהול תחנות תל אופן. מה שאני יודע, ויכול, למדוד זה את רמת השירות ללקוח.

    לגבי הערכה של רמת האינטנסיביות בתחנות - היות ואני מודד רק כל 15 דקות, אני יכול לתת הערכה כלשהי לרמת האינטנסיביות, אבל הביטחון שלי בה יהיה נמוך ביותר.

    אני מקווה שהסברתי את עצמי טוב, ואשמח לשמוע אם יש לך עוד הערות.

    השבמחק
  7. אוקיי, אחרי שלמדתי טיפה על עקרונות השינוע בפרויקט הזה, עוד הערה:

    בתחנות שהשימוש בהן מועט (כמו תחנות רבות בדרום העיר), המצב האופטימלי של התחנה מבחינת החברה המפעילה הוא לא שיהיו בה 10 זוגות אופניים, אלא שיהיו בה 3-4 זוגות בלבד. זאת משום שלשים 10 זוגות בתחנה נידחת זה דבר לא יעיל. לפיכך, מספיק שבתחנה כזו המשתמשים ייקחו זוג אופניים או שניים כדי שהתחנה תקבל "נקודות רעות" על פי המודל שלך.

    נראה לי, אם כך, שהמצב היחיד שמצדיק בוודאות ניקוד רע הוא אי זמינות מוחלטת (0 זוגות אופניים או תחנה מלאה לחלוטין). כדי להעריך בצורה נכונה כל מצב אחר, יש צורך במידע שאין לנו נגישות אליו.

    השבמחק
  8. מעניין אותי אם תוכל לפרט מה למדת על עקרונות השינוע בפרויקט (אני לא מכיר נושא זה ואשמח ללמוד).

    אופן המדידה הנוכחי לא מעניק אף נקודות זכות לתחנה אם יש לה 10 זוגות אופניים על פני 3-4.

    עם זאת, קיום של זוג אחד או שניים הוא אכן "מסוכן", מהסיבות שמניתי לעיל: האחד שהתחנה מדווחת על 1-2 זוגות אבל בפועל אין זוג תקין (ומי שמשתמש בתל-אופן סביר שמכיר היטב מצב זה), וכן שבתוך ה- 15 דקות שבין הדגימות היה זמן שבפועל לא היו זוגות זמינים.

    נכון שלגבי השיקול השני, תחנות פעילות מועדות יותר להיות ריקות באותן 15 דקות, אבל אני חושב שפה כבר מדובר בסדר גדול נמוך יותר של שיקולים, ואנחנו מנסים למצוא "קירוב ראשון" לטיב השירות (נזכור שהן גם מקבלות רק חצי "נקודה רעה" במצב זה).

    החשש שלי, כאמור, שאם נספור רק תחנות ריקות לגמרי, הרי שכל אי-התאימויות בין האופניים המקולקלים/הבלתי נראים עבור התחנות, לבין מה שהתחנות מדווחות לא יבוא לידי ביטוי ואני חושש שזה לא זניח.
    המשתמשים מכירים בוודאי, את המצב בו תחנות "מגלות" שאופניים אינם תקינים ו"שוכחות" זאת מיד לאחר מכן, וכך גם האתר אינו מעודכן במידע זה.

    השבמחק
  9. הטיפה שלמדתי היא בערך מה שכתבתי בהודעה הקודמת - מספר האופניים האופטימלי משתנה מתחנה לתחנה. בתחנות שהתנועה בהן דלילה, הם מעדיפים שיהיו מעט אופניים, כי זוגות אופניים לא מנוצלים זה בזבוז. בשעות שאופניים בתחנות מסוימות מבוקשים מאוד, הם משתדלים למלא לחלוטין את התחנה, גם אם זה אומר שמי שבמקרה יגיע אליה לא יוכל לקשור בה אופניים, וכך גם במצב ההפוך, של תחנות שהביקוש לחנייה בהן גדל מאוד בשעות מסוימות.

    אני לא חושב שהשיקול בדבר אי התאימויות צריך להיות שיקול מנחה. הרי פעם אחת יש בתחנה שני זוגות אופניים ומחשב חושב שאין בה בכלל זוגות, ופעם אחרת המצב הפוך. תסכים איתי שאם דרך המדידה הנוכחית תקפה, הרי שהיא אמורה לשקף מצב דומה (מבחינת דירוג התחנות) למדידה שאינה מתחשבת במצבים "מסוכנים" של 1/2 זוגות אופניים בתחנה. הייתי שמח לדעת אם אכן כך המצב; אם לא, אני חושב שזו ראיה לא רעה לכך ששיטת המדידה הנוכחית "מפלה לרעה" תחנות שהפעילות בהן נמוכה.

    השבמחק
  10. אני לא בטוח שלגמרי הבנתי את הפיסקה השניה שכתבת - למה כוונתך ב "דרך המדידה הנוכחית"?

    לגבי אי-ההתאמה של מה ש"המחשב" חושב לבין המצב בשטח - אני לא בטוח אם זה סימטרי או לא. הניסיון שלי הוא שיש יותר טעויות מסוג "המחשב חושב שיש אופניים אבל אין" מהכיוון השני.

    אני מסכים לגמרי שדרך המדידה הזו אינה מושלמת, ובהחלט ייתכן שהיא קצת מפלה לרעה תחנות פחות פעילות, וזאת בהנחה שכמות השינוע ביחס לכלל התחנות היא גבוהה (שאחרת, זה משחק תפקיד קטן יותר).

    עם זאת, בהתחשב בכמות המשאבים המוגבלת הקיימת לעריכת מחקר כזה, אני רוצה לקוות שהוא תופס קירוב טוב למדי של המציאות. אני חושש שהתעלמות ממצבי 1/2 ומתן "נקודות רעות" רק לתחנה מלאה/ריקה ברגע הדגימה תיתן תמונה פחות טובה של המציאות (בגלל הסיבות שמניתי למעלה).

    השבמחק
  11. דרך המדידה הנוכחית = המדידה שבאתר הזה, שנותנת נקודות רעות גם לתחנות עם 1/2 זוגות אופניים.

    כמו שאמרתי, תוכל לבצע השוואה פשוטה של דירוג התחנות על פי דרך המדידה הנוכחית לדירוג התחנות אשר אינו נותן נקודות רעות לתחנות עם 1/2 זוגות. אם קיים שוני משמעותי בדירוג, לעניות דעתי זו אינדיקציה חזקה לכשל בשיטת הדירוג הנוכחית. אם תבצע בדיקה כזאת, אשמח לקרוא את הנתונים ולנסות להסיק יחד איתך מסקנות.

    השבמחק
  12. סבבה נדב, שיניתי לבינתיים את אופן החישוב כך ש- 1/2 לא יוסיף נקודות רעות.
    אני לא רואה שינוי משמעותי בפיזור של התחנות הרעות, אם כי עכשיו באמת התחנה ליד העבודה שלי מקבלת את הציון הכי גרוע(!).

    אשמח אם תגיד לי לאחר שתיתן מבט (אני מעדיף להחזיר את ה- 1/2).

    השבמחק
  13. זה הלינק: http://telofast.com/telofun/#stationRankingMap

    השבמחק
  14. טוב, החזרתי בינתיים לחישוב הרגיל (כי זה הורס כל מיני חישובים אחרים).
    אם תרצה לראות את המפה ההיא, תגיד לי ונמצא דרך.

    השבמחק