ThunderBayes

מתוך וויקי
קפיצה אל: ניווט, חיפוש

ThunderBayes היא הרחבה ל־Thunderbird המאפשרת שילוב של התוכנה עם מסנן דואר הזבל החיצוני SpamBayes.

כידוע, Thunderbird כולל מסנן דואר זבל הפועל בשיטה הבאייסיאנית. כלומר, יש ללמד אותו מה נחשב זבל (ספאם) ומה נחשב דואר טוב (האם*), וכעבור זמן קצר הוא לומד להבחין בעצמו בספאם לפי מבחני סטטיסטיקה. זו אינה התוכנה היחידה הפועלת בשיטה זו, וקיימות תוכנות דואר אחרות המשתמשות בה, וכן מסננים חיצוניים.

SpamBayes

SpamBayes היא תוכנת קוד פתוח, המסננת דואר זבל לפני שהוא מגיע אל תוכנת הדואר, גם כן בשיטה הבאייסיאנית. היא פועלת כשרת מתווך הפועל במחשב, ומעביר דרכו את כל הדואר האלקטרוני. יש להגדיר בו את כתובות שרתי הדואר הנכנס והיוצא, ובתוכנת הדואר יש להגדיר כך שתתחבר אל השרת המתווך במקום ישירות אל שרתי הדואר. לאחר שהתוכנה למדה מהו ספאם ומהו האם, היא מסמנת את הדואר בהתאם, ומאפשרת לסנן אותו בעזרת מסנן שיזהה את הסימון בתוכנת הדואר.

כאמור, Thunderbird כבר מכיל מסנן דואר. אך עדיין יש הבדלים ביעילות בין מסנן אחד לשני, ויש המעדיפים להשתמש במסנן מסויים משום שכבר למדו להכיר אותו ולסמוך עליו. עם זאת, העבודה עם מסנן דואר חיצוני אינה נוחה. יש להיכנס אל אתר האינטרנט הזעיר שמפעיל SpamBayes על המחשב המקומי עם דפדפן ולסמן את ההודעות הנכנסות כספאם או האם, כדי ללמד אותו, וגם לאחר מכן תמיד רצוי לוודא שלא היו טעויות סינון. העובדה שהספאמרים משתנים ומשתכללים כל העת מחייבת תהליך לימוד מתמשך בכל מסנן ספאם מסוג זה.

כאן נכנס ThunderBayes לתמונה. הרחבה זאת מוסיפה לסרגל הכלים של Thunderbird כפתור המאפשר לשלוח את ההודעה הנבחרת אל כתובת מיוחדת שמפעיל השרת המתווך, כדי לתקן טעויות במיון (קיימות כתובות נפרדות להודעות ספאם והודעות האם). באופן זה ניתן ללמד את המסנן מה נחשב ספאם, ומה לא, מבלי לצאת מ-Thunderbird. ההרחבה גם מוסיפה שתי עמודות חדשות לרשימת ההודעות (ב-Thunderbird 2.0 ומעלה). האחת מסמנת האם ההודעה נחשבת ספאם או לא בעיני SpamBayes (ומייתרת את עמודת הספאם המקורית של Thunderbird) והשניה מציינת את ציון הספאם של ההודעה. עמודה זאת מאפשרת למשל לבצע כיוונון עדין של ההגדרות של SpamBayes.

התקנה

תחילה יש להוריד ולהתקין את SpamBayes מהאתר שלהם. לאחר מכן, יש להגדיר את שרתי הדואר הנכנס והיוצא של Thunderbird לכתובת של השרת המתווך (בדר"כ localhost). לאחר הורדת ההרחבה מאתר addons.mozilla.org, יש להתקין אותה על Thunderbird בדרך הרגילה, על ידי פתיחת קובץ ההרחבה מתפריט כלים > תוספות.

עתה יש לכבות את מסנן הזבל הפנימי של Thunderbird לכל חשבון: כלים > הגדרות חשבון > הגדרות דואר זבל, יש לבטל את הסימון של "הפעל בקרות דואר זבל עבור חשבון זה".

צור מסנן חדש, שיזהה את סימון הזבל של SpamBayes: מתפריט כלים בחר מסננים, וצור מסנן חדש. תן לו שם בעל משמעות, כמו למשל "ThunderBayes-ספאם". בחר בעמודה הראשונה "התאמה אישית", ובתיבה "כותרת הודעה חדשה" הקלד X-SpamBayes-Classification. בחר את הכותרת החדשה, בעמודה השניה בחר "הוא" (is באנגלית) ובעמודת ערך החיפוש הכנס spam. עבור מסנן זה, בחר בחלק התחתון להעביר את ההודעות המתאימות אל תיקיית הזבל. אפשר גם לסמן את ההודעות כנקראו.

צור תיקייה חדשה בשם "לא בטוח". תיקייה זו תשמש את ההודעות ש-SpamBayes לא הצליח להחליט אם הן ספאם או האם. באותו אופן כמו קודם, צור מסנן חדש עם הכותרת המותאמת אישית X-SpamBayes-Classification, אך הפעם עם ערך החיפוש unsure. בחר כפעולה על ההודעות המתאימות להעביר אותן אל התיקייה "לא בטוח".

בעת התקנת ההרחבה, הכפתור המשמש לסימון הודעות כספאם או האם לא מוצג אוטומטית בסרגל הכלים. כדי להציג אותו, לחץ לחיצה ימנית על סרגל הכלים ובחר "התאמה אישית". בחר את הכפתור החדש (נראה כמו מעטפה ועליה עיגול ועליו קו אלכסוני, בדומה לשלט אין חניה) והוסף אותו לסרגל הכלים. בשלב זה אפשר גם להסיר מסרגל הכלים, על ידי גרירה אל חלון הכפתורים, את כפתור הזבל המקורי של Thunderbird. לסיום, לחץ על כפתור "אישור".

שימוש

כדי למנוע הגדלה מיותרת של מאגר הנתונים הסטטיסטיים של SpamBayes, מומלץ לסמן רק הודעות שהוא לא הצליח לסמן כהלכה: הודעות שהגיעו אל תיקיית "לא בטוח", וכן הודעות זבל שהגיעו אל תיבת הדואר הנכנס, והודעות לגיטימיות שהגיעו אל תיקיית הזבל. הסימון מבוצע על ידי בחירת ההודעה מרשימת ההודעות, ולחיצה על כפתור הזבל. אם ההודעה מסומנת כהאם, לחיצה על הכפתור תסמן אותה כספאם, ולהיפך - אם היא מסומנת כספאם, לחיצה על הכפתור תסמן אותה כהאם. אם ההודעה מסומנת כ-unsure, לחיצה על הכפתור תפתח תפריט קטן, ממנו יש לבחור Spam או Ham. לאחר הסימון, ההודעה נשלחת אל תוכנת SpamBayes ללימוד. מנסיון אישי, נדיר ביותר שהודעות לגיטימיות מסומנות כזבל, אם כי להיפך קורה מדי פעם.


(*) ספאם הוא במקור שמו של קציץ בשר משומר ולא מעורר תיאבון במיוחד. לכן יש הקוראים לדואר שאינו דואר זבל, בשם "האם", קיצור של המבורגר, קציץ בשר קצת יותר מעורר תיאבון (אבל לא בהרבה).