ובכן, מספרים אין לי - אבל מדובר ברמת אמינות כ"כ גבוהה שעד היום(ועד היום הורידו הרבה קבצים מהאינטרנט) לא היה מקרה שבו MD5 הצליח עבור קובץ פגום.
תחשב לבד מה הסיכוי לכשלון
ואם כבר הזכרנו האשינג...:
ניקח מצב שבו יוצרים אינדקס של מסד נתונים ע"י האשינג. עכשיו נניח שאני לוקח פריט מידע כלשהו, מעביר עליו את אלגוריתם ההאש, ומסתבר שכבר יש תוצאה כזו?
כמובן שכמה שהאלגוריתם יותר טוב, יהיו פחות מקרים כאלה - אבל הם עלולים לקרות גם עם האלגוריתם הטוב ביותר עבור קלטים מסויימים.
השיטה הפשוטה ביותר(והיעילה פחות) היא לעבור לרשומה הבאה.
מה שזה אומר שהחיפוש עלול להיות איטי למדי(כאשר כל המטרה היא חיפוש מהיר) - זה אומר שאם אני מחפש מידע מסויים, מעבירים עליו האשינג, מחפשים את המפתח הזה(ה"קוד" שיצר אלגוריתם ההאש), ומסתבר שזה לא מה שרצינו, אז עוברים רשומה רשומה קדימה עד שמוצאים.
אם יש הרבה מקרים של "קוד" זהה עבור קלטים שונים, וזו הבחירה שעשינו בשביל "התנגשויות", בעצם לא עשינו כלום.
אז, כמו שאמרתי, המטרה היא לצמצם התנגשויות - אבל אחד הנושאים ה"כבדים" בכל עניין ההאשינג הוא מה עושים במקרה של התנגשות(ולא, זה בכלל לא פשוט
)