סקירה של שיטות clustering למידע בוליאני

הבעיה שננסה לפתור בסרטון היא חלוקה לקבוצות (clustering) של משתמשי פייסבוק,

כאשר המידע היחיד שנתון לנו עליהם הוא רשימת הדפים שעשו להם לייק.

נסקור שיטות מבוססות מרחק (metric) שיטות matrix factorization ושיטות מעיבוד שפות טבעיות Bag of words.

כתיבת תגובה