אלגוריתם לזיהוי אשכולות בעלי משמעות ביולוגית בעזרת מטלב
An algorithm for automated detection of meaningful clusters from genomic data using matlab
תיאור הפרויקט ותכולתו:
במחקר גנומי אנחנו מאפיינים דוגמאות שונות (חולים שונים, תאים שוני וכו') ע"י מדידה מאפיינים (features) מרובים (רמת ביטוי של גן לדוגמא). אחת המשימות החשובות ביותר היא זיהוי של דוגמאות דומות (ע"פ המאפיינים השונים) או של מאפיינים דומים (לאורך הדוגמאות השונות), זוהי משימה של למידה לא-מונחה (unsupervised learning) הנקראת אשכול (clustering.
אחת השיטות הנפוצות לאשכול נתונים היא אשכול היררכי (hierarchical clustering), בשיטה זו מתקבלים אשכולות רבים אך חלקם הגדול חסרי משמעות. אנחנו פיתחנו אלגוריתם שמאפשר זיהוי של אשכולות בעלי משמעות ע"י השוואת התוצאות המתקבלות למודל רנדומי.
מטרת הפרוייקט היא אופטימזציה של האלגוריתם ויישומו בסביבת מטלב.
תכולת הפרוייקט:
• אופטימזציה של האלגוריתם.
• יישום האלגוריתם בסביבת מטלב כך שיהיה נוח לשימוש.
דרישות:
• לימוד והבנה של האלגוריתם
• לימוד של שפת מטלב
מקורות:
• https://en.wikipedia.org/wiki/Hierarchical_clustering
• chapter 14.3.12 in "the elements of statistical learning"
•Silhouettes: A graphical aid to the interpretation and validation of cluster analysis
email: itamarkanter@gmail.com
תאריך עדכון אחרון : 04/12/2022