Formal verification for Deep Reinforcement Learning
שימוש בכלי אימות פורמלי עבור למידה מבוססת חיזוקים המשלבת למידה עמוקה
מספר פרויקט
603
סטטוס - הצעה
הצעה
אחראי אקדמי
מגמת לימוד
שנה
2024
מסלול
מסלול משני
הרקע לפרויקט:
מודלים של למידה מבוססת חיזוקים משלבים בתוכם רשתות נוירונים עמוקות. נרצה להשתמש בכלי אימות פורמלי על מנת לקבל מידע שיעזור לסוכן ללמוד ולהגיע להתכנסות יציבה.
מטרת הפרויקט:
להצליח להראות תרומה של כלי אימות פורמלי עבור בעיות RL המשלבות רשתות נוירונים עמוקות.
תכולת הפרויקט:
בנייה ותכנון של בעיות המשתמשות ב-DRL, שניתן להשתמש עבורן בכלי אימות פורמלי על מנת לייצב את הלמידה ולאפשר לה להתכנס.
קורסי קדם:
למידה מבוססת חיזוקים, אימות פורמלי וסינטזה
דרישות נוספות:
יכולת תכנות גבוהה
מקורות:
https://drive.google.com/file/d/1WAOVDmMDfXpxZ0X0IXu6LAzFKJSVMLrQ/view
תאריך עדכון אחרון : 31/07/2023