Analysis and Inference of DEEP learning models

אניליזה ו INFERANCE של מודלי למידה עמוקב

מספר פרויקט
419
סטטוס - הצעה
הצעה
אחראי אקדמי
שנה
2024

הרקע לפרויקט:

פסקה המתארת את הטכנולוגיה הרלוונטית לפרויקט ואת משמעות הפרויקט בהקשר זה

מודלים של למידה עמוקה מצריכים משאבים רבים של זיכרון וכח מיחשוב חזק. פרויקט זה עוסק בניתוח ואופטימיזציה של מערכות למידה עמוקה בזמן האימון והשימוש במודלים.

מטרת הפרויקט:

מטרת הפרויקט הנה להקטין את גודל המודלים ולהקטין את העומס החישובי על ה GPU תוך שמירה על ביצועים (BIT EXACT ).  במהלך הפרויקט יבחנו ביצועים של מספר מודלים מסחריים (התלמידים יעשו סקר ספרות על שוק ה   [1-3] CHATBOTS), מודלים אשר פותחו במעבדה ומודלים שיפותחו במהלך הפרויקט.

בפרויקט נבחן ביצועים של המערכת כתלות בגודל משתנה המודל (double vs. Int16   וכו') ומספר הפרמטרים ביחס למודל המקורי.

כמו כן תבדק סיפריית JIT לפיתון [8-10] לצורך שיפור ביצועים ב CPU ויבחנו כלי PROFILING ל CPU[11]

תכולת הפרויקט:

  1. פירוט של מטלות הסטודנטים בפרויקט

    במסגרת הפרויקט יבחנו מגוון כלים אשר נמצאים בשוק, למשל:

  2. עבודה עם כלים לביצוע PROFILING לנצילות השימוש ב GPU[6]
  3. כלים ל MODEL INFERANCE [4,5]
  4. השוואת ביצועים בעזרת מדדים סטטיסטיים.


קורסי קדם:

  • פיתון ברמה גבוהה


מקורות:

  1. https://openai.com/blog/introducing-chatgpt-and-whisper-apis
  2. https://bard.google.com/chat
  3. https://lmsys.org/blog/2023-03-30-vicuna/
  4. https://developer.nvidia.com/tensorrt-getting-started
  5. https://onnx.ai/
  6. https://developer.nvidia.com/nsight-systems/get-started
  7. https://developer.nvidia.com/nsight-compute
  8. https://numba.pydata.org/
  9. https://numba.readthedocs.io/en/stable/user/5minguide.html
  10. https://www.nvidia.com/en-us/glossary/numba/
  11. https://docs.python.org/3/library/profile.html#module-cProfile

תאריך עדכון אחרון : 18/01/2024