
دوره جامع اصول یادگیری ماشین
استاد دوره: دکتر امیرحسین کریمی؛ استادیار دانشکده مهندسی برق و کامپیوتر دانشگاه واترلو کانادا
با ثبت نام زودهنگام در دوره یادگیری ماشین بیش از ۲۱ میلیون تومان تخفیف بگیرید و هنگام ثبت نام زود هنگام نیز نیمی از مبلغ کل، یعنی تنها ۱۲ میلیون تومان را پرداخت کنید.
یادگیری ماشین (Machine Learning) یکی از مهمترین شاخههای هوش مصنوعی است که در بسیاری از حوزهها از جمله تحلیل داده، بینایی کامپیوتر، پردازش زبان طبیعی، رباتیک، پزشکی و تجارت نقش کلیدی دارد. در این دوره، که توسط دکتر امیرحسین کریمی، استادیار دانشگاه واترلو تدریس میشود، مفاهیم بنیادین یادگیری ماشین از سطح پایه تا مباحث پیشرفته پوشش داده میشوند.
دوره با معرفی کلی یادگیری ماشین، تاریخچه آن و تفاوتهای آن با سایر حوزههای مرتبط آغاز میشود. سپس، الگوریتمهای کلاسیک مانند نزدیکترین همسایگان (k-NN)، درختهای تصمیم، مدلهای رگرسیونی و ماشینهای بردار پشتیبان (SVM) بررسی خواهند شد. در مراحل بعدی، دانشجویان با شبکههای عصبی، یادگیری عمیق (Deep Learning)، پردازش تصاویر (Computer Vision)، پردازش زبان طبیعی (NLP)، روشهای کاهش ابعاد (Dimensionality Reduction)، روش های دسته بندی بدون نظارت (Clustering & Mixture Modeling), و یادگیری تقویتی (Reinforcement Learning) آشنا میشوند.
این دوره برای دانشجویان علوم داده، محققان هوش مصنوعی و توسعهدهندگان یادگیری ماشین طراحی شده است و به آنها کمک میکند تا نحوه انتخاب، پیادهسازی و ارزیابی مدلهای یادگیری ماشین را در مسائل واقعی درک کنند.
سرفصل های دوره در یک نگاه
مقدمه: تاریخچه و مفاهیم پایه یادگیری ماشین
این سرفصل به معرفی یادگیری ماشین و جایگاه آن در حوزهی هوش مصنوعی میپردازد. در ابتدا، مفهوم هوش مصنوعی و یادگیری ماشین توضیح داده شده و تفاوت آن با سایر روشهای برنامهنویسی مشخص میشود. سپس، انواع یادگیری ماشین شامل یادگیری نظارتی، بدون نظارت و تقویتی معرفی میشوند و کاربردهای متنوع آن در زمینههایی مانند تحلیل داده، پزشکی، اقتصاد، رباتیک، بینایی کامپیوتر و پردازش زبان طبیعی (NLP) بررسی میشود. همچنین، این بخش تاریخچهی تکامل یادگیری ماشین از آغاز تا امروز را مرور میکند تا دانشجویان درکی از تحولات اساسی و پیشرفتهای کلیدی این حوزه داشته باشند. اهمیت این سرفصل در آن است که دانشجویان یک دید کلی نسبت به حوزهی یادگیری ماشین پیدا میکنند و متوجه میشوند که چرا این دانش در حل مسائل پیچیدهی دنیای واقعی اهمیت دارد.
الگوریتم نزدیکترین همسایگان (k-NN)
الگوریتم نزدیکترین همسایگان (k-NN) یکی از سادهترین و درعینحال مؤثرترین روشهای یادگیری ماشین است که برای طبقهبندی و رگرسیون دادهها استفاده میشود. این روش بر اساس محاسبهی فاصله بین نقاط دادهای کار میکند و نمونهای جدید را به گروهی از دادههای نزدیکترین همسایگان خود اختصاص میدهد. در این سرفصل، ابتدا مفاهیم داده، نحوهی نمایش دادهها و چگونگی تقسیمبندی دادهها به مجموعههای آموزش و تست بررسی میشوند. سپس، نحوهی عملکرد الگوریتم k-NN، معیارهای مختلف سنجش فاصله مانند L-p norms و کسینوس شباهت و همچنین نقاط قوت و ضعف این الگوریتم توضیح داده خواهند شد. این مبحث اهمیت زیادی دارد زیرا مفهوم اساسی شباهت دادهها و تأثیر معیارهای فاصلهسنجی بر نتایج مدل را نشان میدهد. این الگوریتم در کاربردهای متنوعی مانند سیستمهای توصیهگر، تشخیص چهره، پردازش تصویر و تحلیل رفتار مشتریان استفاده میشود.
درختهای تصمیم (Decision Trees)
درختهای تصمیم از جمله مدلهای یادگیری ماشین هستند که برای طبقهبندی و رگرسیون دادهها به کار میروند و بر پایهی سلسلهای از تصمیمات شرطی عمل میکنند. این سرفصل به معرفی ساختار درختهای تصمیم، چگونگی تقسیمبندی دادهها در هر گره و نحوهی ایجاد مرزهای تصمیمگیری میپردازد. همچنین، روشهایی مانند آنتروپی، کسب اطلاعات (Information Gain) و میزان عدم قطعیت دادهها برای تصمیمگیری در هر گره بررسی میشوند. یکی از ویژگیهای مهم درختهای تصمیم، قابلیت تفسیر آسان نتایج مدل است که آن را به گزینهای محبوب در تحلیل دادههای پزشکی، تحلیل ریسک در سیستمهای مالی و پیشبینی رفتار مشتریان تبدیل کرده است. درک این سرفصل ضروری است زیرا دانشجویان را با یکی از سادهترین و درعینحال مؤثرترین روشهای مدلسازی آشنا میکند و پایهای برای یادگیری مدلهای پیشرفتهتری مانند جنگلهای تصادفی (Random Forest) و گرادیان بوستینگ (Gradient Boosting) فراهم میآورد.
تعمیمپذیری و روشهای تجمیع مدلها (Ensembling)
یکی از مهمترین چالشهای یادگیری ماشین، تعادل بین بایاس و واریانس در مدلها است که مستقیماً بر دقت و تعمیمپذیری مدل تأثیر میگذارد. این سرفصل به بررسی مفهوم بایاس-واریانس (Bias-Variance Tradeoff) و روشهای ترکیب مدلها برای کاهش این چالش میپردازد. دانشجویان با تکنیکهای Bagging، Boosting و مدلهای تجمیعی مانند جنگل تصادفی (Random Forest) آشنا میشوند. اهمیت این بخش در آن است که یادگیری روشهای تجمیع مدلها باعث افزایش دقت مدل، کاهش بیشبرازش (Overfitting) و بهبود عملکرد در دادههای جدید میشود. این مبحث برای کسانی که قصد دارند مدلهای یادگیری ماشین قدرتمند و پایدار ایجاد کنند، حیاتی است و در تحلیل دادههای پزشکی، پیشبینی بازارهای مالی و سیستمهای پیشنهاددهنده کاربرد زیادی دارد.
رگرسیون خطی (Linear Regression)
رگرسیون خطی یکی از مدلهای پایهای یادگیری ماشین برای پیشبینی مقادیر عددی است که رابطهی بین یک متغیر وابسته و یک یا چند متغیر مستقل را با استفاده از یک خط مستقیم مدلسازی میکند. در این سرفصل، دانشجویان با چگونگی تعریف مدل رگرسیونی، روشهای محاسبهی ضرایب مدل، معیارهای ارزیابی دقت مانند خطای میانگین مربعات (MSE)، و روشهای بهینهسازی مدل مانند گرادیان نزولی (Gradient Descent) آشنا میشوند. این سرفصل اهمیت زیادی دارد زیرا رگرسیون خطی در بسیاری از حوزهها از جمله تحلیل روند بازار، پیشبینی فروش، تحلیل دادههای زیستپزشکی و حتی در روشهای پیچیدهتر یادگیری ماشین استفاده میشود. همچنین، این مدل پایهای برای درک روشهای پیچیدهتر مانند رگرسیون لجستیک و شبکههای عصبی مصنوعی است.
طبقهبندی خطی و پرسپترون
این سرفصل به بررسی مدلهای طبقهبندی خطی و یکی از اولین مدلهای شبکههای عصبی به نام پرسپترون میپردازد. دانشجویان یاد میگیرند که چگونه یک مرز تصمیمگیری خطی بین دستههای مختلف دادهها ترسیم کنند و همچنین با تابع زیان، دقت و معیارهای ارزیابی طبقهبندی آشنا میشوند. الگوریتم پرسپترون، اولین مدل یادگیری عصبی مصنوعی است که نشان داد چگونه یک مدل میتواند از طریق دادههای ورودی وزنهای خود را بهینهسازی کند و از خطاها بیاموزد. درک این مبحث ضروری است زیرا پرسپترون پایهای برای مدلهای پیچیدهتر مانند شبکههای عصبی چندلایه (MLP) و یادگیری عمیق (Deep Learning) محسوب میشود و در تشخیص تصویر، پردازش زبان طبیعی و سیستمهای توصیهگر کاربرد دارد.
رگرسیون لجستیک (Logistic Regression)
رگرسیون لجستیک یک روش یادگیری ماشین برای طبقهبندی دادهها است که برخلاف رگرسیون خطی، خروجی آن احتمال قرارگیری یک نمونه در یک کلاس خاص است. در این سرفصل، دانشجویان یاد میگیرند که چگونه مدل رگرسیون لجستیک را تعریف کنند، چگونه از تابع سیگموئید برای تبدیل مقادیر خطی به احتمالات استفاده کنند، و چگونه حداکثر درستنمایی (Maximum Likelihood Estimation) را برای تخمین پارامترهای مدل به کار ببرند. اهمیت این مدل در این است که یکی از پرکاربردترین روشها در تحلیل دادههای پزشکی، تشخیص بیماریها، تحلیل ریسک در بیمه و پیشبینی رفتار مشتریان است. همچنین، درک این روش به دانشجویان کمک میکند تا آماده یادگیری مدلهای پیچیدهتری مانند شبکههای عصبی و مدلهای طبقهبندی پیشرفته شوند.
ماشینهای بردار پشتیبان (SVM)
ماشینهای بردار پشتیبان (SVM) الگوریتمی برای جداسازی دادهها به بهترین شکل ممکن با استفاده از یک ابرصفحه (Hyperplane) است. در این سرفصل، مفاهیم طبقهبندی با بیشترین حاشیه (Max-Margin Classification)، روشهای بهینهسازی با ضربکنندههای لاگرانژ، و گسترش SVM به حالت غیرخطی بررسی خواهند شد. این الگوریتم یکی از دقیقترین روشهای یادگیری ماشین محسوب میشود و در بینایی کامپیوتر، تشخیص چهره و تحلیل متون کاربرد گستردهای دارد.
شبکههای عصبی مصنوعی (Neural Networks)
شبکههای عصبی مصنوعی یکی از مهمترین ابزارهای یادگیری ماشین هستند که از ساختار مغز انسان الهام گرفتهاند و از مجموعهای از نورونهای مصنوعی تشکیل شدهاند. در این سرفصل، ابتدا مفاهیم نورونهای مصنوعی، لایههای ورودی، مخفی و خروجی، و نحوه پردازش دادهها در یک شبکه عصبی بررسی میشود. سپس، دانشجویان یاد میگیرند که چگونه وزنهای نورونها تنظیم میشوند و چگونه یک شبکه عصبی میتواند الگوهای پیچیده را شناسایی کند. این مبحث اهمیت دارد زیرا شبکههای عصبی پایهی یادگیری عمیق (Deep Learning) و بسیاری از مدلهای پیشرفته مانند شبکههای پیچشی (CNN) و شبکههای بازگشتی (RNN) هستند. امروزه شبکههای عصبی در پردازش تصویر، تشخیص صدا، خودروهای خودران، پزشکی و هوش مصنوعی بازیها کاربرد گستردهای دارند.
پسانتشار خطا (Backpropagation)
پسانتشار خطا الگوریتمی است که برای آموزش شبکههای عصبی استفاده میشود و به مدل اجازه میدهد از طریق تنظیم وزنهای نورونها، خطاهای خود را کاهش دهد. در این سرفصل، دانشجویان با قانون زنجیرهای در مشتقات، نحوه محاسبه گرادیان و الگوریتم گرادیان نزولی برای بهروزرسانی وزنها آشنا میشوند. همچنین، چالشهایی مانند گرادیانهای ناپدیدشونده و انفجاری (Vanishing & Exploding Gradients) مورد بررسی قرار میگیرند. درک این الگوریتم برای پیادهسازی و بهینهسازی مدلهای یادگیری عمیق حیاتی است، زیرا روش پسانتشار هستهی تمام شبکههای عصبی مدرن محسوب میشود و در حوزههایی مانند بینایی کامپیوتر، ترجمه ماشینی و تشخیص گفتار کاربرد دارد.
شبکههای عصبی پیچشی (CNN) - قسمت اول
شبکههای عصبی پیچشی (CNN) نوعی شبکه عصبی هستند که برای پردازش دادههای تصویری و مکانی طراحی شدهاند. در این سرفصل، مفاهیم فیلترهای پیچشی، عملیات کانولوشن، ماتریسهای Toeplitz، و لایههای پیچشی بررسی خواهند شد. دانشجویان یاد میگیرند که چگونه یک CNN ویژگیهای کلیدی تصاویر را استخراج میکند و چرا این روش نسبت به شبکههای عصبی استاندارد کارآمدتر است. اهمیت این مبحث در این است که CNNها پایهی بسیاری از فناوریهای پیشرفته مانند تشخیص اشیا، خودروهای خودران، پردازش تصاویر پزشکی و واقعیت افزوده هستند.
شبکههای عصبی پیچشی (CNN) - قسمت دوم
در ادامهی سرفصل قبلی، این بخش به بررسی لایههای مختلف شبکههای CNN، روشهای بهینهسازی و معماریهای معروف مانند VGGNet، ResNet و Inception میپردازد. همچنین، دانشجویان با هیستوگرام ویژگیهای گرادیان (HOG)، تکنیکهای کاهش ابعاد مانند لایههای Pooling، و بهینهسازی وزنهای شبکه با استفاده از الگوریتمهای پیشرفته آشنا خواهند شد. یادگیری این مباحث برای توسعهی مدلهای تشخیص تصویر در بینایی کامپیوتر، پردازش ویدئو و تحلیل تصاویر ماهوارهای بسیار حیاتی است.
پردازش زبان طبیعی (NLP) - قسمت اول
پردازش زبان طبیعی (NLP) یکی از شاخههای کلیدی هوش مصنوعی است که به درک و پردازش متون انسانی توسط کامپیوترها میپردازد. در این سرفصل، مفاهیم مدلهای زبانی n-gram، روشهای توزیع واژهها (Word Embeddings) و روشهای کلاسیک مانند مدلهای مارکوف مخفی (HMM) بررسی خواهند شد. این مبحث اهمیت زیادی دارد زیرا NLP پایهی موتورهای جستجو، ترجمه ماشینی، چتباتها و سیستمهای تحلیل احساسات است و باعث میشود کامپیوترها بتوانند متون را پردازش و تفسیر کنند.
پردازش زبان طبیعی (NLP) - قسمت دوم
در ادامهی بخش قبل، این سرفصل به مدلهای پیشرفتهتر پردازش زبان مانند شبکههای بازگشتی (RNN)، مدلهای LSTM و مکانیزمهای توجه (Attention Mechanism) میپردازد. همچنین، معماریهای مدرن مانند Transformer و مدلهای معروفی همچون BERT و GPT بررسی میشوند. این مبحث اهمیت زیادی دارد زیرا NLP ستون فقرات بسیاری از فناوریهای مبتنی بر هوش مصنوعی مانند دستیارهای صوتی (مانند Siri و Google Assistant)، تحلیل متن و ترجمه ماشینی است.
مدلهای احتمالاتی: تفکیکی در مقابل مولد
مدلهای احتمالاتی دو دستهی تفکیکی (Discriminative) و مولد (Generative) را شامل میشوند که در این سرفصل به مقایسهی این دو روش پرداخته میشود. مدلهای تفکیکی مانند رگرسیون لجستیک و SVM، مستقیماً مرز تصمیمگیری بین کلاسها را یاد میگیرند، در حالی که مدلهای مولد مانند Naive Bayes و شبکههای مولد تخاصمی (GANs)، توزیع دادهها را تخمین زده و دادههای جدید تولید میکنند. درک این مبحث اهمیت زیادی دارد زیرا مدلهای مولد در ساخت دادههای مصنوعی، افزایش دقت مدلهای یادگیری عمیق و تقویت یادگیری ماشین در شرایط کمبود داده بسیار کاربردی هستند.
خوشهبندی و تخمین چگالی: K-Means و ترکیب گوسیها
خوشهبندی یک روش یادگیری ماشین بدون نظارت است که دادهها را بر اساس شباهتهایشان گروهبندی میکند. در این سرفصل، الگوریتم K-Means، روشهای بهینهسازی مرکز خوشهها، و چالشهایی مانند تعیین تعداد بهینهی خوشهها بررسی خواهند شد. همچنین، مدلهای ترکیب گوسی (Gaussian Mixture Models - GMM) و الگوریتم بیشینهسازی امید (Expectation Maximization - EM) معرفی میشوند که برای مدلسازی توزیعهای چندمتغیره و تحلیل دادههای پیچیده بسیار کاربرد دارند. یادگیری این مبحث برای سیستمهای توصیهگر، تحلیل رفتار کاربران و کاهش ابعاد دادهها ضروری است.
کاهش ابعاد: تحلیل مؤلفههای اصلی (PCA)
تحلیل مؤلفههای اصلی (PCA) یکی از تکنیکهای کاهش ابعاد دادهها است که باعث میشود بدون از دست دادن اطلاعات کلیدی، تعداد ویژگیهای داده کاهش یابد. در این سرفصل، مفاهیمی مانند مقادیر ویژه و بردارهای ویژه، تبدیل ماتریسها و تحلیل کوواریانس دادهها بررسی میشوند. PCA در بسیاری از کاربردهای یادگیری ماشین مانند تشخیص چهره، فشردهسازی داده و بینایی ماشین مورد استفاده قرار میگیرد و باعث کاهش پیچیدگی محاسباتی و افزایش کارایی مدلها میشود.
یادگیری تقویتی (Reinforcement Learning)
یادگیری تقویتی (RL) یکی از هیجانانگیزترین مباحث یادگیری ماشین است که در آن مدل از طریق دریافت پاداش یا جریمه، رفتار بهینه را یاد میگیرد. در این سرفصل، مفاهیمی مانند فرآیند تصمیمگیری مارکوف (MDP)، توابع ارزش (Value Functions) و سیاستهای تصمیمگیری (Policies) بررسی خواهند شد. همچنین، روشهای کلاسیکی مانند الگوریتم ارزشگذاری (Value Iteration) و الگوریتم سیاستگذاری (Policy Iteration) تدریس میشوند. یادگیری این مبحث برای توسعهی رباتهای خودمختار، بازیهای کامپیوتری و سیستمهای بهینهسازی صنعتی بسیار حیاتی است.
نظرات
قیمت