از دادههای خام، دانش بسازید! این دوره شما را برای ورود به دنیای هوش مصنوعی و تحلیل داده آماده میکند.
دوره آشنایی با علم داده
اساتید دوره:
پروفسور زهره عظیمی فر؛ استاد تمام دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز
مهندس محمد موسوی؛ دانشجوی دکترای مهندسی کامپیوتر دانشگاه شیراز
علم داده یکی از حوزههای کلیدی در دنیای فناوری امروز است که ترکیبی از ریاضیات، آمار، برنامهنویسی و مهندسی داده برای استخراج دانش از اطلاعات خام را شامل میشود. این دوره آموزشی به شما کمک میکند تا با مفاهیم اساسی و ابزارهای پرکاربرد در علم داده آشنا شوید. از مقدمات و تعاریف پایهای گرفته تا تحلیل دادههای نویزی و مهندسی داده، تمام جنبههای ضروری این حوزه در دوره پوشش داده شدهاند. در این دوره، ابتدا با مفاهیم اساسی مانند ساختارهای داده، ویژگیهای داده و روشهای استخراج داده آشنا میشوید. سپس، روشهای تشخیص و اصلاح نویز در دادهها و تکنیکهای مهندسی داده برای بهبود کیفیت و دقت تحلیلهای دادهای را یاد خواهید گرفت.
این دوره برای افرادی که قصد دارند وارد دنیای هوش مصنوعی و یادگیری ماشین شوند، اهمیت ویژهای دارد. دادهها، سوخت اصلی مدلهای یادگیری ماشین هستند و توانایی درک، پیشپردازش و استخراج دادههای باکیفیت تأثیر مستقیمی بر عملکرد مدلهای یادگیری ماشین دارد. با یادگیری این مفاهیم، شما قادر خواهید بود مجموعه دادههای واقعی را برای الگوریتمهای یادگیری ماشین آماده کنید و عملکرد مدلهای خود را بهینهسازی کنید.
سرفصل های دوره در یک نگاه
- علم داده چیست؟
- آینده شغلی علم داده
این بخش به معرفی مفهوم علم داده و اهمیت آن در صنایع مختلف میپردازد. همچنین، مسیرهای شغلی در علم داده، فرصتهای شغلی و مهارتهای موردنیاز برای تبدیلشدن به یک متخصص علم داده بررسی میشود. این سرفصل برای کسانی که قصد ورود به این حوزه را دارند، بسیار مفید است.
ریاضیات موردنیاز علم داده
در این بخش، مفاهیم ریاضی و آماری که در علم داده و یادگیری ماشین ضروری هستند، بررسی میشود. از جبر خطی گرفته تا احتمالات و آمار توصیفی، دانشجویان با اصول ریاضی که در تحلیل دادهها و مدلهای یادگیری ماشین کاربرد دارند، آشنا میشوند. یادگیری این مباحث برای درک بهتر الگوریتمهای هوش مصنوعی ضروری است.
این سرفصل به بررسی انواع ساختارهای داده از جمله دادههای عددی، متنی، تصویری و گرافی میپردازد. هرکدام از این ساختارها در کاربردهای خاصی از علم داده استفاده میشوند. به عنوان مثال، دادههای متنی در پردازش زبان طبیعی (NLP) و دادههای تصویری در بینایی کامپیوتر مورد استفاده قرار میگیرند.
بازنمایی ساختارها در پایتون
این بخش به پیادهسازی انواع دادههای علمی در پایتون میپردازد. یادگیری نحوه نمایش و پردازش انواع دادهها در پایتون به دانشجویان کمک میکند تا بتوانند اطلاعات را در قالبهای مناسب پردازش و تجزیهوتحلیل کنند.
- ویژگی داده
- استخراج داده
- برنامهنویسی مرتبط با استخراج داده
این سرفصل بر اهمیت استخراج داده و تعیین ویژگیهای کلیدی آن تمرکز دارد. روشهای مختلف برای جمعآوری دادهها از منابع مختلف (وب، پایگاههای داده، سنسورها و غیره) معرفی شده و نحوه پیادهسازی آنها در پایتون آموزش داده میشود. این مبحث بهویژه در کاربردهای یادگیری ماشین اهمیت دارد، زیرا کیفیت دادهها تأثیر مستقیمی بر دقت مدلهای پیشبینیکننده دارد.
- نویز و ویژگیهای آن
- تشخیص دادههای نویزی
- برنامهنویسی مرتبط با دادههای نویزی
دادههای واقعی اغلب دارای نویز هستند که میتواند بر روی دقت تحلیلها و پیشبینیها تأثیر منفی بگذارد. در این بخش، روشهای مختلف برای تشخیص و حذف نویز از دادهها بررسی میشود. همچنین، تکنیکهای مختلفی برای فیلتر کردن دادههای بیکیفیت و بهبود دقت مدلهای تحلیلی آموزش داده خواهد شد.
- روشهای مهندسی داده
- برنامهنویسی مرتبط با مهندسی داده
مهندسی داده یکی از مهمترین مراحل در تحلیل داده و یادگیری ماشین است. در این بخش، روشهای مختلفی برای پاکسازی، تبدیل، و استانداردسازی دادهها بررسی میشود. دانشجویان با تکنیکهای پردازش داده و برنامهنویسی مربوط به آن آشنا شده و یاد میگیرند که چگونه دادهها را برای استفاده در مدلهای یادگیری ماشین آمادهسازی کنند.
+ نمایش بیشتر