
practical roadmap from deep learning fundamentals to advanced applications and Generative AI
کتاب بینایی کامپیوتری مدرن با PyTorch (ویرایش دوم)، منبعی جامع برای مبتدیان و متخصصان یادگیری عمیق است که میخواهند با استفاده از PyTorch، یکی از قدرتمندترین چارچوبهای یادگیری عمیق، در حوزه بینایی کامپیوتری مهارت کسب کنند. این کتاب شما را از مفاهیم پایه شبکههای عصبی (NNs) تا پیادهسازی معماریهای پیشرفته مانند CLIP، Stable Diffusion و Segment-Anything هدایت میکند. با تمرکز بر کاربردهای واقعی مانند تشخیص نقاط کلیدی چهره، تشخیص چند شیء، تقسیمبندی تصویر و تشخیص حالت بدن، این کتاب بهترین شیوهها برای کار با تصاویر، تنظیمهایپرپارامترها و انتقال مدلها به محیط تولید را آموزش میدهد. ویرایش دوم این کتاب بهروز شده و شامل مثالهای عملی از مدلهای چندوجهی مدرن و مدلهای پایه (Foundation Models) است.
مفاهیم پایه شبکههای عصبی و PyTorch: یادگیری اصول شبکههای عصبی و نحوه استفاده از PyTorch برای پیادهسازی آنها.
معماریهای پیشرفته: کاوش معماریهای مبتنی بر ترنسفورمر مانند ViT، TrOCR، BLIP2 و LayoutLM برای وظایف واقعی.
کاربردهای چندوجهی: ترکیب بینایی کامپیوتری و پردازش زبان طبیعی (NLP) برای وظایفی مانند OCR، استخراج کلید-مقدار، پرسوجو بصری و وظایف مولد AI.
تشخیص و تقسیمبندی شیء: پیادهسازی تشخیص چند شیء، تقسیمبندی تصویر و استفاده از مدلهای پایه برای تشخیص و تقسیمبندی بدون نیاز به داده آموزشی.
تولید تصویر: یادگیری تولید تصویر با استفاده از GANها و ساخت مدلهای انتشار (Diffusion Models) مانند Stable Diffusion از صفر.
انتقال به تولید: بهترین شیوهها برای استقرار مدلهای یادگیری عمیق در محیط تولید.
مثالهای عملی: نوتبوکهای GitHub با مثالهای کدنویسی برای یادگیری عملی و پروژههای واقعی.
کتاب بینایی کامپیوتری مدرن با PyTorch با ساختاری منظم و پروژهمحور، شما را از مفاهیم پایه تا کاربردهای پیشرفته بینایی کامپیوتری هدایت میکند. این کتاب در چندین فصل، موضوعات کلیدی زیر را پوشش میدهد:
مفاهیم پایه و شروع کار
مبانی شبکههای عصبی مصنوعی: معرفی اصول شبکههای عصبی و یادگیری عمیق.
مبانی PyTorch: یادگیری ابزارها و قابلیتهای PyTorch برای توسعه مدلهای یادگیری عمیق.
ساخت شبکه عصبی عمیق با PyTorch: پیادهسازی یک شبکه عصبی از پایه.
شبکههای کانولوشنی و یادگیری انتقالی
معرفی شبکههای کانولوشنی (CNN): یادگیری مفاهیم و کاربردهای CNN در بینایی کامپیوتری.
یادگیری انتقالی برای طبقهبندی تصویر: استفاده از مدلهای از پیش آموزشدیده برای بهبود عملکرد.
جنبههای عملی طبقهبندی تصویر: تکنیکهایی برای بهینهسازی و تنظیم مدلهای طبقهبندی.
تشخیص و تقسیمبندی شیء
مبانی تشخیص شیء: اصول تشخیص شیء در تصاویر.
تشخیص شیء پیشرفته: پیادهسازی مدلهای پیشرفته برای تشخیص چند شیء.
تقسیمبندی تصویر: یادگیری تکنیکهای تقسیمبندی تصویر برای کاربردهای واقعی.
کاربردهای تشخیص و تقسیمبندی شیء: استفاده از مدلهای پایه برای وظایف بدون نیاز به داده آموزشی.
تولید و دستکاری تصویر
اتواینکودرها و دستکاری تصویر: یادگیری دستکاری و بازسازی تصاویر با اتواینکودرها.
تولید تصویر با GANها: کاوش معماریهای شبکههای مولد رقابتی (GAN) برای تولید تصویر.
موضوعات پیشرفته (از طریق گزینه Read Sample)
کاوش مدلهای چندوجهی مانند CLIP و Stable Diffusion.
پیادهسازی وظایف مانند In-Painting، انتقال حالت و استخراج کلید-مقدار.
ساخت مدل انتشار از صفر و استفاده از مدلهای پایه برای تشخیص و تقسیمبندی بدون آموزش.
کتاب بینایی کامپیوتری مدرن با PyTorch برای افراد زیر مناسب است:
مبتدیان در PyTorch: افرادی که تازه شروع به یادگیری PyTorch و بینایی کامپیوتری کردهاند و دانش پایه پایتون و یادگیری ماشین دارند.
متخصصان یادگیری عمیق در سطح متوسط: توسعهدهندگانی که میخواهند تکنیکهای پیشرفته بینایی کامپیوتری را با PyTorch پیادهسازی کنند.
دانشمندان بینایی کامپیوتری با تجربه: افرادی که به دنبال یادگیری مدلهای مدرن مانند CLIP، Stable Diffusion و Segment-Anything هستند.
علاقهمندان به مدلهای چندوجهی: توسعهدهندگانی که میخواهند بینایی کامپیوتری را با NLP ترکیب کنند.
PyTorch به دلیل انعطافپذیری و پشتیبانی از تحقیقات پیشرفته، یکی از محبوبترین چارچوبهای یادگیری عمیق است. بینایی کامپیوتری در کاربردهایی مانند تشخیص چهره، خودرانها، پردازش اسناد و تولید تصویر نقش کلیدی دارد. این کتاب با آموزش معماریهای مدرن مانند ترنسفورمرها، CLIP و Stable Diffusion، و ارائه نوتبوکهای GitHub، شما را برای حل چالشهای واقعی بینایی کامپیوتری آماده میکند.
یکی از نقاط قوت این کتاب، استفاده از نوتبوکهای GitHub و مثالهای کدنویسی عملی است که مفاهیم را در سناریوهای واقعی مانند تشخیص نقاط کلیدی چهره، تقسیمبندی تصویر و تولید تصویر پیادهسازی میکنند. این کتاب همچنین شما را با بهترین شیوهها برای انتقال مدلها به محیط تولید آشنا میکند.
نویسندگان این کتاب، متخصصان برجسته در حوزه یادگیری عمیق و بینایی کامپیوتری هستند که تجربه گستردهای در توسعه مدلهای پیشرفته با PyTorch دارند. آنها با زبانی ساده و مثالهای عملی، مفاهیم پیچیده را به شکلی قابل فهم ارائه کردهاند.
مبانی شبکههای عصبی مصنوعی
مبانی PyTorch
ساخت شبکه عصبی عمیق با PyTorch
معرفی شبکههای کانولوشنی
یادگیری انتقالی برای طبقهبندی تصویر
جنبههای عملی طبقهبندی تصویر
مبانی تشخیص شیء
تشخیص شیء پیشرفته
تقسیمبندی تصویر
کاربردهای تشخیص و تقسیمبندی شیء
اتواینکودرها و دستکاری تصویر
تولید تصویر با GANها
نمونه چاپ کتاب موجود نیست.
نظرات کاربران