
کتاب Transformers in Action نوشته نیکول کونیگشتاین، یک راهنمای جامع و کاربردی برای مهندسان داده و متخصصان یادگیری ماشین است که میخواهند با معماری ترنسفورمرها و مدلهای بزرگ زبان (LLM) آشنا شوند و آنها را برای پروژههای خود بهینه کنند. این کتاب شما را از مبانی ترنسفورمرها تا فاینتیون مدلهای بزرگ زبان هدایت میکند و با استفاده از مثالهای عملی و دفترچههای Jupyter اجرایی، مفاهیم پیچیده ریاضی و معماری را به شکل قابل فهم ارائه میدهد.
ترنسفورمرها قلب تپنده ابزارهای هوش مصنوعی تولیدی (Generative AI) مانند ChatGPT، Gemini و Claude هستند. این مدلها با استفاده از مکانیزمی به نام self-attention، میتوانند اهمیت هر جزء ورودی را در متن یا دادهها به شکل پویا ارزیابی کنند.
ترنسفورمرها امکان ایجاد مدلهای زبانی بزرگ را فراهم میکنند که میتوانند:
متن طبیعی را درک و تولید کنند
ترجمه بین زبانها انجام دهند
خلاصهسازی متنها و استخراج اطلاعات مهم
حتی کد نویسی و تولید محتوا را به شکل خودکار انجام دهند
این تواناییها باعث میشوند ترنسفورمرها پایه و اساس بسیاری از ابزارهای هوش مصنوعی مدرن باشند. با یادگیری نحوه کارکرد این مدلها، شما قادر خواهید بود مدلهای پیشآموزش دیده (pretrained) را برای وظایف خاص خود تطبیق دهید و بهرهوری پروژههای خود را افزایش دهید.
کتاب Transformers in Action برای مهندسان داده، متخصصان یادگیری ماشین و توسعهدهندگان AI طراحی شده است. پیشزمینهای در زمینه هوش مصنوعی و یادگیری ماشین مفید است، اما کتاب مفاهیم را به گونهای توضیح میدهد که با تمرین عملی و مثالهای واقعی قابل درک باشد.
نیکول کونیگشتاین، یکی از بنیانگذاران و مدیر ارشد هوش مصنوعی شرکت Quantmate است. او در زمینه توسعه مدلهای AI و راهکارهای نوآورانه در حوزه مالی تجربه گسترده دارد و در این کتاب، تجربیات عملی خود را با مثالهای واقعی به اشتراک گذاشته است.
کتاب شامل سه بخش اصلی و ۱۰ فصل است که هر بخش به یکی از جنبههای ترنسفورمرها و مدلهای بزرگ زبان اختصاص دارد.
در این فصل، شما با دلایل ظهور ترنسفورمرها و مشکلاتی که مدلهای قبلی در پردازش دادههای بزرگ داشتند آشنا میشوید. اهمیت معماری ترنسفورمر و توانایی آن در پردازش متنهای طولانی و پیچیده توضیح داده میشود.
در این بخش، به جزئیات معماری ترنسفورمرها پرداخته میشود و نحوه کارکرد مکانیزم self-attention و لایههای Encoder و Decoder آموزش داده میشود. این فصل پایهای قوی برای فهم مدلهای بزرگ زبان ایجاد میکند.
در این فصل، با انواع مدلها و خانوادههای ترنسفورمرها آشنا میشوید. توضیح داده میشود چگونه میتوان مدلهای موجود را برای وظایف خاص تطبیق داد و از آنها بهره برد.
ایجاد متن هوشمند نیازمند استراتژیهای پیشرفته تولید متن و مهارت در Prompt Engineering است. این فصل نحوه طراحی promptها برای تولید خروجی دقیق و کارآمد را توضیح میدهد.
در این فصل، یاد میگیرید چگونه مدلها را با ترجیحات انسانی همراستا کنید و از تکنیک Retrieval-Augmented Generation برای افزایش دقت و کیفیت پاسخها استفاده کنید.
این فصل به مدلهای چندرسانهای میپردازد که میتوانند متن، تصویر و صدا را همزمان پردازش و تولید کنند. شما یاد میگیرید چگونه این مدلها را برای پروژههای پیشرفته پیادهسازی کنید.
در این بخش، با مدلهای کوچک و بهینهشده آشنا میشوید که میتوانند عملکرد سریع و دقیق داشته باشند و نیاز به منابع کمتری دارند. این مدلها برای کاربردهای محدود و پروژههای سبک بسیار مناسب هستند.
در این فصل، نحوه آموزش، تست و ارزیابی مدلهای بزرگ زبان آموزش داده میشود. نکات مهم در انتخاب دادهها، پیشپردازش و تست مدل ارائه میشود تا عملکرد مدل بهینه شود.
این فصل تکنیکهای بهینهسازی عملکرد، مقیاسبندی و کاهش هزینههای محاسباتی را توضیح میدهد. ابزارهایی مانند Ray Tune و Optuna برای خودکارسازی جستجوی هایپرپارامترها معرفی میشوند.
در این فصل، مسائل اخلاقی و مسئولیتپذیری در استفاده از LLMها مورد بررسی قرار میگیرد. یاد میگیرید چگونه از سوگیری و خطاهای مدل جلوگیری کنید و مدلهایی بسازید که مطابق با استانداردهای اخلاقی عمل کنند.
با مطالعه این کتاب، شما میتوانید:
معماری ترنسفورمرها و نحوه عملکرد آنها را به طور کامل درک کنید
مدلهای پیشآموزش دیده HuggingFace را برای وظایف خاص خود تطبیق دهید
تکنیکهای Prompting، RAG و تقویت با یادگیری از پاداش (RL) را پیادهسازی کنید
عملکرد و مقیاسپذیری مدلهای بزرگ زبان را بهینه کنید
مدلهای چندرسانهای و کوچک را برای کاربردهای ویژه توسعه دهید
از راهنمای اخلاقی و مسئولانه استفاده کنید تا مدلهای ایمن و بدون سوگیری بسازید
این کتاب مناسب کسانی است که میخواهند از ترنسفورمرها و LLMها در پروژههای واقعی بهره ببرند و با مثالهای عملی و دفاتر Jupyter، آموزشهای عملی را تجربه کنند.
کتاب Transformers in Action یک راهنمای عملی، جامع و بهروز برای متخصصان یادگیری ماشین و مهندسان داده است. با مطالعه این کتاب، شما قادر خواهید بود:
مدلهای بزرگ زبان و ترنسفورمرها را از پایه تا پیشرفته درک کنید
مدلهای پیشآموزش دیده را به وظایف جدید و پیچیده تطبیق دهید
پروژههای هوش مصنوعی تولیدی و چندرسانهای خود را عملیاتی کنید
بهینهسازی، مقیاسبندی و اخلاقمداری را در پروژههای AI رعایت کنید
نمونه چاپ کتاب موجود نیست.
نظرات کاربران