کتاب چگونه مدلهای زبان بزرگ کار میکنند، نوشته ادوارد راف، درو فاریس و استلا بیدرمن، راهنمایی جامع و قابلفهم برای درک عملکرد مدلهای زبان بزرگ (LLM) مانند GPT و Gemini است. این کتاب با زبانی ساده و بدون نیاز به دانش تخصصی در یادگیری ماشین، شما را با مکانیزمهای داخلی این مدلها، روشهای بهینهسازی و طراحی سیستمهای هوش مصنوعی کارآمد آشنا میکند. خرید نسخه چاپی شامل نسخه رایگان eBook در فرمتهای PDF و ePub و دسترسی به نسخه آنلاین liveBook با دستیار هوش مصنوعی از انتشارات Manning است.
مدلهای زبان بزرگ، قلب فناوریهای هوش مصنوعی مانند ChatGPT و Claude هستند که توانایی تولید پاسخهای شبهانسانی را دارند. این کتاب با توضیح گامبهگام نحوه عملکرد LLMها، از پردازش ورودیها تا تولید خروجیهای معنادار، به شما کمک میکند تا این فناوری را درک کرده و در پروژههای خود به کار ببرید. با مثالهای عملی و نکات کاربردی، این کتاب به شما میآموزد چگونه سیستمهای هوش مصنوعی قابلاعتماد طراحی کنید، خطاها و سوگیریها را کاهش دهید و از LLMها در کاربردهای متنوع فراتر از پردازش زبان استفاده کنید.
بخش اول: مفاهیم پایه و عملکرد LLMها
تصویر کلی: مدلهای زبان بزرگ چیستند؟: مروری بر LLMها و کاربردهای آنها.
توکنایزرها: چگونه LLMها جهان را از طریق کلمات میبینند.
ترانسفورمرها: تبدیل ورودیها به خروجیهای معنادار.
نحوه یادگیری LLMها: فرآیند آموزش و بهبود مدلها.
بخش دوم: بهبود و کاربرد LLMها
محدود کردن رفتار LLMها: روشهایی برای کنترل خروجیها.
فراتر از پردازش زبان طبیعی: کاربردهای LLM در حوزههای غیرمتنی.
سوءتفاهمها، محدودیتها و تواناییهای برجسته LLMها: بررسی واقعیتها و افسانهها.
بخش سوم: طراحی و اخلاق
طراحی راهحلها با مدلهای زبان بزرگ: ساخت سیستمهای هوش مصنوعی کارآمد.
اخلاقیات ساخت و استفاده از LLMها: مدیریت مسائل اخلاقی، قانونی و امنیتی.
این کتاب با مثالهای واقعی، شما را در تست و ارزیابی LLMها، استفاده از تکنیکهایی مانند تنظیم دقیق با نظارت انسانی (Supervised Fine-Tuning)، تولید افزودهشده با بازیابی (RAG) و کاهش سوگیری و خطاها توانمند میکند. از طراحی سیستمهای پرسوجو و پاسخ (Q&A) تا ساخت عاملهای هوشمند، این کتاب ابزارهای لازم برای ایجاد برنامههای هوش مصنوعی قابلاعتماد و مقیاسپذیر را ارائه میدهد. همچنین، نکات مربوط به مصاحبههای طراحی سیستم هوش مصنوعی، این کتاب را برای حرفهایها ارزشمند میکند.
این کتاب بر فناوریهای مدرن مانند مدلهای ترانسفورمر، توکنایزرها و تکنیکهای بهینهسازی مانند RAG تمرکز دارد. این فناوریها با ابزارهایی مانند TensorFlow، PyTorch و پلتفرمهای ابری سازگار هستند و امکان ادغام LLMها با روشهای سنتی یادگیری ماشین را فراهم میکنند.
این کتاب برای توسعهدهندگان، مهندسان و علاقهمندانی که میخواهند بدون نیاز به دانش عمیق در یادگیری ماشین، نحوه عملکرد و کاربرد LLMها را درک کنند، مناسب است. آشنایی پایه با برنامهنویسی (ترجیحاً پایتون) به درک بهتر محتوا کمک میکند.
ادوارد راف (مدیر هوش مصنوعی نوظهور)، درو فاریس (مدیر تحقیقات هوش مصنوعی/یادگیری ماشین) و استلا بیدرمن (پژوهشگر یادگیری ماشین) از شرکت Booz Allen Hamilton، با تجربه گسترده در تحقیقات و توسعه هوش مصنوعی، دانش خود را با زبانی ساده و جذاب ارائه کردهاند.
نظرات کاربران