کتاب مدلهای زبان بزرگ در تولید راهنمایی کاربردی و جامع برای توسعهدهندگان و متخصصان هوش مصنوعی است که میخواهند برنامههای مبتنی بر مدلهای زبان بزرگ (LLMs) مانند ChatGPT، Llama و Bard را بهصورت ایمن و کارآمد در محیطهای تولیدی مستقر کنند. این کتاب با ارائه توضیحات شفاف، مثالهای غنی و راهکارهای عملی، شما را از مفاهیم پایه LLMs تا استقرار آنها در ابر و دستگاههای لبه (Edge) هدایت میکند. با تمرکز بر عملیات مدلهای زبان بزرگ (LLMOps)، این کتاب به شما کمک میکند تا چتباتها، دستیارهای کدنویسی و سایر برنامههای هوشمند را با موفقیت پیادهسازی کنید.
مدلهای زبان بزرگ، فناوریهای پیشرو در هوش مصنوعی مدرن، تواناییهای شگفتانگیزی در تولید متن، پاسخ به سوالات و خودکارسازی وظایف دارند. اما استقرار این مدلها در محیطهای واقعی چالشهای خاص خود را دارد. این کتاب با آموزش اصول LLMs، نحوه تعامل با آنها و ادغام در برنامهها، شما را برای غلبه بر این چالشها آماده میکند. از انتخاب بین استفاده از مدلهای آماده یا ساخت مدلهای سفارشی تا مقیاسپذیری و مدیریت خطاها، این کتاب راهکارهای عملی و توصیههای با تجربه را ارائه میدهد تا از نقاط قوت LLMs بهره ببرید و ضعفهای آنها را کاهش دهید.
بخش اول: مفاهیم پایه و فناوری
بیداری کلمات: چرا LLMs توجه جهانی را جلب کردهاند؟
غواصی عمیق در مدلسازی زبان: درک فناوری پشت مدلهای زبان بزرگ.
عملیات مدلهای زبان بزرگ: ساخت پلتفرمی برای مدیریت LLMs.
بخش دوم: آمادهسازی و آموزش
مهندسی داده برای LLMs: آمادهسازی دادهها برای موفقیت در پروژهها.
آموزش مدلهای زبان بزرگ: چگونگی تولید مدلهای پایه و تنظیم دقیق آنها.
مهندسی پرامپت: تبدیل شدن به یک متخصص در تعامل با LLMs.
بخش سوم: استقرار و کاربردها
سرویسهای مدل زبان بزرگ: راهنمای عملی برای پیادهسازی سرویسها.
برنامههای LLM: ساخت تجربیات تعاملی با استفاده از LLMs.
پیادهسازی پروژه Llama 3: بازسازی یک پروژه LLM از ابتدا.
ساخت دستیار کدنویسی: ایجاد یک دستیار کدنویسی هوشمند.
بخش چهارم: استقرار در محیطهای خاص
استقرار LLM روی Raspberry Pi: اجرای مدلها روی دستگاههای کممنبع.
تولید، چشماندازی در حال تغییر: روندهای آینده در استقرار LLMs.
پیوستها
تاریخچه زبانشناسی: مروری بر ریشههای پردازش زبان.
یادگیری تقویتی با بازخورد انسانی (RLHF): بهبود عملکرد مدلها.
فضاهای نهان چندوجهی: کاوش در مدلهای چندوجهی.
این کتاب با مثالهای کد غنی و پروژههای عملی، شما را در ساخت و استقرار برنامههای مبتنی بر LLMs هدایت میکند. از بازسازی Llama 3 و ایجاد دستیار کدنویسی تا اجرای LLMs روی دستگاههای لبه مانند Raspberry Pi، این کتاب سناریوهای واقعی را پوشش میدهد. آموزشهای مربوط به مهندسی پرامپت، مقیاسپذیری پلتفرمها و استفاده از معماریهای پیچیده مانند RLHF، به شما کمک میکند تا برنامههایی ایمن، کارآمد و مقیاسپذیر بسازید.
این کتاب بر مدلهای زبان بزرگ (LLMs) و فرآیندهای عملیات مدلهای زبان (LLMOps) تمرکز دارد. فناوریهای معرفیشده با ابزارهای مدرن مانند PyTorch، TensorFlow، Hugging Face و پلتفرمهای ابری مانند AWS و Google Cloud سازگار هستند. این کتاب همچنین به استقرار در دستگاههای لبه و استفاده از معماریهای پیشرفته مانند RLHF میپردازد.
این کتاب برای توسعهدهندگان هوش مصنوعی، مهندسان یادگیری ماشین و حرفهایهای فناوری که میخواهند برنامههای مبتنی بر LLMs را در محیطهای تولیدی مستقر کنند، ایدهآل است. دانش پایه در یادگیری ماشین و برنامهنویسی (ترجیحاً پایتون) به درک بهتر محتوا کمک میکند، اما مثالهای عملی و توضیحات شفاف، یادگیری را برای تازهکاران نیز ممکن میسازد.
نویسنده، متخصص در حوزه هوش مصنوعی و عملیات یادگیری ماشین، با تجربه در استقرار مدلهای زبان بزرگ در محیطهای واقعی، مفاهیم پیچیده را با زبانی ساده و مثالهای کاربردی ارائه کرده است.
نظرات کاربران