مجموع: ٠ تومان

{ }

در حال بارگذاری...

آی تی هلو

دسته بندی ها

درباره ما

ما در آی‌تی هلو از شهریور ۱۴۰۲ کارمون رو با عشق به کتاب و یادگیری شروع کردیم. تخصص ما چاپ کتاب‌های تخصصی به زبان اصلیه و با استفاده از تکنولوژی‌های روز و مواد اولیه باکیفیت، مطمئن می‌شیم که هر کتاب از نظر ظاهر و محتوا در بهترین سطح قرار بگیره.
هدفمون اینه که دسترسی به منابع علمی و آموزشی معتبر رو برای همه ساده‌تر کنیم و در این مسیر، همراه و همکار خوبی برای شما باشیم.

اعتماد

کتاب Web Scraping with Python

سال چاپ: 2024
تعداد صفحات: 350
ناشر: انتشارات O'Reilly
زبان: english
نویسنده(گان): Ryan Mitchell
دسته بندی: زبان‌ برنامه‌نویسی, Python

رنگ صفحات داخلی کتاب:نوع صحافی:

قیمت نهایی: 0 تومان

توضیحات

درخواست به سرورهای وب و مدیریت پاسخ‌ها با پایتون.
تجزیه HTML پیشرفته: استخراج داده از صفحات وب پیچیده با استفاده از ابزارهای پارسینگ.
ساخت کرالر با Scrapy: توسعه کرالرهای وب مقیاس‌پذیر با استفاده از فریم‌ورک Scrapy.
ذخیره‌سازی داده‌ها: روش‌های ذخیره داده‌های استخراج‌شده در قالب‌های مختلف.
کار با داده‌های ناقص: پاک‌سازی و نرمال‌سازی داده‌های بدفرمت.
استخراج داده از اسناد: خواندن و استخراج داده از اسناد PDF و دیگر فرمت‌ها.
پردازش زبان طبیعی: خواندن و نوشتن داده‌های متنی در زبان‌های طبیعی.
کرال از طریق فرم‌ها و لاگین‌ها: مدیریت صفحات وب با فرم‌های ورود و احراز هویت.
اسکرپینگ جاوااسکریپت و APIها: استخراج داده از صفحات دینامیک و APIهای وب.
پردازش تصویر و شناسایی متن: استفاده از نرم‌افزارهای تبدیل تصویر به متن.
اجتناب از تله‌های اسکرپینگ: تکنیک‌هایی برای دور زدن مسدودکننده‌های ربات و محدودیت‌ها.
تست وب‌سایت با اسکرپرها: استفاده از اسکرپرها برای تست عملکرد وب‌سایت‌ها.
اسکرپینگ موازی و پراکسی‌ها: اجرای اسکرپینگ به‌صورت موازی و استفاده از پراکسی‌ها برای مقیاس‌پذیری.

محتوای کتاب چیست؟

کتاب جادوی وب اسکرپینگ با ساختاری منظم و پروژه‌محور، در دو بخش و 20 فصل، شما را از مفاهیم پایه تا تکنیک‌های پیشرفته وب اسکرپینگ هدایت می‌کند.

بخش اول: ساخت اسکرپرها

فصل 1: اینترنت چگونه کار می‌کند: معرفی نحوه عملکرد اینترنت و پروتکل‌های وب.
فصل 2: قانونی بودن و اخلاقیات وب اسکرپینگ: بررسی مسائل حقوقی و اخلاقی مرتبط با اسکرپینگ.
فصل 3: کاربردهای وب اسکرپینگ: کاوش سناریوهای واقعی استفاده از اسکرپینگ.
فصل 4: نوشتن اولین اسکرپر وب: ساخت یک اسکرپر ساده با پایتون.
فصل 5: تجزیه HTML پیشرفته: تکنیک‌های پیشرفته برای تجزیه صفحات HTML پیچیده.

رنگ صفحات داخلی کتاب:نوع صحافی:

قیمت نهایی: 0 تومان

فصل 6: نوشتن کرالرهای وب: ایجاد کرالرهای وب برای استخراج داده از چندین صفحه.

فصل 7: مدل‌های کرالینگ وب: معرفی مدل‌های مختلف کرالینگ.

فصل 8: Scrapy: یادگیری فریم‌ورک Scrapy برای ساخت کرالرهای مقیاس‌پذیر.

فصل 9: ذخیره‌سازی داده‌ها: روش‌های ذخیره داده‌های استخراج‌شده در پایگاه‌های داده یا فایل‌ها.

بخش دوم: اسکرپینگ پیشرفته

فصل 10: خواندن اسناد: استخراج داده از اسناد PDF و فرمت‌های دیگر.
فصل 11: کار با داده‌های ناقص: پاک‌سازی و نرمال‌سازی داده‌های بدفرمت.
فصل 12: خواندن و نوشتن زبان‌های طبیعی: پردازش داده‌های متنی با ابزارهای NLP.
فصل 13: کرال از طریق فرم‌ها و لاگین‌ها: مدیریت فرم‌های وب و صفحات نیازمند احراز هویت.
فصل 14: اسکرپینگ جاوااسکریپت: استخراج داده از صفحات دینامیک مبتنی بر جاوااسکریپت.
فصل 15: کرال از طریق APIها: کار با APIهای وب برای استخراج داده‌های ساختاریافته.
فصل 16: پردازش تصویر و شناسایی متن: استفاده از ابزارهای OCR برای استخراج متن از تصاویر.
فصل 17: اجتناب از تله‌های اسکرپینگ: تکنیک‌هایی برای دور زدن محدودیت‌ها و مسدودکننده‌های ربات.
فصل 18: تست وب‌سایت با اسکرپرها: استفاده از اسکرپرها برای تست عملکرد و امنیت وب‌سایت‌ها.
فصل 19: وب اسکرپینگ موازی: اجرای اسکرپینگ به‌صورت موازی برای افزایش کارایی.
فصل 20: پراکسی‌های وب اسکرپینگ: استفاده از پراکسی‌ها برای مدیریت محدودیت‌های نرخ و ناشناس ماندن.

این کتاب برای چه کسانی مناسب است؟

کتاب جادوی وب اسکرپینگ برای افراد زیر مناسب است:

توسعه‌دهندگان پایتون: برنامه‌نویسانی که با پایتون آشنا هستند و می‌خواهند داده‌های وب را استخراج کنند.
دانشمندان داده: افرادی که به دنبال جمع‌آوری داده برای تحلیل و مدل‌سازی هستند.
علاقه‌مندان به اتوماسیون وب: توسعه‌دهندگانی که می‌خواهند فرآیندهای وب را خودکار کنند.
توسعه‌دهندگان وب: افرادی که می‌خواهند وب‌سایت‌های خود را تست کرده یا داده‌های رقبا را استخراج کنند.

پیش‌نیاز: آشنایی اولیه با پایتون و مفاهیم پایه وب (مانند HTML و HTTP) برای بهره‌برداری کامل از این کتاب مفید است.

چرا وب اسکرپینگ و این کتاب مهم هستند؟

وب اسکرپینگ به توسعه‌دهندگان و تحلیلگران داده امکان می‌دهد تا اطلاعات ارزشمندی را از وب استخراج کرده و از آن برای تحلیل، تحقیقات بازار یا اتوماسیون استفاده کنند. این کتاب با ارائه یک راهنمای جامع، شما را با ابزارها و تکنیک‌های مدرن اسکرپینگ آشنا می‌کند و به شما کمک می‌کند تا با چالش‌هایی مانند صفحات دینامیک، فرم‌های ورود و محدودیت‌های وب‌سایت‌ها مقابله کنید. با پوشش موضوعات پیشرفته مانند Scrapy، پردازش تصویر و اسکرپینگ موازی، این کتاب شما را برای استخراج داده در مقیاس بزرگ آماده می‌کند.

یادگیری عملی و پروژه‌محور

یکی از نقاط قوت این کتاب، رویکرد پروژه‌محور آن است. با مثال‌های کدنویسی عملی در پایتون و استفاده از ابزارهایی مانند Scrapy، شما می‌توانید مفاهیم را در سناریوهای واقعی مانند استخراج داده از وب‌سایت‌های دینامیک، APIها یا اسناد پیاده‌سازی کنید. این کتاب همچنین تکنیک‌هایی برای مدیریت داده‌های ناقص، تست وب‌سایت‌ها و اجتناب از تله‌های اسکرپینگ ارائه می‌دهد که برای توسعه‌دهندگان حرفه‌ای بسیار کاربردی است.

درباره نویسنده

نویسنده این کتاب، یک متخصص در حوزه وب اسکرپینگ و برنامه‌نویسی پایتون، تجربه گسترده‌ای در استخراج داده و اتوماسیون وب دارد. او با نثری واضح و مثال‌های عملی، مفاهیم پیچیده را به شکلی قابل فهم ارائه کرده است.

فهرست مطالب

بخش اول: ساخت اسکرپرها

اینترنت چگونه کار می‌کند
قانونی بودن و اخلاقیات وب اسکرپینگ
کاربردهای وب اسکرپینگ
نوشتن اولین اسکرپر وب
تجزیه HTML پیشرفته
نوشتن کرالرهای وب
مدل‌های کرالینگ وب
Scrapy
ذخیره‌سازی داده‌ها

بخش دوم: اسکرپینگ پیشرفته

خواندن اسناد
کار با داده‌های ناقص
خواندن و نوشتن زبان‌های طبیعی
کرال از طریق فرم‌ها و لاگین‌ها
اسکرپینگ جاوااسکریپت
کرال از طریق APIها
پردازش تصویر و شناسایی متن
اجتناب از تله‌های اسکرپینگ
تست وب‌سایت با اسکرپرها

نمونه چاپ کتاب موجود نیست.

نظرات کاربران

نظری برای این محصول ثبت نشده است.