کتاب تشخیص خارج از هنجار در Python، نوشته برت کندی، راهنمایی جامع و کاربردی برای دانشمندان داده است که میخواهند دادههای غیرعادی (Outliers) را در مجموعههای داده خود شناسایی کنند. این کتاب با تمرکز بر استفاده از کتابخانههای استاندارد Python مانند scikit-learn و PyOD، شما را در یافتن و تحلیل دادههای غیرعادی در دادههای عددی، دستهای، سریهای زمانی و متنی هدایت میکند. با مثالهای واقعی از حوزههایی مانند رسانههای اجتماعی، مالی و لاگهای شبکه، این کتاب ابزارها و تکنیکهای لازم برای کشف الگوهای پنهان و حل مشکلات را ارائه میدهد. خرید نسخه چاپی شامل یک نسخه رایگان eBook در فرمتهای PDF و ePub از انتشارات Manning است.
دادههای غیرعادی اغلب ارزشمندترین بخش دادهها هستند که بینشهای پنهان، الگوهای جدید یا مشکلات احتمالی مانند تقلب را آشکار میکنند. این کتاب با آموزش روشهای آماری و یادگیری ماشین برای تشخیص خارج از هنجار، شما را قادر میسازد تا از دادههای خود بیشترین بهره را ببرید. از انتخاب روشهای مناسب تشخیص تا ترکیب چندین تکنیک برای نتایج بهتر، این کتاب رویکردی عملی ارائه میدهد که برای کاربردهای تجاری مانند کشف محصولات جدید، گسترش بازار یا شناسایی فعالیتهای مشکوک ضروری است. مثالهای پروژهمحور و آموزشهای گامبهگام، یادگیری را برای دانشمندان داده جذاب و کاربردی میکنند.
بخش اول: مبانی تشخیص خارج از هنجار
مقدمهای بر تشخیص خارج از هنجار: اهمیت و کاربردهای تشخیص دادههای غیرعادی.
تشخیص ساده خارج از هنجار: روشهای اولیه برای شناسایی دادههای غیرعادی.
تشخیص خارج از هنجار مبتنی بر یادگیری ماشین: استفاده از الگوریتمهای پیشرفته.
فرآیند تشخیص خارج از هنجار: مراحل عملی برای پیادهسازی.
بخش دوم: ابزارها و کتابخانهها
تشخیص خارج از هنجار با scikit-learn: استفاده از کتابخانه محبوب یادگیری ماشین.
کتابخانه PyOD: ابزارهای تخصصی برای تشخیص خارج از هنجار.
کتابخانهها و الگوریتمهای اضافی برای تشخیص خارج از هنجار: بررسی گزینههای دیگر.
بخش سوم: تکنیکهای پیشرفته و دادههای خاص
ارزیابی تشخیصکنندهها و پارامترها: انتخاب بهترین روشها و تنظیمات.
کار با انواع دادههای خاص: دادههای عددی، دستهای، متنی و تصویری.
مدیریت مجموعههای داده بسیار بزرگ و کوچک: راهکارهای مقیاسپذیری.
دادههای مصنوعی برای تشخیص خارج از هنجار: ساخت دادههای آزمایشی.
خارج از هنجارهای جمعی: شناسایی الگوهای غیرعادی گروهی.
تشخیص خارج از هنجار قابلتوضیح: تفسیر نتایج بهصورت شفاف.
ترکیب تشخیصکنندههای خارج از هنجار: بهبود دقت با رویکردهای ترکیبی.
کار با پیشبینیهای تشخیص خارج از هنجار: مدیریت نتایج در پروژههای واقعی.
بخش چهارم: موضوعات پیشرفته
تشخیص خارج از هنجار مبتنی بر یادگیری عمیق: استفاده از شبکههای عصبی.
دادههای سری زمانی: شناسایی غیرعادیها در دادههای زمانی.
این کتاب با مثالهای واقعی از حوزههای مالی، رسانههای اجتماعی و لاگهای شبکه، شما را در شناسایی دادههای غیرعادی هدایت میکند. از تشخیص تقلب و فعالیتهای مشکوک تا ارزیابی کیفیت دادهها، این کتاب سناریوهای دنیای واقعی را پوشش میدهد. آموزشهای مربوط به استفاده از scikit-learn، PyOD و ترکیب روشهای تشخیص، شما را برای حل مشکلات پیچیده دادهای آماده میکنند.
این کتاب بر Python، scikit-learn، PyOD و کتابخانههای مرتبط تمرکز دارد و با ابزارهای دادهای مدرن مانند pandas و NumPy سازگار است. تکنیکهای ارائهشده برای تحلیل دادههای عددی، متنی، سریهای زمانی و تصویری مناسباند و با استانداردهای علم داده همراستا هستند.
این کتاب برای دانشمندان داده و برنامهنویسان Python با سطح مبتدی تا متوسط که با ابزارهایی مانند pandas و NumPy آشنا هستند و دانش پایهای در آمار دارند، ایدهآل است. توسعهدهندگانی که به دنبال شناسایی تقلب، ممیزی امنیتی یا بهبود کیفیت دادهها هستند، از این کتاب بهرهمند خواهند شد.
برت کندی، دانشمند داده با بیش از ۳۰ سال تجربه در توسعه نرمافزار و علم داده، مفاهیم پیچیده را با زبانی ساده و رویکردی پروژهمحور ارائه کرده است. او با دانش عمیق در تحلیل دادهها، راهکارهایی عملی برای حرفهایهای این حوزه فراهم کرده است.
نظرات کاربران