بایگانی‌های kvl htchv fhs; - صفحه 2 از 3

یادگیری ماشین – SVM یا ماشین بردار پشتیبان به زبان ساده

سید مجتبی بنائی ۱۳۹۴/۰۵/۱۶ مفاهیم پایه نظرات 31,220 مشاهده

یکی از الگوریتم ها و روشهای بسیار رایج در حوزه دسته بندی داده ها، الگوریتم SVM یا ماشین بردار پشتیبان است که در این مقاله سعی شده است به زبان ساده و به دور از پیچیدگیهای فنی توضیح داده شود.

آشنایی با مفهوم دسته بندی

فرض کنید مجموعه داده ای داریم که ۵۰٪ افراد آن مرد و ۵۰٪ افراد آن زن هستند. این مجموعه داده می تواند مشتریان یک فروشگاه آنلاین باشد. با داشتن یک زیرمجموعه از این داده ها که جنسیت افراد در آن مشخص شده است، می خواهیم قوانینی ایجاد کنیم که به کمک آنها جنسیت بقیه افراد مجموعه را بتوانیم با دقت بالایی تعیین کنیم. تشخیص جنسیت بازدیدکنندگان فروشگاه، باعث می شود بتوانیم تبلیغات جداگانه ای را برای زنان و مردان نمایش دهیم و سودآوری فروشگاه را بالا ببریم . این فرآیند را در علم تحلیل داده، دسته بندی می نامیم .

برای توضیح کامل مسأله، فرض کنید دو پارامتری که قرار است جنسیت را از روی آنها تعیین کنیم، قد و طول موی افراد است . نمودار پراکنش قد و طول افراد در زیر نمایش داده شده است که در آن جنسیت افراد با دو نماد مربع (مرد) و دایره (زن) به طور جداگانه نمایش داده شده است .

SVM-1

با نگاه به نمودار فوق، حقایق زیر به سادگی قابل مشاهده است :

مردان در این مجموعه، میانگین قد بلندتری دارند.
زنان از میانگین طول موی بیشتری برخوردار هستند.

اگر یک داده جدید با قد ۱۸۰cm و طول موی ۴cm به ما داده شود، بهترین حدس ما برای ماشینی این شخص، دسته مردان خواهد بود .

بردارهای پشتیبان و ماشین بردار پشتیبان

بردارهای پشتیبان به زبان ساده، مجموعه ای از نقاط در فضای n بعدی داده ها هستند که مرز دسته ها را مشخص می کنند و مرزبندی و دسته بندی داده ها براساس آنها انجام می شود و با جابجایی یکی از آنها، خروجی دسته بندی ممکن است تغییر کند . به عنوان مثال در شکل فوق ، بردار (۴۵,۱۵۰) عضوی از بردار پشتیبان و متعلق به یک زن است . در فضای دوبعدی ،‌بردارهای پشتیبان، یک خط، در فضای سه بعدی یک صفحه و در فضای n بعدی یک ابر صفحه را شکل خواهند داد.

SVM یا ماشین بردار پشتیبان ، یک دسته بند یا مرزی است که با معیار قرار دادن بردارهای پشتیبان ، بهترین دسته بندی و تفکیک بین داده ها را برای ما مشخص می کند.

در SVM فقط داده های قرار گرفته در بردارهای پشتیبان مبنای یادگیری ماشین و ساخت مدل قرار می گیرند و این الگوریتم به سایر نقاط داده حساس نیست و هدف آن هم یافتن بهترین مرز در بین داده هاست به گونه ای که بیشترین فاصله ممکن را از تمام دسته ها (بردارهای پشتیبان آنها) داشته باشد .

چگونه یک ماشین بر مبنای بردارهای پشتیبان ایجاد کنیم ؟

به ازای داده های موجود در مثال فوق، تعداد زیادی مرزبندی می توانیم داشته باشیم که سه تا از این مرزبندی ها در زیر نمایش داده شده است.

SVM-2

سوال اینجاست که بهترین مرزبندی در این مسأله کدام خط است ؟

یک راه ساده برای انجام اینکار و ساخت یک دسته بند بهینه ، محاسبه فاصله ی مرزهای به دست آمده با بردارهای پشتیبان هر دسته (مرزی ترین نقاط هر دسته یا کلاس) و در نهایت انتخاب مرزیست که از دسته های موجود، مجموعاً بیشترین فاصله را داشته باشد که در شکل فوق خط میانی ، تقریب خوبی از این مرز است که از هر دو دسته فاصله ی زیادی دارد. این عمل تعیین مرز و انتخاب خط بهینه (در حالت کلی ، ابر صفحه مرزی) به راحتی با انجام محاسبات ریاضی نه چندان پیچیده قابل پیاده سازی است .

توزیع غیر خطی داده ها و کاربرد ماشین بردار پشتیبان

اگر داده ها به صورت خطی قابل تفکیک باشند، الگوریتم فوق می تواند بهترین ماشین را برای تفکیک داده ها و تعیین دسته یک رکورد داده، ایجاد کند اما اگر داده ها به صورت خطی توزیع شده باشند (مانند شکل زیر )، SVM را چگونه تعیین کنیم ؟

SVM-3

در این حالت، ما نیاز داریم داده ها را به کمک یک تابع ریاضی (Kernel functions) به یک فضای دیگر ببریم (نگاشت کنیم ) که در آن فضا، داده ها تفکیک پذیر باشند و بتوان SVM آنها را به راحتی تعیین کرد. تعیین درست این تابع نگاشت در عملکرد ماشین بردار پشتیبان موثر است که در ادامه به صورت مختصر به آن اشاره شده است.

با فرض یافتن تابع تبدیل برای مثال فوق،‌ فضای داده ما به این حالت تبدیل خواهد شد :

SVM-4

در این فضای تبدیل شده، یافتن یک SVM به راحتی امکان پذیر است .

نگاهی دقیق تر به فرآیند ساخت SVM

همانطور که اشاره شد،‌ماشین بردار پشتیبان یا SVM داده ها را با توجه به دسته های از پیش تعیین شده آنها به یک فضای جدید می برد به گونه ای که داده ها به صورت خطی (یا ابر صفحه ) قابل تفکیک و دسته بندی باشند و سپس با یافتن خطوط پشتیبان (صفحات پشتیبان در فضای چند بعدی) ، سعی در یافتن معادله خطی دارد که بیشترین فاصله را بین دو دسته ایجاد می کند.

در شکل زیر داده ها در دو دوسته آبی و قرمز نمایش داده شده اند و خطوط نقطه چین ، بردار های پشتیبان متناظر با هر دسته را نمایش می دهند که با دایره های دوخط مشخص شده اند و خط سیاه ممتد نیز همان SVM است . بردار های پشتیبان هم هر کدام یک فرمول مشخصه دارند که خط مرزی هر دسته را توصیف می کند.

بایگانی برچسب برای: kvl htchv fhs;

سیستم ایمنی بدن انسان

خطوط دفاعی بدن انسان

آشنایی با مفاهیم اولیه سیستم ایمنی بدن انسان

سلول های B

سلول های T

آنتی بادی

آنتی ژن

انواع مرگ سلول

پاکسازی سلول های مرده

دریافت خروجی از کلاس Task

ارسال پارامتر به Task ها

9.آشکار سازی صورت با استفاده فیلترهای گابور و شبکه های عصبی

10.بهبود روش های ناحیه بندی تصاویر MRI مغز انسان با استفاده از عملگر گابور

11. بهبود سیستم های ایمنی برای تشخیص اجسام در تصویرهای پرتونگاری بار

12. ﺑﻬﺒﻮد کیفیت تصویر اﺛﺮاﻧﮕﺸﺖ ﺑﺎ اﺳﺘﻔﺎده از فیلتر بانک ﮐﻤﺎﻧﯽ گابور

13. تشخیص چهره با استفاده از PCA و فیلتر گابور

14. تعیین توزیع دانه بندی سنگ دانه های بتن و آسفالت با استفاده از استخراج ویژگی های گابور و شبکه های عصبی

15. خوشه بندی سبک نگارش دست نوشته برون خط فارسی

16. شاخص گذاری بر روی تصاویر با استفاده از موجک های گابور و ممان های لژاندر

17. طراحی بخش دریافت و پردازش تصویر برای یک پروتز بینایی

تاريخچه

کاربردهاي SVM

ايده اصلي SVM

مسئله جداسازي خطي: Linear Discrimination

آشنايي با مفاهيم ابتدايي

خط يا ابر صفحه جدا کننده:

حداکثر حاشيه (maximum margin)

چرا حداکثر حاشيه؟

بردار پشتيبان

ماشين بردار پشتيبان خطي

ماشين بردار پشتيبان براي بردارهاي ورودي جدايي ناپذير:

ماشين بردار پشتيبان غيرخطي:

منابع

یادگیری ماشین – SVM یا ماشین بردار پشتیبان به زبان ساده

آشنایی با مفهوم دسته بندی

بردارهای پشتیبان و ماشین بردار پشتیبان

چگونه یک ماشین بر مبنای بردارهای پشتیبان ایجاد کنیم ؟

توزیع غیر خطی داده ها و کاربرد ماشین بردار پشتیبان

نگاهی دقیق تر به فرآیند ساخت SVM

SVM‌ در پایتون

ماشین بردار پشتیبانی در عمل

نقاط ضعف ماشین بردار پشتیان

سخن پایانی

SVM یک مدل خطی را یاد می‌گیرد

الگوریتم یا مدل؟

SVM یا SVMها؟

SVMها – ماشین‌های بردار پشتیبان

طبقه‌بندی

رگرسیون

خلاصه تاریخچه

انواع دیگری از ماشین‌های بردار پشتیبان

نتیجه‌گیری

اصلاح دیجیتالی عکس در دوربین

اندازه عکس

کیفیت عکس

وضوح عکس

تعادل نور سفید

حالت رنگ

حساسیت به نور

کار روی عکسها درون دوربین

ذخیره عکسها در پوشه های مختلف

تنظیم نامگذاری عکسها

حذف کردن عکسها

دوربین های دیجیتال:

تاریخچه:

عملکرد:

سنسورهای CCD و CMOS

تفاوت دیجیتال و آنالوگ چیست؟

تصاویر رنگی در دوربین های دیجیتال:

منابع

بینایی کامپیوتری (Computer vision) چیست؟

کاوش در داده‌ها

وظایف اصلی در بینایی رایانه‌ای(بینایی کامپیوتری)

تشخیص شیء

پیگیری

تفسیر منظره

خودمکان‌یابی

سامانه‌های بینایی رایانه‌ای یا بینایی کامپیوتری

تصویربرداری