بایگانی‌های dv

بایگانی برچسب برای: dv

آشنایی با #C قسمت 2

ویژگی‌های جدید در سی شارپ ۳٫۰

این ورژن از سی شارپ در تاریخ ۱۹ نوامبر سال ۲۰۰۷ به عنوان بخشی از چارچوب دات‌نت ۳٫۵ عرضه شد؛ که شامل ویژگی‌های جدید الهام شده از زبان‌های برنامه‌نویسی اصلی (Functional) مانند Haskell و ML، و الگوی LINQ برای CLR است. در حال حاضر توسط هیچ موسسه استانداردسازی تأیید نشده‌است.

معرفی لینک

لینک (به انگلیسی: Language Integrated Query)(مخفف انگلیسی: LINQ) یک زبان پرس و جوی قابل انعطاف و همه منظوره برای بسیاری از انواع منبع داده‌ها است (مثل انتخاب اشیاء شناور، سندهای XML، بانک‌های اطلاعاتی و…) که در ویژگی‌های سی شارپ ۳ جمع شده‌اند. سینتکس زبان به زحمت از SQL گرفته شده‌است، برای مثال:

int[] array = { 1, 5, 2, 10, 7 };

// Select squares of all odd numbers in the array sorted in descending order
IEnumerable&lt;int&gt; query = from x in array
                         where x % 2 == 1
                         orderby x descending
                         select x * x;

مقدار دهی به اشیاء

Customer c = new Customer(); c.Name = "James";

عبارت بالا می‌تواند به صورت زیر نوشته شود:

Customer c = new Customer { Name="James" };

مقدار دهی Collection

MyList list = new MyList();
list.Add(1);
list.Add(2);

عبارت بالا می‌تواند به صورت زیر نوشته شود:

MyList list = new MyList { 1, 2 };

فرض کنید که اجزای MyList و System.Collections.IEnumerable دارای متد عمومی Add هستند.

انواع داده‌ای بی نام

var x = new { FirstName="James", LastName="Frank" };

سی شارپ ۲٫۰ توابع بی نام را معرفی کرد. سی شارپ ۳٫۰ هم انواع بی نام را معرفی می‌کند. با استفاده از این ویژگی برنامه نویسان قادر خواهند بود به صورت Inline انواع دلخواه خود را ایجاد کنند. به نمونه زیر توجه کنید:

static void Main(string[] args)
{
    var anonymousType = new { Name = string.Empty, Age = 0 };
}

کد ارائه شده، یک نوع بی نام را تعریف می‌کند که از طریق متغیر ضمنی محلی به نام anonymousType در اختیار قرار می‌گیرد.

چرا Anonymous types؟ انواع بی نام بهترین گزینه برای تولید Entity Typeها می‌باشند. همان‌طور که گفته شد Entity Typeها فقط حاوی داده‌ها هستند؛ بنابراین به بهترین نحو می‌توان داده‌های دریافت شده از کاربر را در انواع بی نام بسته‌بندی کرد.

نتیجه نوع متغیر محلی

var x = new Dictionary < string, List < float >> ();

کد بالا با کد زیر قابل تعویض می‌باشد:

Dictionary < string, List < float >> x = new Dictionary < string, List < float >> ();

این ویژگی تنها یک ntactic sugarراحت برای کوتاه‌تر بیان کردن متغیرهای محلی نمی‌باشد، بلکه برای تعریف متغیرهای بی نام لازم نیز است.

عبارات لامبدا

عبارات لامبدا یک راه کوتاه برای نوشتن مقادیر توابع بی نام کلاس اول را فراهم می‌کنند. دو مثال زیر را در نظر بگیرید:

listOfFoo.Where(delegate(Foo x) { return x.Size > 10; })

listOfFoo.Where(x = > x.Size > 10);

در مثال‌های فوق، عبارات لامبدا صرفاً یک نوع سینتکس برای delegateهای بی نام با مقادیر دارای بازگشت هستند. هر چند با توجه به نوع متن استفاده می‌شوند، کامپایلر سی شارپ می‌تواند لامبداها را به ASTها نیز تبدیل کند تا بعداً در زمان اجرا نیز بتوانند پردازش شوند. در مثال فوق، اگر listOfFoo یک مجموعه ساده داخل حافظه نباشد، ولی یک پوشه در اطراف جدول بانک اطلاعاتیمی‌باشد. این تکنیک می‌تواند برای بهینه کردن اجرا، برای ترجمه بدنه لامبدا به عبارت معادل آن در SQL استفاده شود. در هر یک از دو راه فوق، خود عبارت لامبدا دقیقاً شبیه کد به نظر می‌رسد، بنابراین روش استفاده در زمان اجرا، برای کاربر ناپیدا می‌باشد.

یکی از ویژگی‌هایی که سی شارپ ۲٫۰ ارائه کرد، توانایی تعریف توابع به صورت Inline بود که این ویژگی با عنوان توابع بی نام (anonymous methods) شناخته می‌شود. توابع بی نام در پاره‌ای مواقع بسیار مفیدند. اما نحو(syntax) به‌کارگیری آن‌ها دشوار می‌باشد. عبارات لامبدا ویژگی توابع بی نام را دارند اما با نحو ساده‌تری در سی شارپ ۳٫۰ معرفی شده‌اند. به نمونه زیر توجه کنید:

static void Main(string[] args)
{
   (int x) = > x + 1;// explicitly typed parameter
   (y, z) = > y * z;// implicitly typed parameter
}

تعریف عبارات لامبدا از نحو (syntax) خاصی پیرو می‌کند. همان‌طور که در کد بالا مشاهده می‌کنید، پارامترهای تابع هم به صورت صریح و هم به صورت ضمنی قابل بیان‌اند. کلمه return به صورت ضمنی حذف شده‌است. تابع معادل عبارت لامبدای اول به صورت زیر است:

int Fn(int x)
{
    return x+1;
}

لیست پارامترها و بدنه عبارت لامبدا توسط => از هم جدا می‌شوند. در صورتی که تعریف عبارت لامبدا بیشتر از یک خط کد باشد می‌توان بدنه آن را با استفاده از {} نشان داد.

static void Main(string[] args)
{
    (int x) = > { x + 1; return x * x; };
}

خواص خودکار

کامپایلر به‌طور خودکار یک متغیر نمونه خصوصی و قرار دهنده و قرار گیرنده مناسب تولید می‌کند، مانند:

public string Name { get; private set; }

توابع بسط داده شده

توابع بسط داده شده حالتی از سینتکس Suger هستند که امکان اضافه کردن متد جدید به کلاس موجود را بیرون از حوزه تعریف آن فراهم می‌کنند. در این مثال، تابع بسط داده شده یک تابع ایستا است که قابل فراخوانی توسط تابع مشابه می‌باشد. گیرنده فراخوانی مقید به اولین پارامتر تابع تحت عنوان this می‌باشد:

public static class StringExtensions
{
    public static string Left(this string s, int n)
    {
        return s.Substring(0, n);
    }
}

string s = "foo";
s.Left(3);// same as StringExtensions.Left(s, 3);

زبان سی شارپ کلمه کلیدی sealed را برای این منظور ارائه کرد که امکان ارث بری از یک کلاس را صلب کند. یعنی با اضافه شدن این کلمه کلیدی به ابتدای تعریف کلاس، امکان ارث بری از آن غیرممکن می‌شود. سی شارپ ۳٫۰ ویژگی جدیدی را در اختیار برنامه نویسان قرار می‌دهد به این صورت که می‌توان هر نوع کلاسی حتی کلاس‌های مهر شده با Sealed را با استفاده از Extension methodsبسط داد.

توابع جزئی

توابع جزئی به تولیدکننده‌های کد اجازه تولید اعلان توابع به صورت نقاط گسترش یافته‌ای که تنها شامل کدهای اصلی هستند را می‌دهد، در صورتی که یک نفر آن را در قسمتی از کلاسی دیگر اجرا کند.

آرایه‌های نوع ضمنی

آرایه‌ها را نیز می‌توان با استفاده از کلمه کلیدی var تعریف کرد.

static void Main(string[] args)
{
    var a = new[] { 1, 10, 100, 1000 };// int[]
    var b = new[] { 1, "one", 2 };// Error
}

پیش پردازنده

ویژگی «دستورها پیش پردازنده» سی شارپ (اگرچه آن‌ها به واقع یک پیش پردازنده نیستند) مبنی بر دستورها پیش پردازنده C است که به برنامه‌نویس اجازه تعریف سمبلهایی را می‌دهند. برخی از این دستورها عبارتند از: #if، #region، #define. راهنماهایی نظیر #region تذکراتی به ویرایش‌گرها برای code folding می‌دهند.

توضیحات کد

توضیحات تک خط با استفاده از دو اسلش تعریف می‌شوند(//) و توضیحات چند خطی با /* شروع و به */ تمام می‌شوند.

public class Foo
{
// a comment
    public static void Bar(int firstParam) {}//Also a comment
}

public class FooBar
{
    /* a comment */
    public static void BarFoo(int firstParam) {}  /* Also a comment */

توضیحات چند خطی هم چنین می‌توانند با /* شروع و با */ تمام شوند.

public class Foo
{
    /* A Multi-Line
       comment  */
    public static void Bar(int firstParam) {}
}

سامانه مستندسازی XML

سامانه مستندسازی #C بسیار شبیه به جاوا است، اما مبنی بر XML. دو شیوه مستندسازی در حال حاضر به وسیله کامپایلر #C پشتیبانی می‌شود.

توضیحات تک خطی، که معمولاً در تولیدکننده کد Visual Studioپیدا می‌شوند، با استفاده از/// شروع می‌شوند.

public class Foo
{
/// < summary > A summary of the method. < /summary >
/// < param name="firstParam" > A description of the parameter. < /param >
/// < remarks > Remarks about the method. < /remarks >
    public static void Bar(int firstParam) {}
}

توضیحات چند خطی، که در نسخه ۱٫۰ تعریف شدند، اما در نسخه ۱٫۱ پشتیبانی از آن‌ها وجود نداشت با /* شروع و به */ ختم می‌شوند:

public class Foo
{
    /** < summary > A summary of the method. < /summary >
     *  < param name="firstParam" > A description of the parameter. < /param >
     *  < remarks>Remarks about the method. < /remarks > */
    public static void Bar(int firstParam) {}
}

نکته:در اینجا یک ملاک سخت در مورد استفاده از فضاهای خالی در سندهای XML هنگام استفاده از /**وجود دارد:

/**
 * < summary >
 * A summary of the method. < /summary > */

نوع دیگری از کد بالا ارائه خواهد شد:

/**
 * < summary >
   A summary of the method. < /summary > */

سینتکس سندسازی توضیحات XML در یک ضمیمه بی قاعده از استاندارد ECMA از سی شارپ وجود دارد. یک استاندارد مشابه قوانینی برای پردازش توضیحات و تبدیل آن‌ها به متون Plain در XML را با کمک قوانین CLI فراهم می‌کند. این به هر IDE در سی شارپ و دیگر ابزار گسترش دهنده امکان پیدا کردن هر نمادی را در کدها می‌دهد.

(CLR(Common Language Runtime

بخش مرکزی چارچوب دات‌نت، محیط اجرایی Runtime می‌باشد که اصطلاحاً به آن CLR یا .NET Runtime می‌گویند. کدهایی که تحت کنترل CLR اجرا می‌شوند اغلب به عنوان کدهای مدیریت شده نامیده می‌شوند.

اگر چه، پیش از این که کدها (همه زبان‌های چارچوب دات‌نت) به وسیله CLR اجرا شوند، بایستی مورد کامپایل قرار گیرند. در چارچوب دات‌نت عمل کامپایل در دو مرحله صورت می‌گیرد:

کامپایل سورس کد به MSIL.
کامپایل MSIL به کد مختص پلتفرم به وسیله CLR

یک نکته قابل توجه، اشتراک زبان میانی مایکروسافت با کد بایت جاوا(Bytecode)است. ایده این اشتراک از آنجا سرچشمه گرفت که چون Bytecode یک زیان سطح پایین با یک دستور زبان ساده می‌باشد (که به جای متن مبتنی بر کدهای عددی است)، می‌تواند به سرعت به کدهای بومی(Native) ترجمه شود.

برخی ویژگی‌های MSIL

شیءگرایی و بکارگیری واسط‌ها
تمایز فراوان بین انواع مقداری و ارجاعی
تعیین Strong Type (این نوع داده دیگر معتبر نیست)
مدیریت خطا از طریق به‌کارگیری Exception
بکارگیری صفات

منبع

آشنایی با #C قسمت 1
آشنایی با #C قسمت 2
آشنایی با #C قسمت 3

فوریه 5, 2020/0 دیدگاه /توسط daliri

سیستم توصیه گر (Recommender System) قسمت 3

آموزش های عمومی هوش مصنوعی

7 تکنیک هیبریداسیون

وزنی (Weighted): امتیازاتی که توسط اجزای توصیه گر متفاوت داده می شود، بصورت عددی با یکدیگر ترکیب می شوند.
راه گزینی (Switching): سیستم از بین اجزای توصیه گر انتخاب کرده، و جزء انتخابی را به کار می گیرد.
مخلوط (Mixed): پیشنهادات توصیه گر های متفاوت، با هم ارائه می گردند.
ترکیب خصوصیات (Feature Combination): ویژگی های بدست آمده از منابع شناختی متفاوت، با یکدیگر ترکیب شده و یک الگوریتم پیشنهادی مجرد را ارائه می دهد.
تقویت خصوصیات(Feature Augmentation): یک فن توصیه، برای محاسبه ی یک ویژگی یا مجموعه ای از خصوصیات به کار برده می شود، که بخشی از ورودی تکنیک بعدیست.
آبشار(Cascade): به توصیه گرها اولویت اکید داده می شود؛ انهایی که از اولویت پایین تر برخوردارند برای به ثمر رساندن آنهایی که اولویت بالایی دارند، نادیده گرفته شوند.
Meta-level: یک تکنیک توصیه بکار برده شده و تعدادی مدل ایجاد می کند که پس از آن بعنوان ورودی تکنیک بعدی مورد استفاده قرار می گیرد.

سیستم توصیه گر شخصیت محور:

رهیافتی جدید که از بوتنر (Buettner) نشأت گرفت. او “توصیه گر محصول شخصیت محور” (Personality-based product recommender(PBPR)) را مطرح کرد، چارچوبی که داده های شبکه اجتماعی را تحلیل می کند تا شخصیت کاربر را پیش بینی کرده و از شخصیت کاربر پی به تمایلات او برد.

فراتر از دقت

معمولاً پژوهش در باب سیستم های توصیه گر، از بابت یافتن دقیق ترین الگوریتم های پیشنهاد، نگران است.

تنوع (Diversity): زمانیکه لیستی بلند بالا و متنوع از پیشنهادات ارائه گردد، موجب رضایت بیشتر کاربر میشود، برای مثال آیتم هایی از هنرمندان مختلف.
اصرار توصیه گر (Recommender persistence): در برخی موارد، دوباره نشان دادن توصیه ها یا اینکه رتبه بندی دوباره ی آیتم ها توسط کاربر، بسیار مؤثر تر از نشان دادن آیتم های جدید است. مثلاً، ممکن است کاربران در دفعه اول وقت کافی برای بررسی دقیق پیشنهادات نداشته اند.
حریم خصوصی(Privacy): معمولاً سیستم های توصیه گیر در رابطه با مسئله حریم خصوصی نگران هستند، چرا که کاربران مجبور به فاش کردن اطلاعات حساس هستند. ایجاد پروفایل کاربران با استفاده از پالایش گروهی می تواند از نقطه نظر حریم خصوصی، مشکل آفرین باشد. بسیاری از کشورهای اروپایی رسومی بسیار غنی از حریم خصوصی دارند، و هر تلاشی که منجر به معرفی سطحی از مشخصات کاربر شود، با عکس العمل منفی مشتری روبرو می شود. با پیشنهاد نت فلیکس برای رقابت جایزه نت فلیکس (Netflix Prize) مسائلی در رابطه با حریم خصوصی در حیطه ی مجموعه اطلاعات بوجود آمد. گرچه برای حفظ حریم خصوصی مشتری، مجوعه داده ها ناشناس بودند، در سال 2007 دو محقق از دانشگاه تگزاس با انطباق مجموعه ی داده هایی که از امتیاز دهی فیلم ها و از Internet Movie Database بدست آمده بود، توانستند کاربران را شناسایی کنند. در سال 2009 کاربر ناشناس نت فلیکس، نت فلیکس را در Doe v. Netflix شکایت کرد و مدعی شد که نت فلیکس قوانین تجارت عادلانه ی ایالات متحده و قانون حفاظت از حریم خصوصی ویدئو (Video Privacy Protection Act) را با پخش مجموعه ی داده ها، نقض کرده است. این ادعا در بخشی منجر به حذف دومین رقابت جایزه نت فلیکس سال 2010 گردید. در این مدت تحقیقات زیادی در زمینه حریم خصوصی انجام گرفته است. راماکریشنان و همکاران، در مورد موازنه ی شخصی سازی و حریم خصوصی تحقیق گسترده ای را انجام داده و دریافتند که از ترکیب روابط ضعیف (یک ارتباط غیر منتظره که بصورت اتفاقی پیشنهادات خوب و جالبی را ارائه می دهد) و دیگر منابع اطلاعاتی می توان برای کشف هویت کاربران در یک مجموعه داده ی ناشناس استفاده کرد.
جمعیت شناختی کاربر (User demographics): بیل وهمکاران، دریافتند که اطلاعات جمعیت شناختی کاربران می تواند بر میزان رضایت مندی آنها از پیشنهادات ارائه شده، تأثیر گذار باشد. آنها در مقاله خود نشان دادند که کاربران مسن تر بیشتر از کاربران جوان، علاقه مند به توصیه های ارائه شده هستند.
نیرومندی (Robustness): زمانیکه کاربران بتوانند در سیستم توصیه گر مشارکت کنند، مسئله کلاهبرداری بایستی مورد توجه قرار گیرد.
سرندی پیتی (یافتن تصادفی)(Serendipity): سرندی پیتی مقیاسی است که نشان می دهد، پیشنهادات چقدر شگفت انگیز و تعجب آور هستند. برای مثال، سیستم توصیه گری که در یک بقالی خرید شیر را به مشتری پیشنهاد می دهد، گرچه ممکن است پیشنهاد دقیقی باشد ولی پیشنهاد خوبی نیست، چرا که “خرید شیر” برای مشتری امری واضح و روشن است و نیازی به پیشنهاد ندارد.
اعتماد (Trust): سیستم توصیه گری که کاربر به آن اعتماد نداشته باشد، از ارزش بسیار پایینی برخوردار است. اعتماد توسط سیستم توصیه گر و با توصیف چگونگی ایجاد پیشنهادات و علت پیشنهاد یک آیتم، ایجاد میگردد.
برچسب گذاری (Labelling): بر چسب گذاری پیشنهادات ممکن است رضایت مندی کاربر را تحت تأثیر قرار دهد. برای مثال در مطالعه ای نرخ کلیک(click-through rate(CTR)) برای پیشنهاداتی که برچسب ” ضمانت” داشتند (CTR=5.93%) کمتر از حالتی بود که همان پیشنهادات برچسب “ارگانیک” داشتند (CTR=8.86%). نکته قابل توجه اینجاست؛ پیشنهاداتی که هیچ برچسبی نداشتند از نرخ کلیک بالاتری برخوردار بودند (CTR=9.87%).

سیستم توصیه گر سیار

تحقیق در حوزه ی سیستم های توصیه گر سیار، یکی از حیطه های تحقیقاتی در حال رشد در زمینه ی سیستم های توصیه گر است. با افزایش دسترسی اسمارت فون ها به اینترنت و همه گیر شدن آن، ارائه پیشنهادات شخصی سازی شده و حساس به محیط ممکن شده است. از آنجاییکه اطلاعات سیار بسیار پیچیده تر از داده هایی است که سیستم های توصیه گر با آن درگیر بوده اند، تحقیقات در این حیطه به مراتب دشوارتر است (مسائلی که این حیطه با آن روبروست: ناهمسانی، پر سر و صدایی، نیاز به همبستگی خودکار مکانی و زمانی ، و نیز مشکلات تأیید و عمومیت دارد). علاوه بر این سیستم های توصیه گر سیار از مشکلات جابجایی نیز متضرر هستند، چرا که ممکن است پیشنهادات ارائه شده در تمامی مناطق بکار نیاید (برای مثال، پیشنهاد یک دستور غذایی که همه ی اجزایش را نمی توان در آن منطقه فراهم کرد، پیشنهادی نابخردانه است).

سیستمی که پیشنهاد کننده مسیرهای ایده آل برای رانندگان شهریست، یک نمونه از سیستم های توصیه گر سیار است. این سیستم داده های خود را از طریق ردیابی GPS راههایی که تاکسی پیموده است، بدست می آورد که این داده ها عبارتند از؛ مکان یابی (طول و عرض جغرافیایی)، نشان دادن زمان و وضعیت اجرایی (با مسافر یا بدون مسافر). سیستم از این داده ها برای بهینه سازی زمان صرف شده برای هر مسافر (یعنی با پیشنهاد ایده آل ترین راه، مدت زمانی که مسافر در تاکسی است به کمترین میزان خود برسد) و عاید کردن سود بیشتر برای راننده تاکسی، بهره می گیرد. این نوع سیستم، وابسته به مکان است، و از آنجاییکه در دستگاههای دستی یا جاساز شده استفاده می شود نیاز محاسباتی و انرژی آن بایستی در سطح پایینی نگه داشته شود.

نمونه ای دیگر از سیستم های توصیه گر سیار، سیستمی است که برای کاربران متخصص توسعه داده شده است (بونفوف و همکاران، 2012). این سیستم با ردیابی GPS کاربر و برنامه ی کاری او، بهترین اطلاعات و پیشنهادات را بسته به موقعیت و علایق وی، ارائه می دهد. این سیستم، از فنون یادگیری ماشینی و پردازش استدلالها برای ایجاد یک سازگاری پویا بین سیستم توصیه گر سیار با سیر تحولی علایق کاربر ، بهره می برد. بانی این الگوریتم نام آن را hybrid-ε-greedyگذاشته است.

سیستم های توصیه گر سیار همچنین”Web of Data” را به عنوان منبعی برای اطلاعات ساختاری، ایجاد کرده اند. یک مثال خوب از این سیستم ها ” “SMARTMUSEUM است. این سیستم حتی زمانیکه اطلاعات کمی از کاربر ارائه شده باشد با استفاده از مدل سازی معنایی، بازیابی اطلاعات و فنون یادگیری ماشینی اقدام به توصیه ی محتوای مطابق با علایق کاربر می کند.

سیستم توصیه گر آگاه از ریسک

تمرکز عمده رهیافت های موجود بکار گرفته شده در سیستم های توصیه گر ارائه ی مرتبط ترین محتوا برای کاربران است و ریسک برآشفتن کاربر در شرایط خاص را به حساب نمی آورند. با این وجود در بسیاری از اپلیکیشن ها (مانند پیشنهاد محتوای شخصی سازی شده) ریسک پریشان کردن کاربر نیز مهم تلقی شده و از تحمیل پیشنهادات در شرایط خاصی همچون یک جلسه ی تخصصی، صبح زود یا دیر وقت ممانعت می شود. از این رو عملکرد سیستم توصیه گر در بخشی به درجه ای از ریسکی که در فرایند پیشنهاد دهی لحاظ می کند، بستگی دارد.

تعریف ریسک

در سیستم های توصیه گر واژه ی “ریسک” به احتمال ایجاد مزاحمت یا پریشان کردن کاربر که منجر به عکس العمل نامناسب وی شود، اطلاق می گردد.

در پاسخ به این چالش ها، جمعی از محققان یک سیستم توصیه گر پویا و حساس به ریسک DRARS(Dyanamic Risk-Aware Recommender system) را ابداع کردند که توصیه ی زمینه ی آگاه (context – aware) را همچون یک “مسئله ی راهزن” (bandit problem) مدلسازی کرده است. این سیستم یک تکنیک محتوا محور را به یک الگوریتم “راهزن متنی” (Contextual bandit) ترکیب کرده است. این محققان نشان دادند که DRARS با محاسبه ی بهینه ترین ارزش اکتشافی برای حفظ توازن بین اکتشاف و بهره برداری مبتنی بر سطح ریسک موقعیت کاربر، موجب بهبود خط مشی “اعتماد به نفس حد بالا” (Upper Confidence Bound(UCB)) می شود. این محققان آزمایشات خود را در یک زمینه صنعتی و با داده ها و کاربران واقعی اجرا کرده و نشان دادند که اهمیت دادن به سطح ریسک موقعیت کاربران، قدرت اجرای سیستم های توصیه گر را افزایش می دهد.

جایزه نت فلیکس

یکی از وقایعی که به تحقیقات سیستم های توصیه گر انرژی مضاعفی بخشید، جایزه نت فلیکس بود. از سال 2006 تا سال 2009 میلادی نت فلیکس اسپانسر رقابتی بود که در آن جایزه ی 1000000 دلاری به گروهی تعلق می گرفت که بتواند مجموعه ی داده ای با بیش از 100 میلیون فیلم رتبه بندی شده ارائه دهد به نحوی که بازخورد پیشنهادات 10 درصد، دقیق تر از نرم افزار موجود نت فلیکس باشد (در ارائه پیشنهادات، 10 درصد دقیق تر از نت فلیکس عمل کند). این رقابت به امر تحقیق جهت یافتن الگوریتم های جدید و دقیق تر، انرژی مضاعفی بخشید. در 21 سپتامبر 2009 جایزه یک میلیون دلاری با رعایت قانون”tiebreaking” (قانونی که در صورت مساوی شدن رقبا، طرف برنده را تعیین می کند) به تیم Bellkor’s pragmatic Chaos اهدا گردید.

در سال 2007 ترکیبی از 107 رهیافت الگوریتمی متفاوت، منجر به ایجاد دقیق ترین الگوریتم پیش بینی گردید:

زمانیکه چندین سیستم پیشگویی با یکدیگر ترکیب شوند، دقت پیشگویی به طور قابل ملاحظه ای افزایش می یابد. تجربه ی ما اینست که بیشتر تلاشها بایستی بر حصول رهیافت های مختلف معتبر متمرکز می شد نه پالایش یک تکنیک مجرد. در نتیجه راه حل ما نیز حاصل جمع آثار مجموعه ای از روش هاست.

مزایای بسیاری بخاطر پروژه نت فلیکس عاید وب شد. تعدادی از تیم فن آوریشان را گرفته و در دیگر بازارها بکار گرفتند. اعضای تیمی که به مقام دوم رسیدند یک موتور توصیه گر به نام Gravity R&Dایجاد کردند که در جامعه RecSys فعال است. 4-Tell، Inc راه حلی را که از پروژه نت فلیکس بدست آورده بودند در وبسایت های تجارت الکترونیک بکار بردند.

مسابقه ی دوم نیز طراحی شد اما نهایتاً در عکس العمل به طرح دعوایی در دادگاه و ابراز نگرانی از “کمیسیون تجارت فدرال” (Federal Trade Commission) لغو گردید.

سنجش عملکرد

در تشخیص تأثیر الگوریتم های توصیه، ارزیابی امری بسیار مهم است. متریک های معمول استفاده شده در ارزیابی الگوریتم ها، میانگین مربعات خطا و ریشه ی میانگین مربعات خطا می باشد که مورد آخر در جایزه ی نت فلیکس مورد استفاده قرار گرفت. متریک های بازیابی اطلاعات مثل معیار دقت و بازیابی یا DCG جهت ارزیابی کیفیت یک روش پیشنهادی، سودمند و کارا هستند. اخیراً تنوع، نوآوری و پوشش نیز به عنوان جنبه های مهم ارزیابی در نظر گرفته می شوند. هر چند که بسیاری از اندازه گیری های ارزیابی کلاسیک، شدیداً مورد انتقاد قرار گرفته اند. اغلب، نتایج ارزیابی های به اصطلاح آفلاین، با تشخیص واقعی رضایت کاربر هم خوانی ندارد. نویسندگان بیان کردند”ما بایستی در نتایج ارزیابی های افلاین (یا همان اندازه گیری های کلاسیک) تردید می کردیم”.

سیستم توصیه گر چند معیاره

سیستم های توصیه گر چند معیاره (MCRS) به عنوان سامانه هایی توصیف می شوند که سلایق را در چند معیار با هم متحد می سازند. به جای توسعه ی فنون پیشنهادی مبتنی بر ارزش های تک معیاره، تمامی سلایق کاربر در نظر گرفته می شود. این سیستم ها تلاش می کنند تا رتبه بندی آیتم های ناشناخته توسط کاربر را، پیش بینی کنند. این امر با بهره گیری از اطلاعات سلیقه ای و براساس معیارهای چند گانه که تمامی ارزش های سلیقه ای را تحت تأثیر قرار می دهد، ممکن شده است. چندین محقق MCRS را به عنوان یک مسئله ی تصمیم گیر چند معیاره (MCDM) در نظر گرفته و فنون و روش های MCDM را برای اجرای سیستم های MCRS بکار گرفته اند.

منبع

منابع:

fa.wikipedia.org

http://mediasoft.ir

فوریه 3, 2020/0 دیدگاه /توسط hgadmin

سیستم توصیه گر (Recommender System) قسمت 2

آموزش های عمومی هوش مصنوعی

انواع سامانه‌های توصیه‌گر

سامانه‌های توصیه‌گر به طور کلی به سه دسته تقسیم می‌شوند؛ در رایج‌ترین تقسیم‌بندی، آنها را به سه گروه ۱. محتوا محور ۲. دانش محور و ۳. صافی سازی تجمعی، تقسیم می‌کنند، که البته گونه چهارمی تحت عنوان Hybrid RS هم برای آنها قائل می‌شوند.

یک رویکرد به سیستم‌های توصیه‌گر، استفاده از الگوریتم‌های CF یا صافی سازی تجمعی است. در این رویکرد به جای استفاده از محتوای (Content) اقلام، از نظرات و رتبه‌بندی‌های انجام شده توسط کاربران برای ارائه پیشنهاد، استفاده می‌شود. مشکل اصلی استفاده از این رویکرد، مشکل شروع سرد (Cold Start problem)^[۲] می‌باشد که برای کاربران جدید بروز می‌کند که در سیستم ثبت نام می‌کنند و سیستم هیچ اطلاعاتی از نظرات یا علایق کاربر ندارد (New User problem). در چنین شرایطی، سیستم‌ها معمولاً از یادگیری فعال (Active Learning)^[۳] یا استفاده از ویژگی‌های شخصیتی کاربر،^[۴] برای حل مشکل استفاده می‌کنند.

در روش محتوا محور، اقلام پیشنهادی، به این دلیل که با اقلامی که کاربر فعال (کاربری که قرار است به او توصیه کنیم) نسبت به آنها ابراز علاقه کرده‌است شباهت‌هایی دارند، به کاربر توصیه می‌شوند ولی در CF، لیست اقلام پیشنهادی، بر اساس این اصل که، کاربرانی، مشابه کاربر فعال، از آنها رضایت داشته‌اند تهیه می‌شود. از این رو واضح است که در روش محتوامحور، تمرکز بر روی یافتن شباهت بین اقلام بوده، در حالی که در CF، تمرکز روی یافتن شباهت بین کاربران است؛ بدین ترتیب که پیشنهادات در CF، بر اساس تشابه رفتاری کاربرفعال با کاربران دیگر صورت می‌گیرد و نه بر اساس تشابه ویژگی کالاهای پیشنهادی با ویژگی‌های کالاهای مورد علاقه وی (کاربر فعال). رویکرد محتوا محور یکی از روشهای مؤثر برای حلی نوعی از مشکل شروع سرد می‌باشد که برای کالاهای (آیتم‌های) جدید رخ می‌دهد (New Item problem)^[۵] که به تازگی به لیست سیستم اضافه شده‌اند و هیچ کاربری در مورد آنها نظری نداده است. در چنین حالتی رویکرد صافی سازی تجمعی نمی‌تواند این کالاها را به کاربران توصیه کند.

اما گونه سوم این سیستم‌ها را با نام سیستم‌های دانش محور می‌شناسند. این سیستم‌ها براساس ادراکی که از نیازهای مشتری و ویژگی‌های کالاها پیدا کرده‌اند، توصیه‌هایی را ارائه می‌دهند. به عبارتی در این گونه از سیستم‌های توصیه‌گر مواد اولیه مورد استفاده برای تولید لیستی از پیشنهادها، دانش سیستم در مورد مشتری و کالا است. سیستم‌های دانش محور از متدهای مختلفی که برای تحلیل دانش، قابل استفاده هستند بهره می‌برند که متدهای رایج در الگوریتم‌های ژنتیک، فازی، شبکه‌های عصبی و … از جمله آنهاست. همچنین، در این گونه سیستم‌ها از درخت‌های تصمیم، استدلال نمونه‌محور و … نیز می‌توان استفاده کرد. یکی از رایج‌ترین متدهای تحلیل دانش درسیستم‌های توصیه‌گر دانش محور ،CBR یا روش استدلال نمونه‌محور است.

گونه چهارم سیستم‌های ترکیبی هستند. طراحان این نوع سیستم‌ها دو یا چند گونه از انواع سه‌گانه مذکور را غالباً به دو منظور با هم ترکیب می‌کنند؛ ۱- افزایش عملکرد سیستم ۲- کاهش اثر نقاط ضعفی که آن سیستم‌ها وقتی به تنهایی به کار گرفته شوند، دارند. از میان سه روش موجود (CF و CB و KB)، غالباً روش CF یک پای ثابت این ترکیبات است.

منبع

سیستم توصیه گر (Recommender Systems) چیست ؟

سیستم توصیه گر یا پیشنهاد گر (واژه سیستم گاهی با واژه های مترادفی مثل؛ “پلتفرم” یا “موتور” جایگزین می شود) زیر مجموعه ای از سامانه ی پالایش اطلاعات است که بدنبال پیش بینی “امتیاز” یا “اولویتی” است، که کاربر به یک آیتم (داده، اطلاعات، کالا و …) خواهد داد.

در سال های اخیر سیستم های توصیه گر بسیار متداول شده و در حوزه های مختلفی مورد استفاده قرار گرفته اند. برخی از کاربرد های معروف آن در موارد زیر است:

فیلم های سینمایی، موسیقی، اخبار، کتابها، مقالات تحقیقاتی، جست و جوی پرسش ها، تگ های اجتماعی و غالب محصولات.

علاوه بر این سیستم های توصیه گر برای؛ متخصصان، گروه های همکاران، طنز پردازیها، رستورانها، خدمات مالی، بیمه عمر، مسائل عاطفی (قرار و مدارهای آنلاین) و صفحات تویتر نیز ارائه شده است.

بررسی اجمالی

سیستم توصیه گر

معمولاً سیستم های توصیه گر، لیستی از پیشنهادات را به یکی از دو صورت زیر ارائه می دهند:

از طریق پالایش گروهی و محتوا محور (Collaborative and Content-based filtering) یا رهیافت شخصیت محور (Personality-based approach)

رهیافت های پالایش گروهی، مدلی ایجاد می کنند که این مدل بر اساس رفتار گذشته کاربر (آیتم هایی که قبلاً خریداری یا انتخاب کرده و یا امتیازاتی که به آیتم ها داده است) و نیز تصمیمات مشابهی که توسط کاربران دیگر گرفته شده است، میباشد. سپس با استفاده از مدل ایجاد شده، آیتم هایی که ممکن است مورد علاقه ی کاربر باشد، معرفی می گردد. رهیافت های پالایش محتوا محور، از یک سری مشخصات مجزای یک آیتم برای پیشنهاد آیتم های دیگر با ویژگی های مشابه، استفاده می کند. این رهیافت ها اغلب با یکدیگر ترکیب می شوند (سیستم های توصیه گر هیبرید).

رهیافت شخصیت محور، تمایلات کاربر به کالا و خدمات را از شخصیت وی نتیجه می گیرد.

تفاوت های بین پالایش گروهی و پالایش محتوا محور را می توان با مقایسه ی دو سیستم توصیه گر موسیقی نشان داد؛ Last.fm و Pandora Radio.

Last.fm با بررسی نوازندگان و تراکهایی که کاربر قبلاً گوش کرده است و مقایسه ی آنها با آنچه که دیگر کاربران به آن گوش کرده اند، مجموعه ای از آهنگ های پیشنهادی را ارائه می دهد.

Last.fm تراکهایی را خواهد نواخت، که در کتابخانه ی کاربر (مجموعه ی اهنگ های کاربر) موجود نیستند ولی دیگر کاربران با علایق مشابه به آنها گوش داده اند. از آنجا که این رهیافت، رفتار کاربران را تحت تأثیر قرار می دهد، نمونه ای از تکنیک پالایش گروهی است.

Pandora از خصوصیات یک آهنگ یا هنرمند ( زیر مجموعه ای مشتمل بر 400 ویژگی که توسط “پروژه ژنوم موسیقی” تهیه شده است) برای ایجاد ایستگاهی از موسیقی ها با ویژگی های مشابه استفاده می کند.

واکنش کاربر جهت پالایش نتایج ایستگاه استفاده می گردد، زمانیکه کاربر یک آهنگ را نمی پسندد ویژگی های آن از تاکید Pandora خارج و زمانیکه کاربر آهنگی را می پسندد، ویژگی های آن آهنگ مورد تأکید قرار می گیرند. Pandora نمونه ای از رهیافت محتوا محور است.

هر نوع سیستمی نقاط ضعف و قوت خودش را دارد. در مثال بالا Last.fm جهت ارائه پیشنهادات دقیق، نیازمند حجم بالایی از اطلاعات در مورد کاربر است. نکته ضعف ذکر شده نمونه ای از “مشکل استارت سرد” ( همانند مشکلی که هنگام استارت زدن به موتور سرد پیش می آید) است و در سیستم های پالایش گروهی امری عادیست. در حالیکه Pandora به اطلاعات بسیار کمی برای آغاز کار خود نیاز دارد، ولی میدان عمل آن بسیار محدود است (بعنوان مثال؛ تنها قادر به ارائه پیشنهاداتیست که شبیه آهنگ اصلی باشند).

سیستم های توصیه گر جایگزین سودمندی برای الگوریتم های جست و جو هستند چرا که به کاربران کمک می کنند تا آیتم هایی را بیابند که ممکن بود خودشان نتوانند آنها را پیدا کنند. سیستم های توصیه گر با استفاده از موتورهای جست و جو، به طور جالبی داده های جدید را فهرست می کنند.

مونتانر نخستین نمایه کلی از سیستم های توصیه گر را از منظر یک عامل هوشمند ارائه داد. آدوماویسیوس (Adomavicius) نمایی جدید از سیستم های توصیه گر را ارائه کرد. هرلاکر (Herlocker) تکنیک های ارزیابی سیستم های توصیه گر را مورد بررسی قرار داد و بیل و همکارانش مشکلات ارزیابی های آفلاین را مورد بحث و بررسی قرار دادند. بیل و همکاران، پیشینه ای از تحقیقات در مورد سیستم های کنترل و چالش های موجود را ارائه دادند.

سیستم های توصیه گر موضوع تحقیقاتی فعال در زمینه های “کاوش اطلاعات” و “یادگیری ماشینی” هستند. RecSys، SIGIR و KDD از جمله کنفرانس هایی هستند که تحقیقات در زمینه سیستم های توصیه گر را مورد توجه قرار دادند.

رهیافت ها

رهیافتی که در طراحی سیستم های توصیه گر استفاده وسیعی دارد، رهیافت پالایش گروهیست. روش های پالایش گروهی، بر هیافت هاجمع آوری و آنالیز حجم بالایی از اطلاعات در مورد رفتارها، فعالیت ها و تمایلات کاربران و نیز پیش بینی پسند کاربران، بر اساس شباهت خواسته های آنها با دیگران، مبتنی هستند. مهم ترین مزیت پالایش گروهی اینست که وابسته به محتوای قابل تحلیل برای ماشین نیست و از این رو به درستی می تواند آیتم های پیچیده ای همچون فیلم های سینمایی را بدون نیاز به درک خود آیتم، توصیه کند. الگوریتم های زیادی در اندازه گیری تشابه کاربر یا تشابه آیتم در سیستم های توصیه گر مورد استفاده قرار می گیرند. برای مثال؛ “رهیافت نزدیک ترین همسایه k ” (k-nearest neighbor (k-NN)) و ضریب همبستگی پیرسون که نخستین بار توسط آلن اجرا شد.

پالایش گروهی بر اساس این اندیشه استوار است: افرادی که در گذشته موافق بوده اند، در آینده نیز موافق خواهند بود و انواع اقلامی را خواهند پسندید که در گذشته نیز مورد دلخواهشان بوده است.

موقعیکه یک مدل بر اساس رفتار کاربر ایجاد می گردد، تمایزی بین فرم های صریح و ضمنی جمع آوری داده ها پیش می آید.

نمونه هایی از جمع آوری داده ها به صورت “صریح” شامل موارد زیر است:

از کاربر خواسته شود تا آیتم را در معیاری متغیر ارزیابی کند.

از کاربر خواسته شود تا جست و جو کند.

از کاربر خواسته شود تا مجموعه ای از آیتم ها را بر اساس علاقه اش رتبه بندی کند.

دو آیتم به کاربر نشان داده شده و از وی خواسته شود یکی از آنها را انتخاب کند.

از کاربر خواسته شود تا لیستی از آیتم هایی را که دوست دارد، ایجاد کند.

نمونه ای از جمع آوری داده ها به صورت “ضمنی” شامل موارد زیر می باشد:

مشاهده آیتم هایی که کاربر در فروشگاه آنلاین به آنها می نگرد.

تحلیل آیتم هایی که کاربر ملاحظه کرده است.

حفظ سابقه ی خرید های آنلاین کاربر.

فراهم کردن لیستی از آیتم هایی که کاربر در رایانه خود به آنها گوش داده یا تماشا کرده است.

تحلیل شبکه اجتماعی کاربر و یافتن موارد مشابهی که وی آنها را پسندیده و یا نپسندیده است.

سیستم توصیه گر اطلاعات جمع آوری شده را با اطلاعات جمع آوری شده مشابه و غیر مشابه از جانب دیگران، مورد مقایسه قرار داده و لیستی از آیتم های پیشنهادی برای کاربر را محاسبه می کند (در مقاله سیستم های پالایش گروهی ویکی پدیا، چندین مورد از مثالهای تجاری و غیر تجاری فهرست شده است).

یکی از معروف ترین مثالهای پالایش گروهی، پالایش “آیتم به آیتم” است (افرادی که کالای x را می خرند کالای y را نیز می خرند) الگوریتمی که توسط سیستم توصیه گر Amazon.com عمومیت یافت.

نمونه های دیگر شامل:

همانطور که توضیح داده شد، fm آهنگ هایی را که پیشنهاد می دهد بر اساس مقایسه ای از عادت های شنیداری کاربران مشابه است.
Facebook، My Space، Linked in و دیگر شبکه های اجتماعی از پالایش گروهی برای پیشنهاد دوستان جدید، گروهها و دیگر روابط اجتماعی استفاده می کنند (با بررسی شبکه ارتباطات بین کاربر و دوستانش). تویتر از تعداد زیادی سیگنال و محاسبات حافظه ای استفاده می کند تا به کاربرانش پیشنهاد دهد که چه کسی را فالو کنند.

رهیافت های پالایش گروهی از سه مشکل رنج می برند: استارت سرد (cold start)، مقیاس پذیری (Scalability) و پراکندگی (Sparsity).

استارت سرد: این سیستم ها برای ارائه پیشنهادات دقیق و صحیح، اغلب به حجم بالایی از اطلاعات کاربر نیاز دارند.

مقیاس پذیری: در بسیاری از فضاهایی که این سیستم ها پیشنهادات را ارائه می دهند، میلیون ها کاربر و محصول حضور دارند. از این رو برای محاسبه پیشنهادات، به قدرت محاسباتی بالایی نیاز است.

پراکندگی: تعداد آیتم هایی که در سایت های اصلی تجارت الکترونیک فروخته شده اند، بسیار بسیار زیاد است. فعالترین کاربران نیز تنها زیر مجموعه ی کوچکی از تمامی پایگاه های داده را ارزیابی خواهند کرد. به این خاطر است، که حتی محبوبترین آیتم ها نیز امتیازات پایینی دارند.

نوع ویژه ای از الگوریتم پالایش گروهی از فاکتور ماتریس استفاده می کند، یک “تکنیک تقریب رتبه پایین ماتریس” (low-rank matrix approximation technique).

روش های پالایش گروهی به دو دسته مبتنی بر حافظه و پالایش گروهی مبتنی بر مدل تقسیم می شوند.

نمونه ی شناخته شده ی رهیافت های مبتنی بر حافظه، “الگوریتم کاربر محور” (user-based algorithm) و نمونه ای از رهیافت های مبتنی بر مدل، “توصیه گر کرنل – نقشه” (Kernel-Mapping) است.

پالایش محتوا محور

سیستم توصیه گر

دیگر رهیافت متداولی که در طراحی سیستم های توصیه گر استفاده می شود، پالایش محتوا محور است. روش های پالایش محتوا محور بر اساس توصیفی از آیتم و پروفایلی از سلیقه ی کاربر، استوار هستند. در یک سیستم توصیه گر محتوا محور، از کلمات کلیدی برای توصیف آیتم ها استفاده شده و برای نشان دادن نوع آیتمی که کاربر دوست دارد، پروفایل وی ساخته می شود. به عبارت دیگر، این الگوریتم ها در تلاش هستند تا آیتم هایی را پیشنهاد دهند که شبیه به اقلامی باشد که کاربر پیش از این آنها را پسندیده بود ( یا اقلامی که در حال حاضر بررسی کرده است). آیتم های کاندید با آیتم هایی که قبلاً توسط کاربر ارزیابی شده بودند، مورد مقایسه قرار گرفته و آیتم هایی که بهترین انطباق ها را با معیارهای کاربر داشته باشند، پیشنهاد می گردند. این رهیافت در بازیابی اطلاعات و بررسی پالایش اطلاعات ریشه دوانیده است. برای خلاصه کردن مشخصات آیتم ها در سیستم، یک الگوریتم نمایش آیتم به کار برده می شود. الگوریتمی که استفاده ی گسترده ای دارد، نمایش فراوانی تی اف-آی دی اف (tf-idf representation) است (مدل “فضا برداری” نیز گفته می شود).

برای ایجاد پروفایل کاربر، سیستم بایستی بیشترین تمرکز خود را بر دو نوع از اطلاعات معطوف کند: 1. الگویی از سلیقه ی کاربر 2. تاریخچه ای از عکس العمل کاربر با سیستم توصیه گر.

اساساً این روش ها با استفاده از پروفایل آیتم (بعبارتی مجموعه ویژگی ها و مشخصات)، ویژگی های آن را در سیستم ترسیم می کنند. سیستم، یک پروفایل محتوا محور بر اساس بردار وزنی ویژگی های آیتم برای کاربر ایجاد می کند. وزن ها، اهمیت هر ویژگی برای کاربر را نشان می دهند، و می توان از طریق مؤلفه های رتبه بندی شده و بهره گیری از تکنیک های گوناگون، آنها را مورد محاسبه قرار داد. رهیافت های ساده، از میانگین ارزش های مؤلفه های رتبه بندی شده استفاده می کنند، در حالیکه دیگر رهیافت ها از روش های پیچیده ی یادگیری ماشینی همچون؛ دسته بندی بندی کننده های نایو بیز (Bayesian Classifiers)، دسته بندی بندی کننده های نایو بیز (Bayesian Classifiers)، درخت های تصمیم (Decision trees) و شبکه های عصبی مصنوعی (Artificial neural networks) برای تخمین احتمال آنکه کاربر چه آیتمی را پسند خواهند کرد، بهره می برند.

بازخورد مستقیم از جانب کاربر (معمولا در غالب “Like” یا “Dislike”) می تواند برای اختصاص وزن بالا یا پایین بر اهمیت خصوصیات معین، مورد استفاده قرار گیرد (با استفاده از طبقه بندی راکچیو یا دیگر تکنیک های مشابه).

مسئله کلیدی در رابطه با پالایش محتوا محور اینست که آیا سیستم قادر است از طریق اقداماتی که کاربر در رابطه با یک محتوا نشان می دهد و بهره گیری از آنها در تقابل با انواع محتوا ها، پی به تمایلات کاربر ببرد. زمانیکه سیستم محدود به توصیه ی محتواهایی است که مشابه با آنچه که کاربر قبلاً استفاده کرده است باشد، در این حالت ارزش سیستم توصیه گر در مقایسه با زمانیکه سیستم از سرویس های دیگر نیز برای توصیه محتوا استفاده می کند، کم تر است. برای مثال، توصیه ی مقالات خبری بر اساس مرور اخبار سودمند است، ولی زمانیکه آهنگ، ویدئو، محصولات، مباحث و … از سرویس های مختلف و البته بر اساس مرور اخبار توصیه گردد، به مراتب پربارتر و سودمندتر خواهد بود.

همانطور که قبلاً نیز توضیح داده شد، Pandora Radio یک مثال معروف از سیستم توصیه گر محتوا محور است که آهنگ های پیشنهادی آن مشابه با ویژگی های آهنگی است که بعنوان بذر اولیه توسط خود کاربر ایجاد شده است. تعداد بسیار زیادی از سیستم های توصیه گر محتوا محور وجود دارد که پیشنهاد دهنده فیلم هستند که چند تا از آنها عبارتند از: Rotten Tomatoes، Internet Movie Database، Jinni، Rovi Corporation، Jaman and See This Next (http://www.seethisnext.com/). سیستم های توصیه گر مرتبط با سند و مدرک، هدفشان توصیه ی مدارک برای آگاهی دادن به کارگران است، مثل؛ Noggle(https://www.noggle.online/knowledge-base/document-recommendation) و Google Springboard.

سیستم توصیه گر هیبرید

بررسی اخیر حاکی از آنست که رهیافت هیبرید (ترکیبی از پالایش گروهی و پالایش محتوا محور) در برخی موارد می تواند بسیار مؤثر واقع گردد. رهیافت های هیبرید از چندین راه قابل اجرا هستند، با ایجاد جداگانه پیش بینی های محتوا محور و گروه محور و نهایتاً ترکیب آنها با هم، افزودن قابلیت های رهیافت محتوا محور به گروه محور (یا بالعکس)، یا یکی کردن رهیافت ها در یک مدل . چندین مطالعه ی تجربی، اجرای سیستم هیبرید را با نوع خالص سیستم های گروه محور و محتوا محور مورد مقایسه قرار داده است، و نشان داده شده که روش های هیبرید پیشنهادات دقیق تری را ارائه می دهند. همچنین، این روش ها می توانند برای غلبه بر مسائل روتین سیستم های توصیه گر مثل استارت سرد و پراکندگی مورد استفاده قرار گیرند.

نت فلیکس مثال خوبی از استفاده ی سیستم های توصیه گر هیبرید است. آنها با مقایسه ی عادات دیداری و جست و جویی کاربران مشابه (یعنی پالایش گروهی) و نیز پیشنهاد فیلم هایی که دارای ویژگی های مشترک با مواردی هستند که کاربر به انها امتیاز بالایی داده است، پیشنهادات را ارائه می دهند.

انواعی از تکنیک ها به عنوان پایه و اساس سیستم های توصیه گر، مطرح گردیده است: گروهی، محتوا محور، دانش محور و تکنیک های جمعیت شناختی. هر یک از این تکنیک ها کمبودهای شناخته شده ای دارند، مثل مشکل معروف استارت سرد برای سیستم های پالایش گروهی و محتوا محور (با کابران جدید که به اقلام کمی امتیاز داده اند، چه کند!؟) و تنگنای مهندسی دانش در رهیافت دانش محور. سیستم توصیه گر هیبرید، سیستمی است که چند رهیافت را با هم ترکیب می کند تا به همیاری بین آنها دست یابد.

گروهی: سیستم، تنها با استفاده از اطلاعاتی که از طریق پیشینه ی امتیاز دهی کاربران بدست آمده است، پیشنهادات را ارائه می دهد. سیستم های گروهی، کاربران همتا با تاریخچه ی مشابه امتیازدهی با کاربر آنلاین را در مجاور هم قرار داده و با استفاده از این همسایگی اقدام به ارائه پیشنهادات می کند.
محتوا محور: سیستم، پیشنهادات را از دو منبع ارائه می دهد: مشخصات مرتبط با محصول و امتیازاتی که کاربر به آنها داده است. توصیه گرهای محتوا محور، با یک پیشنهاد همچون طبقه بندی یک مسئله ی خاص کاربر رفتار می کنند، و در می یابند که طبقه بندی کننده ی پسندها و ناپسندهای کاربر، بر پایه ی ویژگی های محصول است.
جمعیت شناختی (Demographic): یک سیستم توصیه گر جمعیت شناختی، پیشنهادات را بر اساس مشخصات جمعیت شناختی کاربر (مشخصاتی همچون؛ سن، جنسیت و ملیت کاربر) ارائه می دهد. محصولات پیشنهادی می توانند برای دیگر مجموعه های جمعیتی، با ترکیب امتیازاتی که کاربران درآن مجموعه ها به محصولات داده اند استفاده گردند.
دانش محور: سیستم دانش محور، مواردی را پیشنهاد می کند که از نیازها و تمایلات کاربر استنتاج کرده باشد. این دانش، گهگاه حاوی فهمی عملکردی و واضح از برآوردن نیازهای کاربر توسط ویژگی های معینی از محصول، خواهد بود.

در اینجا، واژه ی “سیستم توصیه گر هیبرید” برای توصیف هر سامانه ی پیشنهاد دهنده ای که جهت ارائه پیشنهاد چند تکنیک توصیه را با هم ترکیب کرده است، بکار می رود. دلیلی برای چرایی اینکه چند تکنیک متفاوت از یک نوع، نتوانند با یکدیگر هیبرید شوند، وجود ندارد. برای مثال دو سیستم توصیه گر محتوا محور متفاوت، می توانند باهم کار کنند که تعدادی از طرح ها این نوع از هیبرید را مورد بررسی قرار داده اند:

NewsDude، که از هر دو طبقه بندی کننده ی ساده Bayes و kNN در توصیه ی اخبارهای خود استفاده می کند، تنها یک مثال از این دست سیستم های هیبرید است.

سیستم توصیه گر (Recommender System) قسمت 1
سیستم توصیه گر (Recommender System) قسمت 2
سیستم توصیه گر (Recommender System) قسمت 3

فوریه 2, 2020/0 دیدگاه /توسط hgadmin

صفحه شرکت بهسان اندیش در سایت لینکدین (LinkedIn)

وبلاگ

لینکدین چیست؟

در عصر ارتباطی حال حاضر، استفاده مطلوب از شبکه های اجتماعی بسیار رشد داشته و تعداد کثیری از مردم جهان روی این شبکه ها ( که اکثر این شبکه وابستگی دولتی ندارند) فعال شده اند و از این شبکه ها استفاده می کنند. شبکه های اجتماعی مجازی، بهترین ابزاری است که می تواند شما را در دستیابی به اهداف حرفه ای یاری دهد. بسیاری از افراد هستند که در دنیای کسب و کار امروز در شبکه های اجتماعی مجازی به دنبال فرد متخصص یا خدمات خود هستند.

لینکدین در واقع یک شبکه اجتماعی حرفه ای است که اساسا برای بهبود کسب و کارهای مختلف و آشنا کردن دیگران با آن ها طراحی شده است. با این حال، استفاده از لینکدین تنها به این موضوع محدود نمی شود و کاربران این شبکه اجتماعی می توانند از طریق آن، با افراد دیگری که در حوزه کاری شان فعالیت می کنند، آشنا شوند و با آن ها ارتباط برقرار کنند.

شرکت بهسان اندیش به منظور ارائه خدمات و فعالیت های خود در شبکه های اجتماعی اقدام به راه اندازی صفحه ای شخصی نموده که علاقمندان می توانند از طریق لینک زیر در سایت لینکدین ما را دنبال نمایند:

ورود به صفحه شخصی شرکت بهسان اندیش در سایت لینکدین

ژانویه 28, 2020/0 دیدگاه /توسط BehsanAndish

کانال شرکت بهسان اندیش در سایت آپارات (Aparat)

وبلاگ

کانال شرکت بهسان اندیش در سایت اشتراک ویدئو آپارات (Aparat)

کانال شرکت بهسان اندیش در سایت آپارات – در دنیای مجازی که شبکه های اجتماعی همچون کشوری مستقل عمل می کنند دسته ای از کاربران متناسب با فعالیت خود نیاز به امکاناتی خاص تر دارند. سازمان های دولتی و خصوصی، برند ها، شخصیت های سیاسی، هنری، فرهنگی و… برای ایجاد ارتباط و پیشبرد فعالیت خود نیاز به اعتماد مخاطب دارند.

در شبکه های اجتماعی ، گاه هویت واقعی یک کاربر مشخص نیست و ممکن است دیگران به اسم سازمان ها و اشخاص صفحاتی را ایجاد کنند و نام آن برند یا شخص را خدشه دار نمایند و با توجه به آنکه ایجاد اعتماد در مخاطب، امری مشکل است ، آپارات با رسمیت بخشیدن به صفحات و تایید آنها این رویکرد را متفاوت کرده است.

شرکت بهسان اندیش به منظور ارائه خدمات و فعالیت های خود در شبکه های اجتماعی اقدام به راه اندازی کانال شرکت بهسان اندیش در سایت آپارات نموده که علاقمندان می توانند از طریق لینک زیر در این سایت ما را دنبال کنید:

ورود به صفحه شخصی شرکت بهسان اندیش در سایت اشتراک ویدئو آپارات

www.aparat.com

ژانویه 27, 2020/0 دیدگاه /توسط BehsanAndish

سامانه هوشمند کنترل کیفیت (QC) بهسان اندیش

بینایی ماشین (Machine Vision) و بینایی کامپیوتر, وبلاگ

مقدمه

کنترل کیفیت (QC) هوشمند – امروزه کمتر کارخانه پیشرفته‌ای وجود دارد که بخشی از خط تولید آن توسط برنامه‌های هوشمند بینایی ماشین کنترل نشود. شرکت بهسان اندیش پیشرو در ارائه راهکارهای هوشمند مبتنی بر پردازش تصویر و بینایی ماشین، مفتخر به حضور در عرصه کنترل کیفیت هوشمند در صنایع می باشد. جهت آشنایی بیشتر با قابلیت ها و مزایای استفاده از پردازش تصویر و بینایی ماشین در حوزه صنعت توجه شما را به خواندن این نوشتار و یا دانلود کاتالوگ از طریق لینک زیر جلب می نماییم:

دانلود کامل کاتالوگ (شامل تصاویر بیشتر جهت آشنایی با موضوع)

بینایی ماشین چیست؟

بینایی ماشین (به انگلیسی: Machine vision) شاخه‌ای از علم مهندسی است که به رشته‌های علوم کامپیوتری (Computer science) و علم نورشناسی و مهندسی مکانیک و اتوماسیون صنعتی ارتباط دارد. یکی از مهمترین و پر استفاده‌ترین کاربردهای آن در بازبینی و بررسی کالاهای صنعتی از جمله نیمه هادیها، اتومبیل‌ها، مواد خوراکی و دارو می‌باشد. همانند نیروی انسانی که با چشم غیر مسلح در خط تولید کالاها را برای تعیین کیفیت و نوع ساخت آنها بازبینی می‌کنند، Machine vision از دوربین‌های دیجیتال و دوربین‌های هوشمند و نرم‌افزارهای image processing (پردازش تصویر) برای این کار استفاده می‌کند. دستگاههای مربوطه (Machine vision) برای انجام دادن وظایفی خاص از جمله شمردن اشیاء در بالابرها، خواندن شماره سریالها(Serial numbers)، جستجوی سطح‌های معیوب به کار می‌روند.

مزایای بهره گیری از بینایی ماشین در صنعت

امروزه کمتر کارخانه پیشرفته‌ای وجود دارد که بخشی از خط تولید آن توسط برنامه‌های هوشمند بینایی ماشین کنترل نشود. قابلیت ها و مزایای زیر باعث شده که صنایع و کارخانه‌ها به‌سرعت به سمت پردازش تصویر و بینایی ماشین روی بیاورند:
* ثبت کلیه تصاویر و امکان بررسی سوابق کنترل کیفیت محصول در آینده
* کاهش نیروی انسانی
* ایجاد فضایی کاملا بهداشتی با کاهش دخالت انسان
* اطلاع از کیفیت دستگاههای تولیدی با بررسی میانگین محصولات معیوب
* هزینه نگهداری بسیار پایین
* عدم نیاز به حضور 24 ساعته اپراتور
* امکان شناسایی تخلفات پرسنل
* افزایش سرعت در مرحله کنترل کیفیت

کاربردهای بینایی ماشین در صنعت

* بررسی مواد اولیه تولید (مثلاً کنترل کیفیت مواد اولیه).
* کنترل موجودی انبار و سیستمهای مدیریتی (شمارش، بارکد خواندن و ذخیره اطلاعات در سیستمهای دیجیتال)
* بررسی کیفیت محصول نهایی تولید شده
* کنترل کیفیت و بهبود محصولات غذایی.
* ماشینی کردن اجزای کوچک صنعتی.
* سیستمهای ایمنی موجود در محیط‌های صنعتی.
* کنترل رباتهای تعقیب خطی که برای حمل بار در کارخانه‌های صنعتی استفاده می‌شوند.

اجزای سیستم بینایی ماشین جهت پیاده سازی کنترل کیفیت هوشمند

اگرچه “بینایی ماشینی” بیشتر به عنوان یک فرآیند در کاربردهای صنعتی شناخته شده است، برای فهرست کردن اجزای سخت‌افزاری و نرم‌افزاری به کار برده شده نیز مفید می‌باشد. معمولاً یک بینایی ماشینی از اجزای زیر ساخته شده است:
1. یک یا چند دوربین دیجیتال یا آنالوگ (سیاه-سفید یا رنگی) با اپتیک مناسب برای گرفتن عکس.
2. واسطه‌ای که عکس‌ها را برای پردازش آماده می‌سازد. برای دوربین‌های آنالوگ این واسطه شامل یک دیجیتال کننده عکس است.

3. یک پردازشگر (گاهی یک PC یا پردازنده تعبیه شده (Embedded Processor) مانند DSP
4. نرم‌افزار Machine vision: این نرم‌افزار امکاناتی برای توسعه یک برنامه نرم‌افزاری که برای کاربردی مشخص شده است را فراهم می‌کند.
5. سخت‌افزار ورودی / خروجی (مثلاً I/O دیجیتال) یا حلقه‌های ارتباطی (مثلاً ارتباط شبکه ای یا RS-232) برای گزارش نتایج.
6. یک دوربین هوشمند: یک وسیله ساده که همه موارد فوق را داراست.
7. لنزهایی که بتواند به مقدار مطلوبی روی سنسور تصویر زوم کند.
8. منابع نوری مناسب و گاهی خیلی مخصوص (مثلاً چراغهای LED، فلورسنت، لامپهای هالوژن و . . .)
9. یک برنامهٔ مشخص که بتواند تصاویر را پردازش کرده و مشخصه‌های مربوط و مناسب را شناسایی کند.
10. یک سنسور همزمان ساز برای شناسایی اجزا (گاهی یک سنسور نوری یا یک سنسور مغناطیسی): این سنسور برای راه‌اندازی سیستمٍ استخراج و پردازش تصویر می‌باشد.

ژانویه 26, 2020/0 دیدگاه /توسط admin

سامانه کنترل تردد خودرو بهسان در شرکت ذوب روی اصفهان

دسته‌بندی نشده

ژانویه 21, 2020/0 دیدگاه /توسط daliri

آنالیز موجک

آموزش عمومی پردازش تصویر و بینایی ماشین

تاریخچه

(آنالیز موجک) ایده ی نمایش یک تابع برحسب مجموعه ی کاملی از توابع اولین بار توسط ژوزف فوریه، ریاضیدان و فیزیکدان بین سال های ۱۸۰۶-۱۸۰۲ طی رساله ای در آکادمی علوم راجع به انتشار حرارت، برای نمایش توابع بکار گرفته شد. در واقع برای آنکه یک تابع(f(x به شیوه ای ساده و فشرده نمایش داده شود فوریه اساسا ثابت کرد که می توان از محور هایی استفاده کرد که بکمک مجموعه ایی نامتناهی از توابع سینوس وار ساخته می شوند. بعبارت دیگر فوریه نشان داد که یک تابع (f(x را می توان بوسیله ی حاصل جمع بی نهایت تابع سینوسی و کسینوسی به شکل (sin(ax و (cos(ax نمایش داد. پایه های فوریه بصورت ابزار هایی اساسی، با کاربردهای فوق العاده متواتر در علوم، در آمده اند، زیرا برای نمایش انواع متعددی از توابع و در نتیجه کمین های فیزیکی فراوان بکار می روند.

با گذشت زمان ضعف پایه های فوریه نمایان شد مثلا دانشمندان پی بردند پایه های فوریه و نمایش توابع سینوس وار در مورد سیگنال های پیچیده نظری تصاویر، نه تنها ایده آل نیستند بلکه از شرایط مطلوب دورند، بعنوان مثال به شکل کارآمدی قادر به نمایش ساختارهای گذرا نظیر مرزهای موجود در تصاویر نیستند. همچین آنها متوجه شدند تبدیل فوریه فقط برای توابع پایه مورد استفاده قرار می گیرد و برای توابع غیر پایه کار آمد نیست.(البته در سال ۱۹۴۶ با استفاده از توابع پنجره ای، که منجر به تبدیل فوریه ی پنجره ای شداین مشکل حل شد.)

در سال ۱۹۰۹ هار اولین کسی بود که به موجک ها اشاره کرد. در سال های ۱۹۳۰ ریاضیدانان به قصد تحلیل ساختارهای تکین موضوعی به فکر اصلاح پایه های فوریه افتادند. و بعد از آن در سال ۱۹۷۰ یک ژئوفیزیکدان فرانسوی به نام ژان مورله متوجه شد که پایه های فوریه بهترین ابزار ممکن در اکتشافات زیر زمین نیستند، این موضوع در آزمایشگاهی متعلق به الف آکیلن منجر به یکی از اکتشافات تبدیل به موجک ها گردید.

در سال ۱۹۸۰ ایومیر ریاضیدان فرانسوی، نخستین پایه های موجکی متعامد را کشف کرد(تعامد نوعی از ویژگی ها را بیان می کند که موجب تسهیلات فراوانی در استدلال و محاسبه می شود، پایه های فوریه نیز متعامدند.) در همین سال ها مورله مفهوم موجک و تبدیل موجک را بعنوان یک ابزار برای آنالیز سیگنال زمین لزره وارد کرد و گراسمن فیزیکدان نظری فرانسه نیز فرمول وارونی را برای تبدیل موجک بدست آورد.

در سال ۱۹۷۶ میرو و مالت از پایه های موجک متعامد توانسنتد آنالیز چند تفکیکی را بسازند و مالت تجزیه موجک ها و الگوریتم های بازسازی را با بکار بردن آنالیز چند تفکیکی بوجود آورد. در سال ۱۹۹۰ مورنزی همراه با آنتوان موجک ها را به دو بعد و سپس به فضاهایی با ابعد دیگر گسترش دادند و بدین ترتیب بود که آنالیز موجکی پایه گذاری گردید.

آشنایی

آنالیز موجک (Wavelet Analysis) یکی از دستاوردهای نسبتا جدید و هیجان انگیز ریاضیات محض که مبتنی بر چندین دهه پژوهش در آنالیز همساز است، امروزه کاربردهای مهمی در بسیاری از رشته های علوم و مهندسی یافته و امکانات جدیدی برای درک جنبه های ریاضی آن و نیز افزایش کاربردهایش فراهم شده است.
در آنالیز موجک هم مانند آنالیز فوریه با بسط تابع ها سروکار داریم ولی این بسط برحسب «موجک ها» انجام می شود.

موجک تابع مشخص مفروضی با میانگین صفر است و بسط برحسب انتقالها و اتساعهای این تابع انجام می گیرد، بر خلاف چند جمله ای های مثلثاتی، موجک ها در فضا بصورت موضعی بررسی می شوند و به این ترتیب ارتباط نزدیکتری بین بعضی توابع و ضرایب آن ها امکان پذیر می شود و پایداری عددی بیشتری در باز سازی و محاسبات فراهم می گردد. هر کاربردی را که مبتنی بر تبدیل سریع فوریه است می توان با استفاده از موجک ها فومول بندی کرد و اطلاعات فضایی (یا زمانی) موضعی بیشتری بدست آورد. بطور کلی، این موضوع بر پردازش سیگنال و تصویر و الگوریتم های عددی سریع برای محاسبه ی عملگرهای انتگرالی اثر می گذارد.

آنالیز موجک حاصل ۵۰ سال کار ریاضی (نظریه ی لیتلوود – پیلی و کالدرون – زیگموند) است که طی آن، با توجه به مشکلاتی که در پاسخ دادن به ساده ترین پرسش های مربوط به تبدیل فوریه وجود داشت، جانشینهای انعطاف پذیر ساده تری از طریق آنالیز همساز ارائه شدند. مستقل از این نظریه که درون ریاضیات محض جای دارد، صورتهای مختلفی از این رهیافت چند مقیاسی (multi Scale) را در طی دهه ی گذشته در پردازش تصویر، آکوستیک، کدگذاری(به شکل فیلترهای آیینه ای متعامد و الگوریتمهای هرمی)، و استخراج نفت دیده ایم.

کاربردها

آنالیز موجک همراه با تبدیل سریع فوریه در تحلیل سیگنالهای گذرایی که سریعا تغییر می کنند، صدا و سیگنالهای صوتی، جریان های الکتریکی در مغز، صداهای زیر آبی ضربه ای و داده های طیف نمایی NMR، و در کنترل نیروگاههای برق از طریق صفحه ی نمایش کامپیوتر بکار رفته است. و نیز بعنوان ابزاری علمی، برای روشن ساختن ساختارهای پیچیده ای که در تلاطم ظاهر می شوند، جریان های جوی، و در بررسی ساختارهای ستاره ای از آن استفاده شده است. این آنالیز به عنوان یک ابزار عددی می تواند مانند تبدیل سریع فوریه تا حد زیادی از پیچیدگی محاسبات بزرگ مقیاس بکاهد، بدین ترتیب که با تغییر هموار ضریب، ماتریس های متراکم را به شکل تنکی که به سرعت قابل محاسبه باشد در آورد. راحتی و سادگی این آنالیز باعث ساختن تراشه هایی شده است که قادر به کدگذاری به نحوی بسیار کارا، و فشرده سازی سیگنالها و تصاویرند.

آنالیز موجک امروزه کاربردهای فراوانی پیدا کرده است که از آن جمله می توان به کاربرد آن در تصویر برداری پزشکی (MRI) و سی تی اسکن (CAT)، جداسازی بافت های مغزی از تصاویر تشدید مغناطیس، تشخیص خودکار خوشه های میکروکلسیفیکاسیون، تحلیل تصاویر طیفی تشدید مغناطیسی (MR Spectrorscopy) و عملکردهای تشدید مغناطیسی (F MRI) اشاره کرد.

منبع

موجک

موجک (Wavelet) دسته‌ای از توابع ریاضی هستند که برای تجز‌یه سیگنال پیوسته به مؤلفه‌های فرکانسی آن بکار می‌رود که رزولوشن هر مؤلفه برابر با مقیاس آن است. تبدیل موجک تجزیه یک تابع بر مبنای توابع موجک می‌باشد. موجک‌ها (که به عنوان موجک‌های دختر شناخته می‌شوند) نمونه‌های انتقال یافته و مقیاس شده یک تابع (موجک مادر) با طول متناهی و نوسانی شدیداً میرا هستند. چند نمونه موجک مادر در شکل زیر نمایش داده شده‌اند.

مِیِر

مورله

کلاه مکزیکی

تبدیل‌های موجک

تعداد زیادی تبدیل موجک وجود دارد که لیست آن را می‌شود در فهرست تبدیل‌های مرتبط با موجک مشاهده نمود. معمول‌ترین این تبدیل‌ها عبارتند از:

تبدیل موجک پیوسته (Continuous wavelet transform (CWT
تبدیل موجک گسسته (Discrete wavelet transform (DWT
تبدیل سریع موجک (Fast wavelet transform (FWT
Lifting scheme
تجزیه بسته‌های موجک(Wavelet packet decomposition (WPD
تبدیل موجک ساکن (Stationary wavelet transform (SWT

موجک‌ها و معادلات اتساع
موجک‌ها بر مبنای دو عمل اصلی قرار دارند:

انتقال (Translation)

$[عکس: 34b5ae95f23a0378679d434d7cea3360.png]$

اتساع (Dilation)

$[عکس: a9be4f8956d1bb85c9e932c584196743.png]$

مقایسه با تبدیل فوریه

در مقایسه با تبدیل فوریه می‌توان گفت که تبدیل موجک دارای خصوصیت محلی‌سازی بسیار خوبی است. بطور مثال تبدیل فوریه یک پیک تیز دارای تعداد زیادی ضریب است، چرا که توابع پایه تبدیل فوریه توابع سینوسی و کسینوسی هستند که دامنه آنها در کل بازه ثابت است، در حالی که توابع موجک توابعی هستند که بیشتر انرژی آنها در بازه کوچکی متمرکز شده‌است و به سرعت میرا می‌شوند. بنابراین با انتخاب مناسب موجک های مادر می توان فشرده سازی بهتری در مقایسه با تبدیل فوریه انجام داد.

تاریخچه

در تاریخ ریاضیات مبادی و ریشه‌های متعددی را می‌توان برای موجک‌ها سراغ گرفت.

کارهای قبل از ۱۹۳۰
مربوط به قبل از ۱۹۳۰ (م) می‌توان به آنالیز فرکانس‌ها اشاره کرد، که به وسیلهٔ فوریه شروع شد.
استفاده از واژهٔ موجک‌ها، برای اولین بار، در یکی از ضمیمه‌های تز آلفرد هار (۱۹۰۹ م) ظاهر شد. امروزه هم، این موجک‌ها به همان نام یعنی به موجک‌های هار معروف اند. موجک‌های هار دارای دامنهٔ تعریف فشرده (compact) بوده، و غیر مشتق‌پذیر به صورت پیوسته هستند.

کارهای مربوط به دهه ۱۹۳۰
در این دهه چند گروه پیرامون موضوع نمایش توابع با به کارگیری پایه‌های با مقیاس متغیر برای تنیدن فضاهای توابع تحقیق می‌نمودند.

موجک‌های متعامد

با دیدی کلی می‌توان اظهار داشت که پایه‌های متعامد حالتی بهینه برای تنیدن فضاهای برداری (چه فضاهای با ابعاد متناهی و چه فضاهای بی نهایت بعدی) و انجام محاسبات ارائه می‌نمایند. لذا همواره تمایل و تلاش در این راستا قرار داشته که یا مجموعه پایه‌ها از آغاز متعامد انتخاب شود و یا آن که با شیوه‌هایی نظیر گرام اشمیت آنها را به سوی تعامد سوق داد.

موجک هار

موجک هار اولین موجک شناخته شده می‌باشد که پیدایش آن به سالهای ابتدای قرن بیستم باز می‌گردد. این موجک ساده‌ترین نوع هم هست و پایه‌هایی متعامد برای تنیدن فضای محاسبه را ارائه می‌دهد.

منبع

ژانویه 7, 2020/1 دیدگاه/توسط daliri

تشخیص خودکار پلاک وسیله نقلیه

آموزش عمومی پردازش تصویر و بینایی ماشین, تشخيص پلاک خودرو

تشخیص خودکار پلاک خودرو سامانه‌ای برای خواندن پلاک وسیله نقلیه با استفاده از نویسه‌خوان نوری است. شماره پلاک خودرو یکی از مناسب‌ترین اقلام اطلاعاتی جهت احراز هویت خودروها می‌باشد. تشخیص خودکار شماره پلاک خودرو سامانه‌ای کاملاً مکانیزه است که با استفاده ازپردازش تصویر خودروهای عبوری از یک مکان، شماره پلاک آنها را استخراج می‌کند. برای استفاده از این سامانه، نیازی به نصب و تجهیز خودروها به وسیلهٔ دیگری (مانند GPS یا برچسب‌های رادیویی- RFID Tag) وجود ندارد. این سامانه با استفاده از دوربین‌های مخصوص، تصویری از خودرو در حال عبور اخذ می‌کند و آن تصویر را جهت پردازش توسط نرم‌افزار تشخیص پلاک خودرو به رایانه ارسال می‌کند. از این سامانه می‌توان در زمینه‌های امنیتی و ترافیکی بسیار بهره گرفت.

دوربین نصب شده تشخیص پلاک خودرو دوربین سامانهٔ تشخیص پلاک خودرو

امکانات سیستم های تشخیص پلاک خودرو به روش پردازش تصویر

امکان تشخیص تمامی اعداد و حروف پلاک و شناسایی منطقه پلاک صادرشده امکان تشخیص تمامی پلاکهای موجود در کشور امکان دریافت عکس از دوربین های رنگی و سیاه و سفید و IR تحت شبکه تشخیص محل پلاک در عکس امکان تشخیص چندین پلاک در یک عکس امکان ارتباط با بانک اطلاعاتی سیستم پارکینگ جهت کنترل تردد خودروهای تعریف شده امکان ارسال اطلاعات خودروهای ممنوعه در بانک اطلاعاتی سیستم از طریق شبکه، GPRS ، SMS و MMS

اطلاعات فنی سیستم تشخیص پلاک خودرو

امکان تشخیص پلاک از فیلم زنده در دوربین های تحت شبکه و DVR سرعت بسیار بالا در تشخیص پلاک (کمتر از 200 میلی ثانیه) دقت بالا و امکان تشخیص چندین پلاک در یک عکس

کاربردهای سامانهٔ تشخیص پلاک

کنترل و اخذ عوارض ورود به محدوده طرح ترافیک

امروزه شهرهای بسیاری ورود خودروها به منطقه مرکزی شهر را به منظور کنترل ترافیکِ آن محدود ساخته‌اند. از آنجا که استفاده از روش‌های سنتی (قرار دادن نیروهای پلیس در تمامی مبادی محدوده) هم پر هزینه و هم کم دقت است، راه حل‌های جدیدی برای کنترل و اخذ عوارض ورود به محدوده پرتردد شهرها^∗ پیشنهاد شده است. یکی از این راه حل‌ها (که برای مثال در استکهلم^[۳] و لندن^[۴] استفاده می‌شود) استفاده از فناوری تشخیص پلاک خودرو است. در این راه حل، دوربین‌های تشخیص پلاک خودرو در تمامی مبادی طرح نصب می‌شوند و ورود هر خودرو به محدوده طرح ثبت می‌شود. سپس مانند روش اخذ عوارض، فرصتی به راننده داده می‌شود تا عوارض ورود به طرح را تا زمان مقرر پرداخت کند. در غیر اینصورت، راننده طبق قانون جریمه خواهد شد.

اخذ عوارض جاده‌ها و بزرگراه‌ها به صورت خودکار

از آنجا که وجود مانع بر سر راه خودروها در عوارضی‌ها باعث کند شدن حرکت، ایجاد ترافیک، و به تبع آن آلودگی محیط زیست می‌شود، راه‌های مختلفی برای حذف موانعِ موجود در عوارضی‌ها پیشنهاد شده است. یکی از این راه‌ها استفاده از سامانهٔ تشخیص پلاک خودرو می‌باشد. در این راه حل، خودروها بدون نیاز به توقف از عوارضی‌ها عبور می‌کنند و سامانهٔ تشخیص پلاک خودرو شماره پلاک آنها را ثبت می‌کند. بر اساس شماره پلاک، عوارض مربوطه محاسبه می‌شود و راننده ملزم به پرداخت عوارض در زمان مشخصی خواهد بود. در صورت عدم پرداخت عوارض در زمان مقرر، خودرو طبق قانون جریمه خواهد شد. به این روش عوارض ویدئویی (به انگلیسی: Video Tolling) گفته می‌شود.

محاسبه مدت سفر

تخمین مدتِ زمان سفر یکی از کاربردهای مهم سیستم‌های ترافیک هوشمند می‌باشد. در این کاربرد، مسافران می‌توانند پیش از سفر به آمارها و اطلاعات مربوطه مراجعه کنند و تخمینی از مدتِ زمان سفر میان مبدا و مقصد خود داشته باشند. سامانه تشخیص پلاک خودرو یکی از راه حل‌های مناسب جهت این کاربرد به شمار می‌رود. در این راه حل، سامانهٔ تشخیص پلاک خودرو در نقاط مختلف یک جاده نصب می‌شود (برای مثال در مبدا و مقصد) و بنابراین مدت زمان سفر را به صورت تفکیک شده برای هر خودرو محاسبه می‌کند. با تحلیل آماری این مدت برای تمامی خودروها می‌توان با دقتِ مطلوبی، متوسط و تغییراتِ آن در زمان‌های مختلف روز و هفته را در جاده اندازه گرفت و برای تصمیم‌گیری در اختیار عموم قرار داد.

اندازه‌گیری سرعت متوسط خودروها

علاوه بر روش‌های معمولِ اندازه‌گیری سرعت که در یک نقطهٔ خاص سرعت خودروها را محاسبه می‌کنند، روش‌هایی نیز جهت محاسبه سرعت متوسط خودروها در یک مسیر وجود دارد. جهت اندازه‌گیریِ سرعتِ متوسط نیاز به تشخیص هویت خودروها در ابتدا و انتهای مسیر می‌باشد. تشخیص پلاک خودرو یکی از راه‌های مناسب جهت تشخیص هویت خودروها و به تبعِ آن اندازه‌گیریِ سرعت متوسط آنها می‌باشد. در این راه حل، دوربین‌های تشخیص پلاک در چندین نقطه از مسیر نصب می‌شوند و با ثبتِ زمان تردد خودرو از مقابل هر یک از آنها، امکان محاسبه سرعت متوسط خودرو میان هر دو نقطه متوالی وجود دارد. در این راه حل، حتی اگر رانندگان در مقابل این دوربین‌ها ترمز کنند تأثیر چندانی در سرعت متوسط محاسبه شده در مسیر نخواهند گذاشت و بنابراین تا حدی در مقایسه با روش‌های مبتنی بر سرعتِ نقطه‌ای برتری دارد.

دیده بانی معابر، گلوگاه‌ها و مرزها و گزارش سریع خودروهای سرقتی عبور کرده از آنها
ثبت اطلاعات ترافیکی دقیق و جامع از تردد خودروها در معابر

امکانات جانبی سامانه تشخیص خودکار شماره پلاک خودرو

در سامانه پلاک خوان امکانات جانبی بیشتر بنابر خواست خریدار نصب و به سیستم افزوده خواهد شد. امکاناتی نظیر: سنسور نوری تشخیص مانع، کارت های حافظه دار یا بارکد دو بعدی، دوربین نظارتی، دوربین ثبت چهره راننده، تابلوی نمایشگر، UPS یا باتری پشتیبان

منبع

هم چنین نوشته هایی با عناوین پروژه + آموزش تشخیص پلاک خودرو با پردازش تصویر (پلاک خوان رایگان) و مقاله بررسی سامانه های تشخیص خودکار پلاک خودرو و مقالات داخلی و خارجی در زمینه تشخیص پلاک خودرو جهت دسترسی علاقمندان در سایت قرارداده شده است.

می توانید به منظور آشنایی با یکی از دقیقترین و سریعترین سامانه های جامع کنترل تردد خودرو (پلاک خوان) به لینک :سامانه جامع کنترل تردد خودرو بهسان(پلاک خوان) مراجعه فرمایید.

ژانویه 6, 2020/0 دیدگاه /توسط daliri

خوشه بندی k میانگین (k-means Clustering) قسمت 1

آموزش عمومی پردازش تصویر و بینایی ماشین

از مهم‌ترین تکنیک‌های عملی داده‌کاوی که کاربرد زیادی در علوم مختلف دارد، می توان به «خوشه بندی k-میانگین» (K-means Clustering) اشاره کرد، که با توجه به بار محاسباتی زیاد آن، استفاده از کامپیوتر در انجام این فرآیند، کمک شایانی به کاربران می‌کند. در این راستا زبان برنامه‌نویسی و محاسباتی R قابلیت انجام این گونه محاسبات را دارد و به محققین در تحلیل خوشه‌بندی تفکیکی بر مبنای روش K-میانگین، کمک شایانی می‌کند. در این متن به بررسی روش خوشه‌بندی با استفاده از دستورات مربوط به این زبان برنامه‌نویسی می‌پردازیم و با البته با مفاهیم اولیه خوشه‌بندی k-میانگین نیز آشنا می‌شویم.

خوشه‌بندی k-میانگین

روش‌‌ها و الگوریتم‌های متعددی برای تبدیل اشیاء به گروه‌های همشکل یا مشابه وجود دارد. الگوریتم k-میانگین یکی از ساده‌ترین و محبوب‌ترین الگوریتم‌هایی است که در «داده‌کاوی» (Data Mining) بخصوص در حوزه «یادگیری نظارت نشده» (Unsupervised Learning) به کار می‌رود.

معمولا در حالت چند متغیره، باید از ویژگی‌های مختلف اشیا به منظور طبقه‌بندی و خوشه‌ کردن آن‌ها استفاده کرد. به این ترتیب با داده‌های چند بعدی سروکار داریم که معمولا به هر بعد از آن، ویژگی یا خصوصیت گفته می‌شود. با توجه به این موضوع، استفاده از توابع فاصله مختلف در این جا مطرح می‌شود. ممکن است بعضی از ویژگی‌های اشیا کمی و بعضی دیگر کیفی باشند. به هر حال آنچه اهمیت دارد روشی برای اندازه‌گیری میزان شباهت یا عدم شباهت بین اشیاء است که باید در روش‌های خوشه‌بندی لحاظ شود.

الگوریتم خوشه‌بندی k-میانگین از گروه روش‌های خوشه‌بندی تفکیکی (Partitioning Clustering) محسوب می‌شود و درجه پیچیدگی محاسباتی آن برابر با $O (n^{d k + 1})$ است، به شرطی که n تعداد اشیاء، d بعد ویژگی‌ها و k تعداد خوشه‌ها باشد. همچنین پیچیدگی زمانی برای این الگوریتم برابر با $O (n k d i)$ است، که البته منظور از i‌ تعداد تکرارهای الگوریتم برای رسیدن به جواب بهینه است.

در خوشه‌بندی k-میانگین از بهینه‌سازی یک تابع هدف (Object Function) استفاده می‌شود. پاسخ‌های حاصل از خوشه‌بندی در این روش، ممکن است به کمک کمینه‌سازی (Minimization) یا بیشینه‌سازی (Maximization) تابع هدف صورت گیرد. به این معنی که اگر ملاک «میزان فاصله» (Distance Measure) بین اشیاء باشد، تابع هدف براساس کمینه‌سازی خواهد بود پاسخ عملیات خوشه‌بندی، پیدا کردن خوشه‌هایی است که فاصله بین اشیاء هر خوشه کمینه باشد. در مقابل، اگر از تابع مشابهت (Dissimilarity Function) برای اندازه‌گیری مشابهت اشیاء استفاده شود، تابع هدف را طوری انتخاب می‌کنند که پاسخ خوشه‌بندی مقدار آن را در هر خوشه بیشینه کند.

معمولا زمانی که هدف کمینه‌سازی باشد، تابع هدف را «تابع هزینه» (Cost Function) نیز می‌نامند.

روش خوشه بندی k-میانگین، توسط «مک‌کوئین» (McQueen) جامعه شناس و ریاضیدان در سال ۱۹۶۵ ابداع و توسط دیگر دانشمندان توسعه و بهینه شد. برای مثال در سال 1957 نسخه‌ دیگری از این الگوریتم به عنوان الگوریتم استاندارد خوشه‌بندی k-میانگین، توسط «لوید» (Lloyd) در آزمایشگاه‌های بل (Bell Labs) برای کدگذاری پالس‌ها ایجاد شد که بعدها در سال 1982 منتشر گردید. این نسخه از الگوریتم خوشه‌بندی، امروزه در بیشتر نرم‌افزارهای رایانه‌ای که عمل خوشه‌بندی k-میانگین را انجام می‌دهند به صورت استاندارد اجرا می‌شود. در سال 1956 «فورجی» (W.Forgy) به طور مستقل همین روش را ارائه کرد و به همین علت گاهی این الگوریتم را با نام لوید-فورجی می‌شناسند. همچنین روش هارتیگان- ونگ (Hartigan-Wong) که در سال ۱۹۷۹ معرفی شد یکی از روش‌هایی است که در تحقیقات و بررسی‌های داده‌کاوی مورد استفاده قرار می‌گیرد. تفاوت در این الگوریتم‌ها در مرحله آغازین و شرط همگرایی الگوریتم‌ها است ولی در بقیه مراحل و محاسبات مانند یکدیگر عمل می‌کنند. به همین علت همگی را الگوریتم‌های خوشه‌بندی k-میانگین می‌نامند.

روش خوشه‌بندی k-میانگین

فرض کنید مشاهدات $(x_{1}, x_{2}, \dots, x_{n})$ که دارای d بعد هستند را باید به k بخش یا خوشه تقسیم کنیم. این بخش‌ها یا خوشه‌ها را با مجموعه‌ای به نام $S = {S_{1}, S_{2}, \dots, S_{k}}$ می‌شناسیم. اعضای خوشه‌ها باید به شکلی از مشاهدات انتخاب شوند که تابع «مجموع مربعات درون خوشه‌ها» (within-cluster sum of squares- WCSS) که در حالت یک بعدی شبیه واریانس است، کمینه شود.

بنابراین، تابع هدف در این الگوریتم به صورت زیر نوشته می‌شود.

در اینجا منظور از $μ_{i}$ میانگین خوشه $S_{i}$ و $| S_{i} |$ تعداد اعضای خوشه iام است. البته می‌توان نشان داد که کمینه کردن این مقدار به معنی بیشینه‌سازی میانگین مربعات فاصله بین نقاط در خوشه‌های مختلف (between-Cluster sum of Squares- BCSS) است زیرا طبق قانون واریانس کل، با کم شدن مقدار WCSS، مقدار BCSS افزایش می‌یابد، زیرا واریانس کل ثابت است.

در ادامه به بررسی روش خوشه بندی k-میانگین به روش لوید-فورجی (استاندارد) و هارتیگان-ونگ می‌پردازیم.

خوشه‌بندی k-میانگین با الگوریتم لوید (Lloyd’s Algorithm)

به عنوان یک الگوریتم استاندارد برای خوشه‌بندی k-میانگین از الگوریتم لوید بخصوص در زمینه علوم کامپیوتر، استفاده می‌شود. ابتدا به علائمی که در این رابطه به کار می‌رود، اشاره می‌کنیم.

: میانگین مقدارهای مربوط به خوشه jام در تکرار iام از الگوریتم را با این نماد نشان می‌دهیم.

: مجموعه اعضای خوشه jام در تکرار iام الگوریتم.

الگوریتم لوید را با توجه به نمادهای بالا می‌توان به دو بخش تفکیک کرد. ۱- بخش مقدار دهی ( $A s s i g n m e n t S t e p$ )، ۲- بخش به روز رسانی (Update Step). حال به بررسی مراحل اجرای این الگوریتم می‌پردازیم. در اینجا فرض بر این است که نقاط مرکزی اولیه یعنی $m_{1}^{(1)}, m_{2}^{(1)}, \dots, m_{k}^{(1)}$ داده شده‌اند.

بخش مقدار دهی: هر مشاهده یا شی را به نزدیکترین خوشه نسبت می‌دهیم. به این معنی که فاصله اقلیدسی هر مشاهده از مراکز، اندازه گرفته شده سپس آن مشاهده عضو خوشه‌ای خواهد شد که کمترین فاصله اقلیدسی را با مرکز آن خوشه دارد. این قانون را به زبان ریاضی به صورت می‌نویسیم.
بخش به روز رسانی: میانگین خوشه‌های جدید محاسبه می‌شود. در این حالت داریم:

توجه داشته باشید که منظور از $|($ تعداد اعضای خوشه iام است. الگوریتم زمانی متوقف می‌شود که مقدار برچسب عضویت مشاهدات تغییری نکند. البته در چنین حالتی هیچ تضمینی برای رسیدن به جواب بهینه (با کمترین مقدار برای تابع هزینه) وجود ندارد. کاملا مشخص است که در رابطه بالا،‌ فاصله اقلیدسی بین هر نقطه و مرکز خوشه ملاک قرار گرفته است. از این جهت از میانگین و فاصله اقلیدسی استفاده شده که مجموع فاصله اقلیدسی نقاط از میانگینشان کمترین مقدار ممکن نسبت به هر نقطه دیگر است.

نکته: ممکن است فاصله اقلیدسی یک مشاهده از دو مرکز یا بیشتر، برابر باشد ولی در این حالت آن شئ فقط به یکی از این خوشه‌ها تعلق خواهد گرفت.

تصویر زیر یک مثال برای همگرایی الگوریتم لوید محسوب می‌شود که مراحل اجرا در آن دیده می‌شود. همانطور که مشخص است الگوریتم با طی ۱۴ مرحله به همگرایی می‌رسد و دیگر میانگین خوشه‌ها تغییری نمی‌یابد. البته ممکن است که این نقاط نتیجه تابع هزینه را بطور کلی (Global) کمینه نکنند زیرا روش k-میانگین بهینه‌سازی محلی (Local Optimization) را به کمک مشتق‌گیری و محاسبه نقاط اکستریمم اجرا می‌کند.

همگرایی الگوریتم k-میانگین

نکته: به نقاط مرکزی هر خوشه مرکز (Centroid) گفته می‌شود. ممکن است این نقطه یکی از مشاهدات یا غیر از آن‌ها باشد. مشخص است که در الگوریتم لوید، k مشاهده به عنوان مرکز خوشه‌ها (Centroids) در مرحله اول انتخاب شده‌اند ولی در مراحل بعدی، مقدار میانگین هر خوشه نقش مرکز را بازی می‌کند.

خوشه‌بندی k-میانگین با الگوریتم هارتیگان-ونگ (Hartigan-Wong)

یکی از روش‌های پیشرفته و البته با هزینه محاسباتی زیاد در خوشه‌بندی k-میانگین، الگوریتم هارتیگان-ونگ است. برای آشنایی با این الگوریتم بهتر است ابتدا در مورد نمادهایی که در ادامه خواهید دید توضیحی ارائه شود.

از این نماد برای نمایش «تابع هزینه» برای خوشه استفاده می‌کنیم. این تابع در خوشه‌بندی k-میانگین برابر است با:

: از آنجایی که هدف از این الگوریتم، تفکیک اشیاء به k گروه مختلف است، گروه‌ها یا خوشه‌ها در مجموعه‌ای با نام S قرار دارند و داریم،

: برای نمایش میانگین خوشهjام از این نماد استفاده می‌شود. بنابراین خواهیم داشت:

این نماد تعداد اعضای خوشه jام را نشان می‌دهد. بطوری که است. البته مشخص است که در اینجا تعداد خوشه‌ها را با k‌ نشان داده‌ایم.

مراحل اجرای الگوریتم

در خوشه‌بندی k-میانگین با الگوریتم هارتیگان می‌توان مراحل اجرا را به سه بخش تقسیم کرد: ۱- بخش مقدار دهی اولیه (Assignment Step( ،- ۲ بخش به روز رسانی (Update Step)، ۳- بخش نهایی (Termination). در ادامه به بررسی این بخش‌ها پرداخته می‌شود.

بخش مقدار دهی اولیه: در الگوریتم هارتیگان-ونگ، ابتدا مشاهدات و یا اشیاء به طور تصادفی به k گروه یا خوشه تقسیم می‌شوند. به این کار مجموعه S با اعضایی به صورت مشخص می‌شود.
بخش به روز رسانی: فرض کنید که مقدارهای n و m از اعداد ۱ تا k انتخاب شده باشد. مشاهده یا شیئ از خوشه nام را در نظر بگیرید که تابع را کمینه سازد، در چنین حالتی مقدار x از خوشه nام به خوشه mام منتقل می‌شود. به این ترتیب شی مورد نظر در قرار گرفته و خواهیم داشت .
بخش نهایی: زمانی که به ازای همه n,m,x مقدار بزرگتر از صفر باشد، الگوریتم خاتمه می‌یابد.

نکته: منظور از نماد محاسبه تابع هزینه در زمانی است که مشاهده x از مجموعه خارج شده باشد. همچنین نماد به معنی محاسبه تابع هزینه در زمانی است که مشاهده x به خوشه اضافه شده باشد.

در تصویر زیر مراحل اجرای الگوریتم هارتیگان به خوبی نمایش داده شده است. هر تصویر بیانگر یک مرحله از اجرای الگوریتم است. نقاط رنگی نمایش داده شده، همان مشاهدات هستند. هر رنگ نیز بیانگر یک خوشه است.

در تصویر اول مشخص است که در بخش اول از الگوریتم به طور تصادفی خوشه‌بندی صورت پذیرفته. ولی در مراحل بعدی خوشه‌ها اصلاح شده و در انتها به نظر می‌رسد که بهترین تفکیک برای مشاهدات رسیده‌ایم.

در تصویر آخر نیز مشخص است که مراکز خوشه‌ها، محاسبه و ثابت شده و دیگر بهینه‌سازی صورت نخواهد گرفت. به این ترتیب پاسخ‌های الگوریتم با طی تکرار ۵ مرحله به همگرایی می‌رسد.

الگوریتم هارتیگان بخش مقدار دهی اولیه

الگوریتم هارتیگان تکرار 1

الگوریتم هارتیگان تکرار 2

الگوریتم هارتیگان تکرار 3

الگوریتم هارتیگان تکرار 4

الگوریتم هارتیگان تکرار 5

اجرای این الگوریتم‌ها با استفاده از دستورات زبان برنامه‌نویسی R

برای استفاده از دستورات و فرمان‌های مربوط به خوشه‌بندی k-میانگین، باید بسته یا Package مربوط به خوشه‌بندی kmeans به اسم stats را در R نصب کرده باشد. البته از آنجایی این بسته بسیار پرکاربرد است،‌ معمولا به طور خودکار فراخوانی شده است. کدهای زیر نشانگر استفاده از الگوریتم خوشه‌بندی توسط روش‌های مختلف آن است.

library(stats)
data=iris[,1:4]
method=c(&quot;Hartigan-Wong&quot;, &quot;Lloyd&quot;,
&quot;MacQueen&quot;)
k=3
kresults1=kmeans(data,k,algorithm = method[1])
kresults2=kmeans(data,k,algorithm=method[2])
kresults3=kmeans(data,k,algorithm=method[3])

kresults1
kresults2
kresults3

با توجه به داده‌های iris که مربوط به اندازه و ابعاد کاسبرگ و گلبرگ سه نوع گل مختلف است، خوشه‌بندی به سه دسته انجام شده است. اطلاعات مربوط به ۱۰ سطر اول این مجموعه داده،‌ به صورت زیر است.

با اجرای کدهای نوشته شده، خوشه‌بندی انجام شده و نتابج تولید می‌شوند. به عنوان مثال می‌توان خروجی را برای kresult1 که انجام خوشه بندی توسط الگوریتم هارتیگان است به صورت زیر مشاهده کرد:

همانطور که دیده می‌شود، در سطر اول تعداد اعضای هر خوشه، نمایش داده شده است. در بخش دوم که با سطر ۱ و ۲ و ۳ مشخص شده،‌ مراکز هر سه خوشه برحسب ویژگی‌های (طول و عرض کاسبرگ و طول و عرض گلبرگ) محاسبه شده و در قسمت Cluster Vector نیز برچسب خوشه هر کدام از مشاهدات دیده می‌شود. در انتها نیز مجموع مربعات فاصله درون خوشه‌ای (مجموع فاصله هر مشاهده از مرکز خوشه) استخراج شده و درصد یا شاخص ارزیابی خوشه‌بندی بر اساس نسبت مربعات بین خوشه‌ها به مربعات کل دیده می‌شود. این مقدار برای این حالت برابر ۸۸.۴٪ است که نشان می‌دهد بیشتر پراکندگی (total_ss) توسط پراکندگی بین خوشه‌ها (between_ss) بیان شده است. پس به نظر خوشه‌بندی مناسب خواهد بود. پس اختلاف بین گروه‌ها ناشی از خوشه‌های است که مشاهدات را به دسته‌‌های جداگانه تفکیک کرده.

همچنین در کدها مشخص است که تعداد خوشه‌های در متغیر k ثبت و به کار رفته است. در شکل دیگری از دستور kmeans می‌توان به جای معرفی تعداد خوشه‌ها از مراکز دلخواه که با تعداد خوشه‌ها مطابقت دارد، استفاده کرد. برای مثال اگر برنامه به صورت زیر نوشته شود، الگوریتم ابتدا نقاط معرفی شده را به عنوان نقاط مرکزی (Centroids) به کار گرفته و سپس مراحل بهینه سازی را دنبال می‌کند. از آنجا که سه نقطه مبنا قرار گرفته، الگوریتم متوجه می‌شود که باید مشاهدات به سه خوشه تفکیک شود.

library(stats)
data=iris[,1:4]
method=c(&quot;Hartigan-Wong&quot;, &quot;Lloyd&quot;,
         &quot;MacQueen&quot;)
c1=c(6,4,5,3)
c2=c(5,3,1,0)
c3=c(6,2,4,2)
centers=rbind(c1,c2,c3)
kresults1=kmeans(x = data,centers = centers,algorithm = method[1])
kresults2=kmeans(x = data,centers = centers,algorithm=method[2])
kresults3=kmeans(x = data,centers = centers,algorithm=method[3])

kresults1
kresults2
kresults3

در تصویر زیر نتیجه خوشه بندی k-میانگین را برای داده‌های iris توسط یک نمودار مشاهده می‌کنید. البته باید توجه داشت که این نمودار دو بعدی است در حالیکه داده‌ها، دارای چهار ویژگی هستند. به کمک روش‌های آماری مانند تجزیه به مولفه‌های اصلی (PCA) ابعاد مسئله کاهش یافته تا در سه بعد روی نمودار نمایش داده شود. سمت راست تصویر گروه‌های واقعی و سمت چپ نتیجه خوشه‌بندی دیده می‌شود. نقاطی که در خوشه‌ها به درستی تشخیص داده نشده‌اند، باعث افزایش خطای خوشه‌بندی خواهند شد.

کاربردها

از الگوریتم خوشه‌بندی k-میانگین در «بخش‌بندی بازار کسب و کار» (market Segmentation)، «دسته‌بندی مشتریان» (Customer Segmentation)، «بینایی رایانه‌ای» (Computer Vision) و «زمین‌آمار (Geostatistics) استفاده می شود. برای مثال در تشخیص تعداد رنگ و یا فشرده سازی تصاویر برحسب رنگ‌ها می‌توان از این الگوریتم‌ها استفاده کرد.

در تصویر بالا گل رز زرد رنگی دیده می‌شود که در یک محیط سبز قرار گرفته است. با استفاده از الگوریتم‌های خوشه‌بندی می‌توان تعداد رنگ‌ها را کاهش داده و از حجم تصاویر کاست. در تصویر زیر دسته بندی رنگ‌های گل رز دیده می‌شود.

در این تصویر، هر طیف رنگ براساس میزان رنگ قرمز و سبز، بوسیله «سلول‌های ورونوی» (Voronoi Cell) تقسیم‌بندی شده است. این تقسیم‌بندی می‌تواند توسط الگوریتم‌ها خوشه‌بندی k-میانگین صورت گرفته باشد. در کل تصویر نیز، طیف رنگ‌های مختلف برای تصویر گل رز در یک «نمودار ورونوی» (Voronoi diagram) نمایش داده شده است که خوشه‌ها را بیان می‌کند.

خوشه بندی k میانگین (k-means Clustering) قسمت 1
خوشه بندی k میانگین (k-means Clustering) قسمت 2

دسامبر 30, 2019/0 دیدگاه /توسط daliri

بایگانی برچسب برای: dv

ویژگی‌های جدید در سی شارپ ۳٫۰

معرفی لینک

مقدار دهی به اشیاء

مقدار دهی Collection

انواع داده‌ای بی نام

نتیجه نوع متغیر محلی

عبارات لامبدا

خواص خودکار

توابع بسط داده شده

توابع جزئی

آرایه‌های نوع ضمنی

پیش پردازنده

توضیحات کد

سامانه مستندسازی XML

(CLR(Common Language Runtime

برخی ویژگی‌های MSIL

7 تکنیک هیبریداسیون

سیستم توصیه گر شخصیت محور:

فراتر از دقت

سیستم توصیه گر سیار

سیستم توصیه گر آگاه از ریسک

تعریف ریسک

جایزه نت فلیکس

سنجش عملکرد

سیستم توصیه گر چند معیاره

انواع سامانه‌های توصیه‌گر

سیستم توصیه گر (Recommender Systems) چیست ؟

بررسی اجمالی

رهیافت ها

پالایش محتوا محور

سیستم توصیه گر هیبرید

لینکدین چیست؟

کاربردهای بینایی ماشین در صنعت

اجزای سیستم بینایی ماشین جهت پیاده سازی کنترل کیفیت هوشمند

تاریخچه

آشنایی

کاربردها

موجک

تبدیل‌های موجک

موجک‌ها و معادلات اتساع موجک‌ها بر مبنای دو عمل اصلی قرار دارند:

مقایسه با تبدیل فوریه

تاریخچه

موجک‌های متعامد

موجک هار

امکانات سیستم های تشخیص پلاک خودرو به روش پردازش تصویر

اطلاعات فنی سیستم تشخیص پلاک خودرو

کاربردهای سامانهٔ تشخیص پلاک

کنترل و اخذ عوارض ورود به محدوده طرح ترافیک

اخذ عوارض جاده‌ها و بزرگراه‌ها به صورت خودکار

محاسبه مدت سفر

اندازه‌گیری سرعت متوسط خودروها

امکانات جانبی سامانه تشخیص خودکار شماره پلاک خودرو

خوشه‌بندی k-میانگین

روش خوشه‌بندی k-میانگین

خوشه‌بندی k-میانگین با الگوریتم لوید (Lloyd’s Algorithm)

خوشه‌بندی k-میانگین با الگوریتم هارتیگان-ونگ (Hartigan-Wong)

مراحل اجرای الگوریتم

اجرای این الگوریتم‌ها با استفاده از دستورات زبان برنامه‌نویسی R

کاربردها

تلفن های تماس:

ساعات کاری

پیوند ها :

محصولات :

موجک‌ها و معادلات اتساع
موجک‌ها بر مبنای دو عمل اصلی قرار دارند: