دسترسی سریعدسترسی سریع
  • ۰۳۱-۹۱۰۰۱۸۸۱
  • درخواست دمو
بهسان اندیش
  • صفحه اصلی
  • محصولات
    • نرم افزار پلاک خوان
      • نرم افزار ثبت تردد جاده ای
      • نرم افزار مدیریت پارکینگ
      • نرم افزار تعمیرگاه ، کارواش و تعویض روغن
    • نرم افزار باسکول
    • راهکارهای سازمانی
      • نرم افزار انبار و حسابداری
    • محصولات جانبی
      • دوربین پلاک خوان
      • ماژول رله کنترل راهبند
  • نمونه کار ها
    • سامانه جامع پلاکخوان خودرو
    • سامانه جامع مدیریت باسکول
    • سامانه قرائت فرم های چند گزینه ای
  • وبلاگ
  • ارتباط با ما
    • تماس با ما
    • درباره ما
    • دعوت به همکاری
  • جستجو
  • منو

نوشته‌ها

بازشناسایی کاراکتر نوری OCR چیست؟

تشخیص نوری کاراکتر و تشخیص دست خط

OCR چیست

OCR سرنام اصطلاحی است كه صورت كامل آن در واژه‌نامه انگلیسی Optical Character Recognition و به معنی بازشناسایی كاراكتر نوری است.
فرض كنید كه ما متنی را روی كاغذ داریم و می‌خواهیم آن را وارد رایانه كنیم. اولین روشی كه به ذهن می‌رسد این است كه متن را به تایپیست بدهیم تا با كامپیوتر تایپ كند. اما آیا می‌شود عین همان متن را وارد رایانه بكنیم تا نیازی به تایپ نباشد؟ البته دستگاه «اسكنر» می‌تواند تصویری از آن متن را وارد رایانه كند، تا اینجا بخشی از مشكل ما حل شده است. اما رایانه كه نه عقلی دارد و نه «زبان» می‌فهمد، نمی‌تواند حروف و كلمات را از هم تشخیص دهد. مثلاً اگر از كامپیوتر بخواهیم به ما بگوید كه در متن اسكن‌شده كلمة «علی» چند بار آمده است، بی‌آنكه شرمنده شود، می‌گوید: «error»، یعنی: «نمی‌توانم تشخیص بدهم!» در واقع این «تصویر دیجیتال‌شده» باید به «تصویر قابل پردازش» تبدیل شود. موضوع اصلی OCR همین است.

فرض كنید كه مثلاً می‌خواهیم متن مقالات روزنامه اطلاعات سال ۱۳۴۰ شمسی را (كه اكنون نه تنها فایل تایپی‌اش موجود نیست ــ چون آن زمان اصلاً تایپ كامپیوتری در كار نبود! ــ بلكه خود نسخه‌های روزنامه را هم به زحمت می‌توان پیدا كرد) تایپ دیجیتالی كنیم، و این متن‌ها را داخل بسته‌های نرم‌افزاری یا اینترنت قرار دهیم. اگر هر شماره از روزنامه را ۲۴ صفحه فرض كنیم، و هر تایپیست بتواند در هر روز حداكثر یك صفحه از آن صفحات كاهی و كهنه شدة قدیمی را دوباره تایپ كند، مجموعاً ۲۴ روز لازم است تا تنها مقالات یك شماره از روزنامه تایپ شود. بنابراین در عرض یك سال یك نفر می‌تواند تنها ۱۵ شماره از روزنامه را تایپ كند.

حال اگر نرم‌افزاری باشد كه بتواند با اسكن كردن هر صفحة روزنامه، به طور خودكار مقالات آن را تایپ كند، تحولی عظیم رخ می‌دهد، یعنی مطالب و مقالات هزاران شماره از روزنامه‌های قدیمی به سرعت وارد فایل‌های رایانه‌ای می‌شود. حال این امكان را تعمیم بدهید به هزاران كتاب و دست نویس‌های قدیمی یا جدید، كه هر كس بخواهد تنها یك صفحه از آنها را تایپ كند، باید كلی وقت صرف كند. می‌بینید كه نرم‌افزار OCR به راستی می‌تواند هزاران هزار روز در وقت ما صرفه‌جویی كند، و البته هزینه‌ها را هم كاهش دهد. البته فقط یك مشكل كوچك به وجود می‌آید و آن بیكار شدن تایپیست‌هاست! قبل از اینکه وارد مبحث  «OCR» شویم، لازم است اشاره مختصری به حوزه های بازشناسی الگو داشته باشیم .

 ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮ 

ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮ ﺷﺎﺧﻪ ای اﺯ ﻫﻮﺵ ﻣﺼﻨﻮﻋﻲ است كه با ﻃﺒﻘﻪ بندی (ﻛﻼﺳﻪ ﺑﻨﺪﻱ) ﻭ ﺗﻮﺻﻴﻒ ﻣﺸﺎﻫﺪﺍﺕ ﺳﺮﻭﻛﺎﺭ ﺩﺍﺭﺩ.  ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮ ﺑﻪ ﻣﺎ ﻛﻤﻚ ﻣﻲ ﻛﻨﺪ ﺗﺎ ﺩﺍﺩﻩ ها ( ﺍﻟﮕﻮﻫﺎ ) ﺭﺍ ﺑﺎ ﺗﻜﻴﻪ ﺑﺮ ﺩﺍﻧﺶ ﻗﺒﻠﻲ ﻳﺎ اطلاعات ﺁﻣﺎﺭﻱ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﺍﺯ ﺍﻟﮕﻮﻫﺎ، ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﻧﻤﺎﻳﻴﻢ. ﺍﻟﮕﻮﻫﺎﻳﻲ ﻛﻪ ﻣﻲ ﺑﺎﻳﺴﺖ ﻛﻼﺳﻪ ﺑﻨﺪﻱ شوند،  ﻣﻌﻤﻮﻻً گروهی ﺍﺯ ﺳﻨﺠﺸﻬﺎ ﻳﺎ ﻣﺸﺎﻫﺪﺍﺕ ﻫﺴﺘﻨﺪ ﻛﻪ ﻣﺠﻤﻮﻋﻪ ﻧﻘﺎﻃﻲ ﺭﺍ ﺩﺭ ﻳﻚ ﻓﻀﺎﻱ ﭼﻨﺪ ﺑﻌﺪﻱ ﻣﻨﺎﺳﺐ ﺗﻌﺮﻳﻒ ﻣﻲ ﻧﻤﺎﻳﻨﺪ.

ﻳﻚ ﺳﻴﺴﺘﻢ ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮﻱ ﻛﺎﻣﻞ ﻣﺘﺸﻜﻞ ﺍﺳﺖ ﺍﺯ ﻳﻚ ﺣﺴﮕﺮ ﻛﻪ ﻣﺸﺎﻫﺪﺍﺗﻲ ﺭﺍ ﻛﻪ ﻣﻲبایست ﺗﻮﺻﻴﻒ ﻳﺎ ﻛﻼﺳﻪ بندی گردند جمع آوری می نماید، ﻳﻚ ﻣﻜﺎﻧﻴﺰﻡ ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻴﻬﺎ كه اطلاعات عددی ﻳﺎ ﻧﻤﺎﺩﻳﻦ ( ﺳﻤﺒﻮﻟﻴﻚ ) ﺭﺍ ﺍﺯ ﻣﺸﺎﻫﺪﺍﺕ ﻣﺤﺎﺳﺒﻪ می كند و  ﻳﻚ ﻧﻈﺎﻡ ﻛﻼﺳﻪ بندی یا ﺗﻮﺻﻴﻒ ﺍﻟﮕﻮﻫﺎ ﺭﺍ ﺑﺎ ﺗﻜﻴﻪ ﺑﺮ ﻭﻳﮋﮔﻴﻬﺎﻱ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﻋﻬﺪﻩ دار است. شكل زیر ﺑﻠﻮﻙ ﺩﻳﺎﮔﺮﺍﻡ ﻳﻚ ﺳﻴﺴﺘﻢ ﺷﻨﺎﺳﺎﻳﻲ ﺍﻟﮕﻮ ﺭﺍ ﻧﺸﺎﻥ می دهد همانطور كه از ﭘﻴﻜﺎﻧﻬﺎﻱ ﺑﺮﮔﺸﺘﻲ ﻣﺸﺨﺺ ﺍﺳﺖ، ﺍﻳﻦ ﺑﻠﻮﻛﻬﺎ ﻟﺰﻭﻣﺎً ﻣﺴﺘﻘﻞ ﻧﻴﺴﺘﻨﺪ ﻭ ﺑﺴﺘﻪ ﺑﻪ ﻧﺘﺎﻳﺞ ﺣﺎﺻﻠﻪ ﻣﻤﻜﻦ ﺍﺳﺖ ﻻﺯﻡ ﺑﺎﺷﺪ ﻛﻪ ﺑﻠﻮكﻫﺎﻱ ﺍﻭﻟﻴﻪ ﻣﺠﺪﺩﺍً ﻃﺮﺍﺣﻲ ﮔﺮﺩﻧﺪ ﺗﺎ ﺭﺍﻧﺪﻣﺎﻥ ﻛﻠﻲ ﺳﻴﺴﺘﻢ ﺑﻬﺒﻮﺩ ﻳﺎﺑﺪ.
ﺑﺎﺯﺷﻨﺎﺳﻲ ﺍﻟﮕﻮ ﺩﺭ ﺑﺴﻴﺎﺭﻱ ﺍﺯ ﺯﻣﻴﻨﻪها ﻧﻘﺶ ﻛﺎﺭبردی دارد. ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ، ﺑﺎﺯﺷﻨﺎﺳﻲ  ﻧﻮﻳﺴﻨﺪﻩ ﺗﺼﺪﻳﻖ ﺍﻣﻀﺎﺀ ، ﻃﺒﻘﻪ ﺑﻨﺪﻱ ﺍﺛﺮ ﺍﻧﮕﺸﺖ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﮔﻔﺘﺎﺭ ﻧﻤﻮﻧﻪ ﻫﺎﻳﻲ ﺍﺯ ﺍﻳﻦ ﻛﺎﺭﺑﺮﺩﻫﺎ ﻫﺴﺘﻨﺪ.

 ﺑﺎﺯﺷﻨﺎﺳﻲ ﻧﻮﺭﻱ ﺣﺮﻭﻑ OCR

ﺩﺭ ﭼﻨﺪ ﺩﻫﺔ ﮔﺬﺷﺘﻪ مسئله ﺑﺎﺯﺷﻨﺎﺳﻲ ﺍﻟﮕﻮﻫﺎﻱ ﻧﻮﺷﺘﺎﺭﻱ ﺷﺎﻣﻞ ﺣﺮﻭﻑ، ﺍﺭﻗﺎﻡ ﻭ ﺳﺎﻳﺮ ﻧﻤﺎﺩﻫﺎﻱ ﻣﺘﺪﺍﻭﻝ ﺩﺭ ﺍﺳﻨﺎﺩ ﻣﻜﺘﻮﺏ ﺷﺪﻩ ﺑﻪ ﺯﺑﺎﻧﻬﺎﻱ ﻣﺨﺘﻠﻒ، ﺗﻮﺳﻂ ﮔﺮﻭﻫﻬﺎﻱ ﻣﺨﺘﻠﻔﻲ ﺍﺯ ﻣﺤﻘﻘﻴﻦ ﻣﻮﺭﺩ ﻣﻄﺎلعه و ﺑﺮﺭﺳﻲ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻪ ﺍﺳﺖ ﻧﺘﻴﺠه ﺍﻳﻦ ﺗﺤﻘﻴﻘﺎﺕ ﻣﻨﺠﺮ ﺑﻪ ﭘﻴﺪﺍﻳﺶ ﻣﺠﻤﻮﻋﻪ ﺍﻱ ﺍﺯ ﺭﻭﺷﻬﺎﻱ ﺳﺮﻳﻊ ﻭ ﺗﺎ ﺣﺪ ﺯﻳﺎﺩﻱ ﻣﻄﻤﺌﻦ ﻣﻮﺳﻮﻡ ﺑﻪ OCR یا « ﺑﺎﺯﺷﻨﺎﺳﻲ ﻧﻮﺭﻱ ﺣﺮﻭﻑ » ﺑﻤﻨﻈﻮﺭ ﻭﺍﺭﺩ ﻧﻤﻮﺩﻥ اطلاعات ﻣﻮﺟﻮﺩ ﺩﺭ  ﺍﺳﻨﺎﺩ، ﻣﺪﺍﺭﻙ، ﻛﺘﺎﺑﻬﺎ ﻭ ﺳﺎﻳﺮ ﻣﻜﺘﻮﺑﺎﺕ ﭼﺎﭘﻲ ﻳﺎ ﺗﺎﻳﭗ ﺷﺪﻩ ﻭ ﺣﺘﻲ ﺩﺳﺘﻨﻮﻳﺲ ﺑﻪ ﺩﺍﺧﻞ ﻛﺎﻣﭙﻴﻮﺗﺮ ﺷﺪﻩ ﺍﺳﺖ  ﻫﻨﮕﺎﻣﻲ ﻛﻪ ﻳﻚ ﺳﻨﺪ ﻣﺘﻨﻲ ﺍﺳﻜﻦ ﻣﻲ ﺷﻮﺩ، ﻛﺎﻣﭙﻴﻮﺗﺮ ﺍﻳﻦ ﻣﺘﻦ ﺭﺍ ﺑﺼﻮﺭﺕ ﻳﻚ ﺗﺼﻮﻳﺮ ﮔﺮﺍﻓﻴﻜﻲ ﺗﺸﺨﻴﺺ ﻣﻲ ﺩﻫﺪ ﺩﺭ ﻧﺘﻴﺠﻪ ﻛﺎﺭﺑﺮﺍﻥ ﻗﺎﺩﺭ ﻧﺨﻮﺍﻫﻨﺪ ﺑﻮﺩ ﻛﻪ ﻣﺘﻦ ﻣﻮﺟﻮﺩ ﺩﺭ ﺗﺼﻮﻳﺮ ﺳﻨﺪ ﺭﺍ ﻭﻳﺮﺍﻳﺶ ﻧﻤﺎﻳﻨﺪ ﻭ ﻳﺎ ﺁﻥ ﺭﺍ ﻣﻮﺭﺩ ﺟﺴﺘﺠﻮ ﻗﺮﺍﺭ ﺩﻫﻨﺪ.   ﻳﻚ ﻧﺮﻡ ﺍﻓﺰﺍﺭ OCR ﺍﻳﻦ ﻣﺘﻦ ﺍﺳﻜﻦ ﺷﺪﻩ ﺭا ﺧﻮﺍﻧﺪﻩ و ﻣﺤﺘﻮﻳﺎﺕ ﺁﻧﺮﺍ  ﺷﻨﺎﺳﺎﻳﻲ ﻧﻤﻮﺩﻩ ﻭ ﺑﺼﻮﺭﺕ ﻳﻚ ﻓﺎﻳﻞ ﺩﺭ ﻛﺎﻣﭙﻴﻮﺗﺮ ﺫﺧﻴﺮﻩ ﻣﻲ ﺳﺎﺯﺩ.

مزیت های سیستم های OCR

استفاده از سیستم های  OCR دو مزیت عمده دارد:
الف) افزایش چشمگیر سرعت دسترسی به اطلاعات؛ زیرا در متن برخلاف تصویر، امکان جستجو و ویرایش وجود دارد.
ب) کاهش فضای ذخیره سازی؛ زیرا حجم فایل متنی استخراج شده از یک تصویر، معمولا بسیار کمتر از حجم خود فایل تصویری است.

ﭼﻨﻴﻦ ﻗﺎﺑﻠﻴﺘﻲ ﺍﻣﻜﺎﻥ ﺍﺳﺘﻔﺎﺩه ﮔﺴﺘﺮﺩﻩ ﺍﺯ ﻛﺎﻣﭙﻴﻮﺗﺮ ﺭﺍ ﺩﺭ ﭘﺮﺩﺍﺯﺵ ﺳﺮﻳﻊ ﺣﺠﻢ ﻭﺳﻴﻌﻲ ﺍﺯ ﺩﺍﺩﻩ ﻫﺎی ﻣﻜﺘﻮﺏ ﺗﻮﻟﻴﺪ ﺷﺪﻩ ﺗﻮﺳﻂ ﺍﺩﺍﺭه ﭘﺴﺖ ﻭ ﺷﺮﻛﺘﻬﺎ ﻭ ﻣﺆﺳﺴﺎﺕ ﻣﺨﺘﻠﻒ ﻧﻈﻴﺮ ﺑﺎﻧﻜﻬﺎ، ﺷﺮﻛﺘﻬﺎی ﺑﻴﻤﻪ و ﻣﺆﺳﺴﺎﺕ ﺧﺪﻣﺎﺕ ﻋﻤﻮﻣﻲ و ﺳﺎﻳﺮ ﻧﻬﺎﺩﻫﺎﻳﻲ ﻛﻪ ﺳﺎﻟﻴﺎﻧﻪ ﺑﺎ ﻣﻴﻠﻴﻮﻧﻬﺎ ﻣﻮﺭﺩ ﭘﺮﺩﺍﺧﺖ، ﺩﺭﻳﺎﻓﺖ ﻭ ﺣﺴﺎﺑﺮﺳﻲ ﺍﻣﻮﺭ ﻣﺸﺘﺮﻳﺎﻥ ﺧﻮﺩ ﻣﻮﺍﺟﻬﻨﺪ، ﻓﺮﺍﻫﻢ ﻣﻲ ﺁﻭﺭﺩ .

منبع

۲۲ شهریور ۱۳۹۸/0 نظرها/توسط م. دلیری
http://behsanandish.com/wp-content/uploads/OCR-Feature.png 1024 1024 م. دلیری https://behsanandish.com/wp-content/uploads/logo-farsi-englisi-300x195-1.png م. دلیری2019-09-13 14:45:112019-09-08 12:52:13بازشناسایی کاراکتر نوری OCR چیست؟

ماشین بینایی چیست؟

بینایی ماشین (Machine Vision) و بینایی کامپیوتر

آشنایی با ماشین بینایی 

استفاده از حس گرها برای دریافت سیگنال هایی که تشکیل دهنده تصویر یک شی هستند که توسط کامپیوتر و یا سایر وسایل پردازش سیگنال برای تفسیر و تحلیل سیگنال‌های دریافت شده از قطعه مورد استفاده قرار می گیرد. ماشین بینایی به عنوان یک ابزار مهندسی در ابزارهای دیجیتال و در شبکه‌های کامپیوتری، برای کنترل ابزارهای صنعتی دیگر از قبیل کنترل بازوهای روبات و یا خارج کردن تجهیزات معیوب به کار می رود.

در حقیقت ماشین بینایی شاخه ای از علم مهندسی است که به رشته‌های علوم کامپیوتری (Computer science) و علم نورشناسی و مهندسی مکانیک و اتوماسیون صنعتی ارتباط دارد. یکی از مهمترین پر استفاده‌ترین کاربردهای آن در بازبینی و بررسی کالاهای صنعتی از جمله نیمه هادیها، اتومبیل ها، مواد خوراکی و دارو می باشد. همانند نیروی انسانی که با چشم غیر مسلح در خط تولید کالاها را برای تعیین کیفیت و نوع ساخت آنها بازبینی می کنند، ماشین بینایی از دوربین‌های دیجیتال و دوربین‌های هوشمند و نرم‌افزارهای image processing (پردازش تصویر) برای این کار استفاده می کند.

دستگاههای مربوطه (ماشین بینایی) برای انجام دادن وظایفی خاص از جمله شمردن اشیاء در بالابرها، خواندن شماره سریالها (Serial numbers)، جستجوی سطح‌های معیوب به کار می روند. در حال حاضر صنعت استفاده زیادی از سیستم ماشین بینایی برای بازبینی تصویری اشیاء (Visual inspection) که نیاز به سرعت بالا و دقت بالا و کار ۲۴ ساعته و تکرار محابات بالا دارد، وجود دارد.

اگرچه انسان عملکرد بهتر و قابلیت تطبیق دهی بیبشتری برای خطاهای تازه در زمان کوتاه دارد ولی با توجه به ویژگی‌های ذکر شده این دستگاهها به مرور جای نیروی انسانی را که به دلیل انحراف و شرایط بد دارای خطا می باشند، در صنعت پر می کند. کامپیوترها به همان صورتی که انسان می بیند نمی توانند ببینند. دوربین‌ها همانند سیستم بینایی انسان نیستند و در حالی که انسان می تواند بر استنباط و فرضیات اتکا کند، تجهیزات کامپیوتری باید به وسیله آزمودن و تجزیه و تحلیل کردن جداگانه پیکسل‌ها و تلاش کردن برای انجام نتیجه گیری با توجه به پشتوانه اطلاعاتی و روش هایی مانند شناسایی الگو مشاهده کنند.

علی رغم اینکه بعضی الگوریتم‌های ماشین بینایی برای تقلید کردن از سیستم بینایی انسان توسعه یافته اند، تعداد معدودی روش برای تحلیل و شناسایی ویژگیهای مرتبط تصاویر به صورت مؤثر و ثابت توسعه یافته اند. سیستم‌های Machine vision و computer vision قادر هستند به صورت ثابت تصاویر را تجزیه و تحلیل کنند، ولی image processing بر پایهٔ کامپیوتر به صورت کلی برای انجام کارهای تکراری طراحی می شوند و علی رغم پیشرفت‌های صورت گرفته در این زمینه، هیچ سیستم machine vision و computer vision قادر نیست با برخی از ویژگی‌های سیستم بینایی انسان در قالب درک تصویر، تلرانس به تغییرات نور، تضعیف قدرت تصویر و تغییرات اجزا و… تطبیق پیدا کند.

اجزای یک ماشین بینایی

اگرچه ماشین بینایی بیشتر به عنوان یک پروسهٔ به کار بستنٍ “Machine vision” در کاربردهای صنعتی شناخته شده است، برای لیست کردن اجزای سخت‌افزاری و نرم‌افزاری به کار برده شده نیز مفید می باشد. معمولاً یک ماشین بینایی از اجزای زیر ساخته میشود :

۱٫ یک و یا چند دوربین دیجیتال یا آنالوگ ( سیاه-سفید یا رنگی ) با اپتیک مناسب برای گرفتن عکس.
۲٫ واسطه ای که عکس‌ها را برای پردازش آماده می سازد. برای دوربین‌های آنالوگ این واسطه شامل یک دیجیتال کننده عکس است. هنگامی که این واسطه یک سخت‌افزارٍ جدا باشد، به آن Frame grabber ( کارتی که برای دریافت سیگنال تصویری و فرستادن آن به کامپیوتر استفاده می شود)می گویند.
۳٫ یک پردازشگر ( گاهی یک PC یا پردازنده تعبیه شده ( Embedded Processor ) مانند DSP
۴٫ نرم‌افزار ماشین بینایی : این نرم‌افزار امکاناتی برای توسعه یک برنامه نرم‌افزاری که برای کاربردی مشخص است را فراهم می کند.
۵٫ سخت‌افزار ورودی / خروجی ( مثلا I/O دیجیتال ) یا حلقه‌های ارتباطی ( مثلا ارتباط شبکه ای یا RS-232 ) برای گزارش نتایج.
۶٫ یک دوربین هوشمند : یک وسیله ساده که همه موارد فوق را داراست.
۷٫ لنزهایی که بتواند به مقدار مطلوبی روی سنسور تصویر زوم کند.
۸٫ منابع نوری مناسب و گاهی خیلی مخصوص ( مثلا چراغهای LED، فلورسنت، لامپهای هالوژن و . . . )
۹٫ یک برنامهٔ مشخص که بتواند تصاویر را پردازش کرده و مشخصه‌های مربوط و مناسب را شناسایی کند.
۱۰٫ یک سنسور همزمان ساز برای شناسایی اجزا ( گاهی یک سنسور نوری و یا یک سنسور مغناطیسی ) : این سنسور برای راه اندازی سیستمٍ استخراج و پردازش تصویر می باشد.

سنسور همزمان ساز تعیین می‌کند که چه زمانی یک بخش ( که معمولاً روی یک حمل کننده حرکت می کند) در موقعیتی قرار گرفته است که باید مورد بررسی واقع شود. این سنسور هنگامیکه از زیر دوربین می گذرد و یک پالس نوری برای ثابت نگهداشتن تصویر ایجاد می‌کند، دوربین را برای گرفتن عکس فعال می کند. نوری که برای روشن کردن آن بخش به کار می رود در واقع برای آن است که مشخصه‌های مطلوب را برجسته و مشخصات نامطلوب ( مثل سایه‌ها و یا انعکاس ها) را به حداقل برساند. معمولاً پنل‌های LED با اندازه و طراحی مناسب برای این هدف مورد استفاده قرار می گیرند. تصویر دوربین یا توسط یک frame grabber و یا توسط یک حافظه کامپیوتری (که در آن از frame grabber استفاده نشده است) گرفته می شود.

frame grabber یک وسیله دیجیتال کننده است ( یا در داخل دوربین هوشمند و یا بطور جداگانه) که خروجی دوربین را به فرمت دیجیتال تبدیل کرده ( معمولاً این فرمت از یک آرایه دو بعدی از اعداد تشکیل شده که هر عدد متناظر شدت روشنایی نقطه متناظر در آن تصویر می باشد. به این نقاط پیکسل می گویند.) و سپس تصویر را به منظور پردازش توسط نرم‌افزارٍ ماشین بینایی در حافظه کامپیوتر ذخیره می کند. به طور معمول نرم‌افزار، اقدامات متفاوتی را برای پردازش تصویر انجام می دهد. گاهی در ابتدا تصویر برای کاهش نویز و یا تبدیل سایه‌های خاکستری به ترکیب ساده ای از رنگهای سیاه و سفید دستکاری می‌شود ( Binarization ).

در قدم بعدی نرم‌افزار عمل شمردن، اندازه گیری و شناسایی اجسام، ابعاد، کاستی‌ها و مشخصات دیگر تصویر را انجام می دهد. در نهایت با توجه به ضوابط و معیارهای برنامه ریزی شده ممکن است بخشی را بپذیرد و یا رد کند. اگر یک بخش رد شد، نرم‌افزار به یک دستگاه مکانیکی فرمان می دهد تا آن بخش را خارج کند و همچنین سیستم خط تولید را قطع کرده و به کارگر هشدار می دهد تا مشکلی که باعث ایجاد خطا شده را رفع نماید. اگرچه اکثر ماشین بینایی ها بر مبنای دوربین‌های سیاه–سفید بنا نهاده شده اند، استفاده از دوربین‌های رنگی در حال رایج شدن است.

همچنین امروزه شاهد شیوع فراوان استفاده از تجهیزات دوربین‌های دیجیتال به جای یک دوربین و یک frame grabber جداگانه در ماشین بینایی هستیم. استفاده از یک دوربین دیجیتال به منظور برقراری ارتباط مستقیم، باعث صرفه جویی در هزینه و نیز سادگی سیستم خواهد شد. دوربین‌های هوشمند که در داخل آنها embedded processor‌ها تعبیه شده اند، در حال تسخیر سهم بالایی از بازار ماشین بینایی ها هستند. استفاده از یک embedded processor ( و یا یک پردازنده بهینه ) نیاز ما به frame grabber و یک کامپیوتر خارجی را از بین می برد. به همین خاطر این پردازنده‌ها باعث کاهش هزینه، کاهش پیچیدگی سیستم و همچنین اختصاص توان پردازشی مشخص به هر دوربین می شود. دوربین‌های هوشمند معمولاً ارزان تر از سیستمهای شامل یک دوربین و یک برد و یک کامپیوتر خارجی هستند. همچنین توان بالای embedded processor و DSP‌ها منجر به بالا رفتن عملکرد و توانایی آنها نسبت به سیستمهای مرسوم ( که بر مبنای PC هستند ) شده است.
منبع

۲۱ شهریور ۱۳۹۸/0 نظرها/توسط م. دلیری
http://behsanandish.com/wp-content/uploads/machin_vision.gif 256 256 م. دلیری https://behsanandish.com/wp-content/uploads/logo-farsi-englisi-300x195-1.png م. دلیری2019-09-12 14:45:202019-09-08 12:51:27ماشین بینایی چیست؟

آشنایی با بینایی ماشین

بینایی ماشین (Machine Vision) و بینایی کامپیوتر

بینایی ماشین

اگر به طور خلاصه بخواهیم تعریفی از “بینایی ماشین” یا “Machine Vision” داشته باشیم ، به این صورت بیان می کنیم که : بینایی ماشین در واقع دادن قدرت دیدن به دستگاه ها و تجهیزات صنعتی با مجهز کردن آن ها به دوربین و کامپیوتر می باشد.

بینایی ماشین مجموعه ای از روش ها و تکنولوژی هاست که برای درک و آنالیز خودکار مبتنی بر تصاویر ، در زمینه هایی مثل بازرسی خودکار ، فرآیند کنترل و هدایت روبات در صنعت استفاده می شود. بینایی ماشین ارتباط نزدیکی با “بینایی رایانه ای ” دارد ولی با آن فرق دارد.

بینایی ماشین هم شامل طراحی یک راه حل برای فرایند است و هم مسائل فنی در حین فرایند است. از سال ۲۰۰۶ به بعد تا حدودی رابط کاربری استاندارد سازی شده است. اولین گام در بینایی ماشین ، دریافت یک تصویر است، که معمولا از دوربین ، لنز و نورپردازی استفاده می شود. بسته نرم افزاری بینایی ماشین از تکنیک های پردازش تصاویر دیجیتال برای استخراج اطلاعات لازم و تصمیم گیری برمبنای آن اطلاعات استفاده می کند.

تصویربرداری

معمولا از تصویر برداری دوبعدی در نورمرئی در بینایی ماشین استفاده می شود. البته جایگزین های دیگری مثل تصویربرداری در باند مادون قرمز ، تصویربرداری اسکن خط، تصویربرداری سه بعدی و تصویربرداری اشعه ایکس وجود دارد.

شکلی از تصویربرداری خطی و تصویر برداری سه بعدی

قسمت پردازش تصویر می تواند از وسیله تصویربرداری جدا باشد ، که در این صورت نیاز به یک رابط واسط نیاز است تا تصاویر را از دوربین دریافت کند(دریافت کننده فریم) و آن را برای انجام پردازش های بعدی به کامیپیوتر و سیستم پردازنده بدهد. اگر قسمت پردازش تصویر با دوربین ترکیب شده باشد ، اصطلاحا به آن دوربین هوشمند و یا سنسور هوشمند می گویند.

پردازش تصویر

بعد از دریافت تصویر نوبت به پردازش تصویر و استخراج اطلاعات از تصاویر می رسد. در پردازش تصویر اعمال مختلفی روی تصویر صورت میگیرد که شامل دو بخش بهبود تصاویر و استخراج ویژگی ها است. از جمله پردازش هایی که روی تصویر صورت می گیرد شامل : بازسازی و ترکیب تصاویر ، فیلتر کردن، آستانه گذاری ، شمارش پیکسل ، شناسایی لبه ، آنالیز رنگ ، شناسایی الگو ، و … است.

تصمیم گیری

در نهایت پس از دریافت و پردازش تصاویر و استخراج ویژگی و پارامترهای لازم نوبت به تصمیم گیری براساس این پارمترهای استخراج شده از تصویر می رسد.

چند مثال برای بینایی ماشین در زیر ذکر شده است :

بررسی وان حمام برای وجود خش
چک کردن اینکه آیا کیسه هو به درستی در اتومبیل نصب شده است یا نه
بررسی کاغذ هنگام تولید تا از نبود ایراد اطمینان حاصل شود
اطمینان از تولید درست سرنگ
پیدا کردن ناصافی در شیشه
هدایت روبات ها تا بتوانند با محیط ارتباط برقرار کنند

مزیت ها

فواید استفاده از یک سیستم بینایی ماشین چیست ؟

مهمترین فایده افزایش کیفیت محصول نهایی است . با اینکار نیازی به نمونه برداری از محصول نهایی و چک کردن نمونه نیست ، بلکه با بینایی ماشین می تواند صددرصد محصولات را بررسی کرد. برای نمونه در مثال تولید کاغذ ، هر اینج از کاغذ به دقت بررسی می شود و محصول نهایی دارای صددرصد کیفیت است. از دیگر مزیت ها می توان به افزایش سرعت ، دقت ، کاهش هزینه ها ، و انجام کارهایی که انسان قادر به انجام آن نیست ، اشاره کرد.

بینایی رایانه ای

بینایی رایانه ای یا “Computer Vision” یک فیلدی است که شامل دریافت ، پردازش ، آنالیز و فهم تصاویر است ؛ به طور کلی به دریافت تصاویر از محیط و استخراج اطلاعات کمی و کیفی از آن ها اطلاق می شود.

تشخیص چهره یا اثر انگشت ، خواندن پلاک اتومبیل و یا شمارش تعداد افراد از جمله کابردهای بینایی رایانه است.

مفاهیم بینایی رایانه ای بسیار نزدیک به بینایی ماشین است با این تفاوت که ،بینایی رایانه ای مفهوم کامل تری را در برمی گیرد و به طور کلی به پردازش و آنالیز تصاویر در دستگاه ها و اپلیکیشن های مختلف گفته می شود در صورتی که بینایی ماشین به صورت عملی و در محیط صنعتی صورت می گیرد.

در زیر جدولی ارائه شده است که تا حدودی تفاوت های بینایی رایانه ای با بینایی ماشین ذکر شده است :

منبع : http://d-i-p.ir

۲۰ شهریور ۱۳۹۸/0 نظرها/توسط م. دلیری
http://behsanandish.com/wp-content/uploads/3d_vision.jpg 347 439 م. دلیری https://behsanandish.com/wp-content/uploads/logo-farsi-englisi-300x195-1.png م. دلیری2019-09-11 14:45:272019-09-08 12:44:42آشنایی با بینایی ماشین

تولید Deepfake سخنگو از تصویر

آموزش های عمومی هوش مصنوعی, وبلاگ

هوش مصنوعی جدید وحشت آور سامسونگ می تواند Deepfakeهای سخنگو از یک تصویر تولید کند.

مشکل deepfake ما در مورد بدتر شدن است: مهندسان سامسونگ در حال حاضر سرهای سخنگوی واقع گرایانه ای را توسعه داده اند که می تواند از یک تصویر تولید شود، بنابراین AI حتی می تواند کلمات را در دهان مونا لیزا قرار دهد.

الگوریتم های جدید که توسط یک تیم از مرکز AI سامسونگ و موسسه علوم و فناوری Skolkovo توسعه یافته است، هر دو در مسکو به بهترین وجه با انواع تصاویر نمونه گرفته شده در زوایای مختلف کار می کنند، اما آنها می توانند تنها با یک تصویر برای کار کردن، حتی یک نقاشی، کاملا موثر باشند.

 

 

 

مدل جدید نه تنها می تواند از یک پایگاه داده اولیه کوچکتر از تصاویر استفاده کند، هم چنین می تواند طبق نظر محققان پشت آن، فیلم های کامپیوتری را در مدت کوتاه تری تولید کند.

و در حالی که همه انواع برنامه های جالب وجود دارد که از تکنولوژی می توان برای آن استفاده کرد – مانند قرار دادن یک نسخه فوق واقع گرایانه از خودتان در واقعیت مجازی – این نگرانی وجود دارد که فیلم های ویدئویی کاملاً تقلبی را می توان از یک تصویر کوچک تولید کرد.

محققان در مقاله خود نوشتند: “چنین توانایی دارای کاربردهای عملی برای تلوزیون است،، از جمله ویدئو کنفرانس و بازی های چند نفره، و همچنین صنعت جلوه های ویژه.”

deepfake

سیستم با آموزش خود در مجموعه ای از ویژگی های چهره برجسته کار می کند که پس از آن می تواند دستکاری شود. بسیاری از آموزش ها بر روی یک پایگاه داده قابل دسترس عمومی از بیش از ۷۰۰۰ تصویر از افراد مشهور، به نام VoxCeleb، و همچنین تعداد زیادی از فیلم ها از صحبت کردن مردم با دوربین انجام شده است.

از آنجا که این رویکرد جدید کار گذشته را با آموزش دادن به شبکه عصبی در مورد چگونگی تبدیل ویژگی های چهره برجسته به فیلم های متحرک با نگاه واقع گرایانه، بیش از چندین بار، بهبود می دهد. سپس این دانش می تواند بر روی چند عکس (یا فقط یک عکس) از کسی که AI قبل از آن هرگز ندیده است، مستقر شود.

 

deepfake new

 

این سیستم از یک شبکه عصبی کانولوشن، یک نوع شبکه عصبی بر اساس فرآیندهای بیولوژیکی در قشر بینایی حیوان استفاده می کند. این منحصراً در پردازش پشته های تصاویر و شناخت آنچه در آنها متخصص است – “convolution” اساساً بخش هایی از تصاویر را شناسایی و استخراج می کند (آن همچنین برای نمونه، در جستجوهای تصویری در وب و تکنولوژی خودرو خود راننده استفاده می شود).

https://10c.ir/wp-content/uploads/video/2019/05/1558852989-samsung-deepfake-ai-could-fabricate-a-video-of-you-from-a-single-profile-pic-hd720.mp4

همانند سایر ابزارهای تولید چهره هوش مصنوعی گرا که ما شاهد آن هستیم، آخرین مرحله در این فرآیند برای “واقع گرایی کامل” مورد بررسی قرار می گیرد – از لحاظ فنی یک مدل مولد رقابتی. هر فریمهایی که بیش از حد عجیب و غریب و غیر طبیعی هستند، دوباره برش داده و ارائه میشوند، ویدئو نهایی با کیفیت بهتر را به نمایش میگذارند.

این تکنیک موفق به غلبه بر دو مشکل بزرگ در سرهای سخنگوی تولید شده مصنوعی شده است: پیچیدگی سرها (با دهان ها، مو، چشم ها و غیره) و توانایی ما در به راحتی کشف کردن یک سر جعلی (به عنوان مثال، چهره های شخصیتی در میان سخت ترین عناصر برای طراحان بازی ویدیویی برای درست کردن هستند).

سیستم و دیگران مانند آن، برای بهتر شدن محدود می شوند به طوریکه الگوریتم ها بهبود یابند و مدل های آموزشی موثرتر شوند – و این بدان معنی است که مجموعه ای کامل از سوالات در مورد اینکه آیا می توانید به آنچه که می بینید یا می شنوید اعتماد کنید، اگر در فرم دیجیتال باشد.

از طرف دیگر، ستاره های تلویزیون و فیلم مورد علاقه شما هرگز نباید رشد کنند و بمیرند – AI شبیه به این است که به زودی به اندازه کافی هوشمند خواهد بود تا نمایش های کاملا واقعی را فقط از چند عکس تولید کند و همچنین در زمان ذخیره.

 

 

۱۳ شهریور ۱۳۹۸/0 نظرها/توسط م. دلیری
http://behsanandish.com/wp-content/uploads/mona-lisa-talk_1024.gif 415 1024 م. دلیری https://behsanandish.com/wp-content/uploads/logo-farsi-englisi-300x195-1.png م. دلیری2019-09-04 14:45:122019-08-30 16:19:52تولید Deepfake سخنگو از تصویر

مشخصات فنی دوربین پلاک‌خوان معاینه فنی

وبلاگ

مشخصات فنی دوربین های پلاک‌خوان جهت نصب در مراکز خدمات فنی مجاز اتحادیه کشوری سوخت های جایگزین و خدمات وابسته، به شرح زیر اعلام شد.

جهت خریداری توجه داشته باشید، دوربین مورد نظر شرایط فنی زیر را دارا باشد.

مشخصات فنی دوربین های پلاک‌خوان مراکز معاینه فنی

 ۱/۲٫۸ cmos – ۲ mp Full HD Image sensor
Color: 0/1 lox          –        B/w: 0/1 lox Min illumination
۱s~1/10,000s Minshutter time
P-Iris Auto Iris
IR cut filter with auto switch Day & Night
DNR Digital noise reduction
True – ۱۲۰ dB Real Wide dynamic range
H.264-MPEG4-MJPEG Video compression
UP TO 1920*1080 Resolution
UP TO 30 fps at (1920*1080) Frame Rate
-۳۰ °C ~ 55 °C – Humidity 100% Operating conditions
At least one zone configurable Rol
Yes HLC
Yes BLC
Yes Defog
Yes ELC
Yes Smart Focus
Yes Network Interface
User Authentication, anonymous access Security
ONVIF (Profile S, Profile G) System Compatibility
PoE Power Supply
Import/Export configuration capability – rese buttom – web broeser access Other feature
Varifocal P-Iris Lens Type
Under the terms of Iris Focal Length
IP66 Housing

 

منبع

۱ شهریور ۱۳۹۸/2 نظرها/توسط بهسان اندیش
http://behsanandish.com/wp-content/uploads/main.jpg 519 800 بهسان اندیش https://behsanandish.com/wp-content/uploads/logo-farsi-englisi-300x195-1.png بهسان اندیش2019-08-23 23:00:472019-08-23 00:40:09مشخصات فنی دوربین پلاک‌خوان معاینه فنی

فصل اول: توابع اولیه متلب

آموزش پردازش تصویر در نرم افزار متلب (Matlab)

مقدمه

آموزش توابع اولیه پردازش تصویر در متلب (فصل اول) : در این مجموعه قصد داریم به آموزش فهرست وار و سریع «جعبه ابزار پردازش تصویر» در نرم افزار متلب (Matlab) بپردازیم. سعی ما بر این است تا در پروژه های رایگانی که در سایت قرار می دهیم با لینک هر دستور به صفحه آموزشی آن، بتوانیم خیلی سریع و آسان با کاربرد دستورات و توابع مورد استفاده آشنا بشویم. در این مجموعه آموزشی فرض ما بر این است که دوستان آشنایی نسبی با نرم افزار متلب دارند و فعلا وارد این حوزه نمی شویم.

 

 

«فصل اول: آموزش توابع اولیه پردازش تصویر در متلب»

 

تابع ()imread :

هدف : هدف از این تابع خواندن تصویر از فایل می باشد.

 

نحوه استفاده :

imread( مسیر فایل )

 

مثال :

img= imread('c:\1.jpg');

 

 


تابع ()imshow :

هدف : هدف از این تابع نمایش تصویر می باشد.

 

نحوه استفاده :

imshow(نام متغیر)

 

مثال :

img= imread('c:\1.jpg');
imshow(img)

 

خروجی دستور :

آموزش توابع اولیه پردازش تصویر در متلب - imshow


 

تابع ()subplot:

هدف : جهت نمایش تصاویر بطور همزمان و در یک پنجره.

 

نحوه استفاده :


subplot( rows , columns , image number) , imshow( pic )

 

مثال :


subplot(131);
imshow(img(:,:,1)); 

subplot(132);
imshow(img(:,:,2)); 

subplot(133);
imshow(img(:,:,3)); 

 

خروجی دستور:

آموزش توابع اولیه پردازش تصویر در متلب - subplot


تابع ()title:

هدف : جهت نمایش توضیحات در مورد آخرین تصویر نمایش داده شده.

 

نحوه استفاده :

imshow(img); 
title('Red')

 

مثال :

subplot(131); 
imshow(img(:,:,1)); 
title('Red'); 

subplot(132); 
imshow(img(:,:,2)); 
title('Green'); 

subplot(133); 
imshow(img(:,:,3)); 
title('Blue'); ; 

 

خروجی دستور :

آموزش توابع اولیه پردازش تصویر در متلب - title


تابع ()figure :

هدف : جهت نمایش تصویر در پنجره های جداگانه. در صورتی که بخواهیم خروجی دستور imshow در پنجره ای جدید باز شود از این دستور استفاده می شود.

نحوه استفاده :

figure , imshow( pic )

 

مثال :

figure , imshow( pic )

تابع ()imwrite :

هدف : هدف از این تابع ذخیره تصویر بصورت فایل می باشد.

 

نحوه استفاده :

imwrite( pic , path)

 

مثال :

 imwrite( pic , 'c:\1.jpg');

تابع ()iminfo:

هدف : نمایش اطلاعات تصویر.

 

نحوه استفاده :

iminfo( pic )

 

مثال :

 iminfo( peppers.png);

 

خروجی دستور:


ans =

 Filename: '/Applications/MATLAB_R2014a.app/toolbox/matla...'
FileModDate: '02-Apr-2013 15:55:52'
FileSize: 287677
Format: 'png'
FormatVersion: []
Width: 512
Height: 384
BitDepth: 24
ColorType: 'truecolor'
FormatSignature: [137 80 78 71 13 10 26 10]
Colormap: []
Histogram: []
InterlaceType: 'none'
Transparency: 'none'
SimpleTransparencyData: []
BackgroundColor: []
RenderingIntent: []
Chromaticities: []
Gamma: []
XResolution: []
YResolution: []
ResolutionUnit: []
XOffset: []
YOffset: []
OffsetUnit: []
SignificantBits: []
ImageModTime: '16 Jul 2002 16:46:41 +0000'
Title: []
Author: []
Description: 'Zesty peppers'
Copyright: 'Copyright The MathWorks, Inc.'
CreationTime: []
Software: []
Disclaimer: []
Warning: []
Source: []
Comment: []
OtherText: []


تابع ()imtool:

هدف : نمایش اطلاعات تصویر.

علاوه بر نمایش تصویر در دو پنجره دیگر امکاناتی جهت مشاهده کد رنگ یک پیکسل و خط کش وجود دارد.

 

نحوه استفاده :

imtool( pic )

 

مثال :

 imtool( coins.png);

 

خروجی دستور:

آموزش توابع اولیه پردازش تصویر در متلب - imtool


پایان آموزش پردازش تصویر در متلب (فصل اول)

 

 

۲ بهمن ۱۳۹۶/0 نظرها/توسط محمد مهدی ابراهیمی
http://behsanandish.com/wp-content/uploads/shifting-perceptions-760x400-1.jpg 256 256 محمد مهدی ابراهیمی https://behsanandish.com/wp-content/uploads/logo-farsi-englisi-300x195-1.png محمد مهدی ابراهیمی2018-01-22 09:52:202021-03-30 21:55:50فصل اول: توابع اولیه متلب

OpenCV چیست؟

پردازش تصویر با کتابخانه متن باز OpenCV

OpenCV چیست؟

OpenCV یا همان Open Computer Vision Library مجموعه ای از کتابخانه‌های برنامه‌نویسی پردازش تصویر و یادگیری ماشین است. این مجموعه بیشتر بر پردازش تصویر بی درنگ (به انگلیسی: Real Time) تمرکز دارد. در ابتدا توسط اینتل ساخته و پشتیبانی می‌شد و هم اکنون توسط Willow Garage و Itseez پشتیبانی می‌گردد. استفاده از آن با پروانه فری بی‌اس‌دی آزاد است. اوپن سی وی کتاب‌خانه‌ای چندسکویی است و توسط سیستم عامل های ویندوز، لینوکس، مک اواس، آی او اِس و اندروید پشتیبانی می‌شود. همچنین دارای رابط برنامه نویسی به زبان های سی، سی++، پایتون، جاوا و متلب می‌باشد.

کاربردهای OpenCV

  • فیلتر تصویر
  • سیستم تشخیص صورت
  • تشخیص حرکت
  • تعامل انسان و رایانه ( HCI )
  • رباتیک موبایل
  • درک حرکت
  • شناسایی شی
  • تقسیم‌بندی و تشخیص
  • چشم انداز عمق استریو : ادراک عمق از ۲ دوربین
  • ساختار از حرکت ( SFM )
  • ردیابی حرکت
  • واقعیت افزوده

برای پشتیبیانی از برخی زمینه‌های بالا، OpenCV یک کتاب‌خانه یادگیری ماشینی را در بردارد شامل:

  • الگوریتم متا
  • یادگیری درخت تصمیم گیری
  • درختان افزایش گرادیان
  • الگوریتم امید ریاضی-بیشینه کردن
  • الگوریتم نزدیکترین همسایه
  • دسته‌بندی کننده نایو بیز
  • شبکه عصبی مصنوعی
  • جنگل تصادفی
  • ماشین بردار پشتیبانی(SVM)

زبان‌های برنامه‌نویسی

OpenCV به زبان سی++ نوشته شده و بنیاد رابط برنامه نویسی آن به زبان سی++ است. رابط برنامه نویسی کاملی نیز برای پایتون، جاوا و متلب/اوکتاو دارد. ای‌پی‌آی این زبان‌ها در اسناد برخط OpenCV یافت می‌شود. همچنین پوشش‌هایی (به انگلیسی: Wrapper) برای زبان‌هایی همچون سی#، Ch و روبی برای تشویق پذیرش مخاطبان گسترده‌تر طراحی شدند.

  • یک رابط جی‌پی‌یو کودا-پایه از سپتامبر ۲۰۱۰ در حال پیشرفت است.
  • یک رابط OpenCL-پایه از اکتبر ۲۰۱۲ در حال گسترش است.

پشتیبیانی سیستم‌عامل

OpenCV روی ویندوز، اندروید، ماامو، فری‌بی‌اس‌دی، اوپن‌بی‌اس‌دی، آی‌اواس، بلک‌بری۱۰، لینوکس و اواس‌ده اجرا می‌شود[۳]. کاربران می‌توانند نسخه رسمی آن را از سورس‌فورج یا آخرین نسخه آن را از GitHub دریافت نمایند.

منبع


OpenCV چیست ؟
OpenCV یک کتابخانه ی متن بازبرای بینایی کامپیوتر است.این کتابخانه به زبان C و C++ نوشته شده است و تحت لینوکس و ویندوز و مکینتاش قابل اجراست.همچنین، برای واسط هایی چون Matlab,Ruby,Python وغیره ، توسعه های فعالی دارد.
هدف از طراحی OpenCV ، پردازش کارا به خصوص برای کاربرد های بی درنگ است. OpenCV می تواند با پردازنده های چند هسته ای نیز کار کند.در صورتی که تمایل دارید از بهینه سازی خودکار بیشتری روی معماری های اینتل بهره ببرید، می توانید کتابخانه های (IPP (Integrated Performance Primmitive اینتل که شامل روتین های بهینه شده سطح پایین در بسیاری از زمینه های الگوریتمی هستند را خریداری کنید. OpenCV به صورت خودکار IPP مناسب را در زمان اجرا در صورتی که کتابخانه نصب باشد، به کار می گیرد.
یکی از اهداف OpenCV فراهم کردن یک زیربنای بینایی کامپیوتر با کاربری ساده است،به طوری که افراد بتوانند برنامه های بینایی نسبتا پیچیده خود را با سرعت بسازند.کتابخانه OpenCV شامل بیش از ۵۰۰ تابع پیرامون موضوعات مختلف بینایی ، از بررسی محصول کارخانه گرفته تا تصویر برداری پزشکی،امنیت، واسط کاربر،تنظیم دوربین،رباتیک و بینایی دو چشمی است.از آنجا که همواره قرابت زیادی بین بینایی کامپیوتر و یادگیری ماشین وجود داشته است، OpenCV شامل یک کتابخانه یادگیری ماشین همه منظوره MLL(Machine Learning Library) نیز هست.این زیر کتابخانه ، روی مباحث تشخیص الگوی آماری و دسته بندی تمرکز دارد.
چه کسانی از OpenCV استفاده می کنند؟
بسیاری از دانشمندان علوم رایانه و برنامه نویسان برنامه های کاربردی، از برخی نقش های بینایی کامپوتر آگاهند.اما تعداد کمی از همه کاربردهای بینایی کامپیوتر اطلاع دارند.برای مثال،خیلی ها ازکاربرد آنها در نظارت تصویری آگاهی دارند.همچنین، بسیاری نیز از افزایش استفاده آن برای تصاویر و ویدیو در وب باخبرند. اما شمار اندکی ، کاربرد های بینایی ماشین در واسط های بازی را دیده اند.هنوز تعداد کمی درک می کنند که تصاویر فضایی و تصاویرنقشه خیابان ها(مثلا در(Google’ s Street View ، استفاده زیادی در از روش های تنظیم دوربین وتکنیک های چسباندن تصویر می کنند.برخی افراد از کاربرد های آن در کنترل امنیت، وسایل نقلیه بدون سرنشین، یا تحلیل های پزشکی اگاهند.اما تعداد کمی می دانند که بینایی ماشین تا چه حد در تولید می تواند استفاده شود.به طور کلی در تولید انبوه و خ.دکار هر چیزی ، بایستی در نقاطی از خط تولید، محصول را با استفاده از تکنیک های بینایی ماشین مورد بازرسی قرار داد.
مجوز متن باز بودن OpenCV به گونه ای است که شما می توانید یک محصول تجاری را با استفاده از OpenCV تولید کنید.اما هیچ اجباری برای متن باز بودن محصول شما وجود ندارد.به موجب این مجوز ها، کتابخانه های OpenCV جامعه کاربران زیادی را شامل می شود.
از زمان انتشار نسخه ی آلفا در ژانویه ۱۹۹۹ ، OpenCV در بسیاری از کاربرد ها، محصولات و تلاش های تحقیقاتی مورد استفاده قرار گرفته است.این کاربردها شامل چسباندن تصاویرماهواره ای و نقشه های وب به یکدیگر، تنظیم تصویر اسکن شده، کاهش نویز تصاویر پزشکی، تحلیل شی در سامانه های تشخیص اختلال و امنیت، نظارت خودکار و سامانه های امنیت، سامانه های بازرسی صنعتی، تنظیم دوربینف کاربرد های نظامی و وسیایل نقلیه هوایی، زمینی وزیرآبی بدون سرنشین است.حتی از آن می توانید در تشخیص موزیک و صوت نیز استفاده کرد به این روش که از تکنیک های تشخیص بینایی برای تصاویر طیف نگار صدا استفاده شود. OpenCV یک جز کلیدی سامانه بینایی ربات دانشگاه استنفورد، بنام استنلی بود که در مسابقات بزرگ ربات صحرایی برنده دو میلیون دلار جایزه از دارپا شد.

آشنایی کلی با OpenCV ؟

مقدمه

یکی از مشکلات توسعه دهندگان نرم افزار های بصری انجام محاسبات مختلف بر روی تصاویر است. به دلیل حجم بالای اطلاعات، پردازش آنها نیاز به برنامه نویسی بهینه دارد. شرکت Intel پروژه ای را با نام OpenCV آغاز کرد تا کتابخانه های بهینه برای انجام بلادرنگ محاسبات بصری، جهت توسعه دهندگان این دسته نرم افزار ها فراهم آورد.

OpenCV چیست ؟

OpenCV یک کتابخانه بازمتن با لایسنس BSD برای توسعه دهندگان نرم افزارهای بصری و پردازش تصویر است که در سال ۲۰۰۰ توسط شرکت Intel پا به دنیای کامپیوتر نهاد.

در حال حاضر ورژن های مختلفی از این کتابخانه موجود می باشد که معروف ترین آنها ورژن ۲.۴ و جدیدترین آنها ورژن ۳٫۱ است که آخرین ورژن پایدار محسوب می شود.

این کتابخانه با زبان C/C++ نوشته شده است ولی تقریبا در تمام زبان های برنامه نویسی معروف ازجمله Python قابل دستری است.

چه نرم افزارهایی از OpenCV استفاده می کنند ؟

نرم افزارهای بسیار زیادی از OpenCV استفاده می کنند اما با توجه به صفحه ی ویکی پدیا می توان به موارد زیر اشاره کرد.

  • ۲D and 3D feature toolkits
  • Egomotion estimation
  • Facial recognition system
  • Gesture recognition
  • Human–computer interaction (HCI)
  • Mobile robotics
  • Motion understanding
  • Object identification
  • Segmentation and recognition
  • Stereopsis stereo vision: depth perception from 2 cameras
  • Structure from motion (SFM)
  • Motion tracking
  • Augmented reality

OpenCV بر روی چه سیستم عامل هایی اجرا می شود ؟

OpenCV در سیستم عامل های مختلف اجرا می شود که از مهمترین آنها می توان به این موارد اشاره کرد.

Desktop: Windows, Linux, OS X, FreeBSD, NetBSD, OpenBSD

 Mobile: Android, iOS, Maemo, BlackBerry 10

منبع


OpenCV چیست ؟

OpenCV(کتابخانه متن باز بینایی ماشین) کتابخانه ای از توابع برنامه نویسی برای پردازش تصویر بلادرنگ می باشد.این کتابخانه از BSD license استفاده می کند از این رو برای استفاده آکادمیک و تجاری آزاد می باشد.این کتابخانه در ابتدا در زبان Ansi C پیاده سازی شده و از نسخه ۲٫x با زبان C++  در حال توسعه می باشد.در ضمن رابط هایی برای زبان های پایتون و جاوا(اندروید) را دارا می باشد و همچنین رابطی غیر رسمی برای #C نیز دارد .
این کتابخانه پلت فرم های مختلف از جمله ویندوز ،لینوکس ،اندروید،IOS , مکینتاش را پشتیبانی می کند و حاوی بیش از ۲۵۰۰ الگوریتم بهینه شده می باشد.
الگوریتم های این کتابخانه از SSE,AVX,TBB,IPP,CUDA,OpenCL جهت بهینه سازی و موازی سازی استفاده می کنند و همچنین دارای بخش یادگیری ماشین جهت خوشه بندی و کلاسیفی کردن داده می باشد نیز می باشد.

ساختار کتابخانه :

  • core: شامل تعریف ساختارها و کلاس های پایه ای جهت نگهداری داده به صورت خلوت و غیر خلوت و همچنین توابع پایه ای می باشد.
  • imgproc : ماژول پردازش تصویر که شامل فیلتر های خطی و غیر خطی ،تبدیلات هندسی (تغییر اندازه ،تبدیل آفاین ،تبدیل پرسپکتیو) ،تبدیل فضای رنگی و هیستوگرام و غیره می باشد.
  • video: ماژول های تحلیل ویدیو که شامل تخمین حرکت ،استخراج پشت زمینه و الگوریتم های مختلف ردگیری می باشد.
  • calib3d: الگوریتم های مربوط به هندسه چند دوربین , کالیبره کردن یک یا چند دوربین ،تخمین موقعیت اشیاء ،الگوریتم های مربوط به استریو و ساختارهای احیا ۳ بعدی اشیاء می باشد.
  • feature2d: شامل توابع مربوط به استخراج انواع key point ها و descriptor ها و توابع مربوط مقایسه descriptor ها می باشد.
  • bjdetect: کلیه توابع مربوط به آموزش و شناسایی اشیاء در این بخش می باشد.
  • highgui : کلیه توابع مربوط به رابط کاربری ،پخش و ضبط فیلم و توابع مربوط به codec ها در این بخش می باشد.
  • gpu : توابع و الگوریتم های مربوط به موازی سازی در این بخش می باشد.

منبع


OpenCV چیست؟

OpenCV یک کتابخانه متن باز برای زیبایی کامپیوتر است.

این کتابخانه به زبان C و ++C نوشته شده و تحت لینوکس ، ویندوز و مکینتاش قابل اجراست.

همچنین برای واسط هایی چون Matlab , Ruby , Python و . . . قابل توسعه های فعالی دارد.

هدف از طراحی OpenCV پردازش کارا به خصوص برای کاربرد های بی درنگ است.

OpenCV می تواند با پردازنده های چند هسته ای نیز کار کند.

در صورتی که تمایل دارید از بهینه سازی خودکار بیشتری روی معماری اینتل بهره ببرید می توانید کتابخانه های IPP یا ( Integrated Performance Primitives ) اینتل که شامل روتین های بهینه شده سطح پایین در بسیاری از زمینه های الگوریتمی هستند را خریداری کنید.

OpenCV به صورت خودکار IPP مناسب را در زمان اجرا در صورتی که کتابخانه نصب باشد به کار میگیرد.

یکی از اهداف OpenCV فراهم کردن یک زیربنای بینایی کامپیوتر با کاربری ساده است به طوری که افراد بتوانند برنامه های بینایی نسبتا پیچیده ی خود را به سرعت بسازند.

کتابخانه OpenCV شامل بیش از ۵۰۰ توابع پیرامون موضوعات مختلف بینایی، از بررسی محصول کارخانه گرفته تا تصویر برداری پزشکی، امنیت، واسط کاربر، تنظیم دوربین، رباتیک و بینایی دو چشمی ( استریو ) است.

از انجا که همواره قرابت زیادی بین بینایی کامپیوتر و یادگیری ماشین وجود داشته است OpenCV شامل یک کتابخانه ی یادگیری ماشین همه منظوره  ( MLL ) نیز هست. ( Machine Learning Library )

این زیر کتابخانه روی بحث تشخیص الگوی اماری و دسته بندی تمرکز دارد.

چه کسانی از OpenCV استفاده می کنند؟

بسیاری از دانشمندان علوم رایانه و برنامه نویسان برنامه های کاربردی، از برخی نقش های بینایی کامپیوتر اگاهند.اما تعداد کمی از همه ی کاربرد های بینایی کامپیوتر اطلاع دارند.برای مثال خیلی ها از کاربرد ان در نظارت تصویری آگاهی دارند.همچنین بسیاری نیز از افزایش استفاده ان برای تصاویر و ویدیو در وب باخبرند.اما شمار اندکی کاربرد های بینایی ماشین در واسط های بازی دیده اند.

هنوز تعداد کمی درک می کنند که تصاویر فضایی و تصاویر نقشه خیابان ها ( مثلا در Google’s Street View ) استفاده زیادی از روش های تنظیم دوربین و تکنیک های چسباندن تصویر می کنند.

برخی افراد از کاربرد های ان در کنترل امنیت، وسایل نقلیه، بدون سرنشین یا تحلیل های پزشکی اگاهند.اما تعداد کمی می دانند که بینایی ماشین تا چه حد در تولید می تواند استفاده شود.

به طور کلی در تولید انبوه و خودکار هر چیزی، باید در نقاطی از خط تولید، محصول را با استفاده از تکنیک های ماشین مورد بررسی قرار داد.


OpenCV چیست و چرا از آن باید استفاده کنیم ؟

OpenCV یا Open Source Computer Vsion در حقیقت یک کتابخانه متن باز است که می توانید به برنامه خودتون اضافه کنید و از قابلیت ها آن استفاده کنید. این کتابخانه برای کارهای پردازش تصویر و بینایی ماشین نوشته شده است. اگر برنامه شما به زبان های C ، ++C ، پایتون ، #C و یا جاوا هست از این کتابخانه میتونید استفاده کنید.
در کد زیر با استفاده از قابلیتی که این کتابخانه به ما داده، میتونیم یک تصویر رو بخونیم

کد PHP:
    IplImage* img = cvLoadImage( "test.jpg" );

و نمایش بدیم.

کد PHP:
    cvShowImage("Example1", img);

خوب پرسشی که پیش میاید این است که چه برتری نسبت به MATLAB که از آن هم برای پردازش تصویر استفاده میشود دارد؟
دلیل اول سرعت هست که برای کارهای Real Time این کتابخانه بهینه شده ست.
دلیل دوم: از این کتابخانه می توان در Embedded System و موبایلها استفاده کرد و با آن اپلیکیشن نوشت. در Embedded System هایی که توانایی نصب linux روی آنها هست به راحتی می تونیم از این کتابخانه استفاده کنیم و با ابزارهای جانبی مثل وبکم و Kinect ارتباط برقرار کنیم.

۲۴ دی ۱۳۹۶/1 دیدگاه/توسط م. دلیری
http://behsanandish.com/wp-content/uploads/download.png 256 326 م. دلیری https://behsanandish.com/wp-content/uploads/logo-farsi-englisi-300x195-1.png م. دلیری2018-01-14 07:51:002019-08-26 01:07:21OpenCV چیست؟

همایش بین المللی کامپیوتر، فناوری اطلاعات و برق

وبلاگ

همایش جامع بین المللی کامپیوتر، فناوری اطلاعات ومهندسی برق

همایش جامع بین المللی کامپیوتر، فناوری اطلاعات ومهندسی برق در تاریخ ۱۹ اسفند ۱۳۹۶ توسط و تحت حمایت سیویلیکا برگزار می شود.با توجه به اینکه این همایش به صورت رسمی برگزار می گردد، کلیه مقالات این کنفرانس در پایگاه سیویلیکا و نیز کنسرسیوم محتوای ملی نمایه خواهد شد و شما می توانید با اطمینان کامل، مقالات خود را در این همایش ارائه نموده و از امتیازات علمی ارائه مقاله کنفرانس با دریافت گواهی کنفرانس استفاده کنید.

 

حوزه های تحت پوشش: علوم کامپیوتر
برگزار کننده:
سایر برگزار کنندگان: تحت حمایت سیویلیکا

محورهای همایش:
علوم کامپیوتر
مهندسی نرم افزار
سیستم های نرم افزای

مهندسی نرم افزار و سیستم های صوری
معماری نرم افزار
تست و ارزیابی سیستم های نرم افزاری،
نظریه محاسبات
رایانش ابری
داده های عظیم و سایر موارد مرتبط

پایگاه داده عملیاتی و تحلیلی
داده کاوی
امنیت اطلاعات و امنیت سیستم های نرم افزاری
سایر مباحث مرتبط با مهندسی نرم افزار و محاسبات مشبک و خوشه ای
مباحث ویژه در مهندسی نرم افزار

هوش مصنوعی
هوش مصنوعی و یادگیری
بینایی ماشین و پردازش تصویر

پردازش زبان طبیعی
محاسبات نرم
سیستم های چند عامله
پردازش صوت و سیگنال
سیستم های خبره
منطق فازی
پردازش زبان طبیعی
علوم شناختی و کاربردهای آن در هوش مصنوعی

سیستم های استنتاج
شناسایی الگو
سیستم چند عامله
یادگیری ماشین
بینایی ماشین و پردازش تصویر
پردازش تکاملی
مباحث ویژه در سیستم هوشمند و محاسبات نرم
سایر مباحث مرتبط با سیستم های هوشمند و سایر موارد

شبکه های کامپیوتری
انتقال داده
امنیت شبکه های کامپیوتری
شبکه های هوشمند برق
شبکه های بین خودرویی
شبکه های اقتضای
شبکه های ارتباطی موبابل
شبکه های بی سیم و سایر موارد مرتبط

معماری کامپیوتر
سیستم های حسابی
قابلیت اطمینان
تحمل پذیری خطا و آزمون پذیری
معماری سیستم های موازی
مدل سازی و ارزیابی کارایی سیستم های کامپیوتری

سیستم های نهفته و بی درنگ
سیستم های قابل پیکربندی
شبکه های ارتباطی موبایل و بی سیم
مدارای مجتمع در سیستم های بسیار بزرگ
فناوری نوظهور
مباحث ویژه در سیستم دیجیتالی
سیستم های سلولی
سیستم توزیع شده
سایر مباحث مرتبط با سیستم های دیجیتالی و سایر موارد مرتبط

فناوری اطلاعات و ارتباطات
شبکه های کامپیوتری
انتقال داده
امنیت شبکه های کامپیوتری
محسبات خوشه ای، مشبک و ابری
یادگیری الکترونیک

معماری اطلاعات و مدیریت دانش
پردازش موازی و سیستم های توزیع شده
معماری سازمانی فناوری اطلاعات
سیستم های محاسباتی انسان محور
تجارت الکترونیک
مدل سازی و ارزیابی شبکه های کامپیوتری
سیستم های انتقال و ارتباطات هوشمند
مباحث ویژه در شبکه های کامپیوتری
سایر :

الگوریتم و محاسبات
بیوانفورماتیک و محاسبات علمی
تجارت الکترونیک، دولت الکترونیک
آموزش از راه دور (آموزش الکترونیکی(
موتورهای گرافیکی، موتورهای بازی و انیمیشن
سیستم های چندرسانه ای، گرافیک و شبیه سازی

برق :
قدرت
کنترل
مخابرات
الکترونیک
مکاترونیک
مخابرات نوری
مهندسی پزشکی
تکنولوژی فشار قوی

پزشکی(بیوالکتریک)
ماشین های الکتریکی
هوش ماشین و رباتیک
کنترل و ابزار دقیق و اتوماسیون (ACI)
شیمی و مواد (CAM)
کنترل و حفاظت (CAP)
دیسپاچینگ و مخابرات (DTC)
بهره‌وری و مدیریت انرژی (EEM)

ماشین‌های الکتریکی (ELM)
محیط زیست، ایمنی و بهداشت (ENV)
تولید انرژی الکتریکی (EPG)
بازار برق (EPM)
پست‌های فشارقوی (HVS)
تکنولوژی اطلاعات (ITP)
مدیریت (MNG)

توزیع انرژی الکتریکی (PDS)
کیفیت برق (PQA)
برنامه‌ریزی و مطالعات سیستم (PSS)
انتقال انرژی الکتریکی (PTL)
انرژی‌های تجدیدپذیر (REN)
مطالعات اقتصادی و اجتماعی (SEA)
شبکه‌های هوشمند (SMG)
ترانسفورماتورهای قدرت و توزیع (TRN)

۲۱ آذر ۱۳۹۶/0 نظرها/توسط بهسان اندیش
http://behsanandish.com/wp-content/uploads/ITCOM01_poster.jpg 585 468 بهسان اندیش https://behsanandish.com/wp-content/uploads/logo-farsi-englisi-300x195-1.png بهسان اندیش2017-12-12 06:56:082019-08-22 23:57:48همایش بین المللی کامپیوتر، فناوری اطلاعات و برق
صفحه 10 از 10«‹8910

برگه‌ها

چیزی پیدا نشد

متاسفیم، محتوایی مناسب جستجوی شما یافت نشد



استخدام برنامه نویس آشنا به پردازش تصویر
بیمه + حقوق + پاداش

  • سامانه مدیریت پارکینگ خصوصی بهسان در شرکت توزیع برق شهر کرد۲ مرداد ۱۴۰۰ - ۰۵:۳۲
  • سامانه ثبت تردد جاده ای بهسان درشهرداری چرمهین۲۶ خرداد ۱۴۰۰ - ۱۱:۲۳
  • سامانه مدیریت پارکینگ خصوصی بهسان در شرکت توزیع برق شهر کرد۱۳ خرداد ۱۴۰۰ - ۰۶:۰۸
  • سامانه جامع مدیریت پارکینگ بهسان۲۶ آبان ۱۳۹۹ - ۱۲:۱۴

دسته‌ها

  • آموزش پردازش تصویر در نرم افزار متلب (Matlab)
  • آموزش عمومی پردازش تصویر و بینایی ماشین
  • آموزش های زبان برنامه نویسی سی شارپ
  • آموزش های عمومی هوش مصنوعی
  • اخبار
  • بینایی ماشین (Machine Vision) و بینایی کامپیوتر
  • پردازش تصویر با کتابخانه متن باز OpenCV
  • پروژه ها و سورس کدهای پردازش تصویر و بینایی ماشین
  • پروژه ها و سورس کدهای هوش مصنوعی
  • تشخيص پلاک خودرو
  • تشخیص نوری کاراکتر و تشخیص دست خط
  • تشخیص هویت زیست سنجی
  • دسته‌بندی نشده
  • دوربین (camera)
  • مقالات
  • مقالات ، سمینارها و کنفرانس های پردازش تصویر
  • مقالات، سمینارها و کنفرانس های هوش مصنوعی
  • هوش محاسباتی
  • وبلاگ

تلفن های تماس:

تلفن: ۹۱۰۰۱۸۸۱(۰۳۱)
بازرگانی و فروش:۰۹۱۳۳۰۳۸۹۹۶
پشتیبانی: ۰۹۱۱۷۶۱۰۲۷۵

ساعات کاری

از شنبه تا چهارشنبه : ۰۹:۰۰ تا ۱۷:۰۰

پنچ شنبه ها : از ۰۹:۰۰ تا ۱۳:۳۰

پیوند ها :

  • درخواست دمو
  • مطالب و آموزش ها
  • همکاری با بهسان اندیش
  • درباره ما

محصولات :

  • پلاک خوان
  • نرم افزار ثبت تردد جاده ای
  • نرم افزار مدیریت پارکینگ
  • نرم افزار مدیریت کارواش
  • نرم افزار تعمیرگاه خودرو
  • نرم افزار جامع مدیریت باسکول
  • ماژول رله کنترل راهبند
تمامی حقوق مالکیت معنوی این ‌سایت برای شرکت بهسان اندیش سپهر، محفوظ است.
  • Instagram
  • Facebook
  • Youtube
  • Linkedin
  • Mail
رفتن به بالا