بایگانی برچسب برای: قطعه بندی

قطعه بندی قسمت دوم OCR

 ﻗﻄﻌﻪ ﺑﻨﺪی :

ﻣﺮﺣﻠﺔ ﭘﻴﺶ ﭘﺮﺩﺍﺯﺵ ﻳﻚ ﺗﺼﻮﻳﺮ ﺍﺻﻼﺡ ﺷﺪﻩ ﺍﺯ ﺳﻨﺪ ﺭﺍ ﻧﺘﻴﺠﻪ ﻣﻲ ﺩﻫﺪ ﺑﮕﻮﻧﻪ ﺍﻱ ﻛﻪ ﻣﻘﺪﺍﺭ ﻛﺎﻓﻲ ﺍﺯ اطلاعات ﺷﻜﻠﻲ، ﻓﺸﺮﺩﻩ ﺳﺎﺯﻱ ﺑﺎﻻ ﻭ ﻧﻮﻳﺰ ﭘﺎﻳﻴﻦ، ﺍﺯ ﺗﺼﻮﻳﺮ ﻧﺮﻣﺎﻟﻴﺰﻩ ﺷﺪﺓ ﺳﻨﺪ ﻗﺎﺑﻞ ﺣﺼﻮﻝ است. ﻗﻄﻌﻪ ﺑﻨﺪی ﻳﻚ ﻣﺮﺣﻠﺔ ﺑﺴﻴﺎﺭ ﺑﺎ ﺍﻫﻤﻴﺖ ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻣﺨﺼﻮﺻﺎﹰ ﺣﺮﻭﻑ ﻓﺎﺭﺳﻲ ﻭ ﻋﺮﺑﻲ ﻛﻪ ﺑﺼﻮﺭﺕ ﭘﻴﻮﺳﺘﻪ ﻧﻮﺷﺘﻪ ﻣﻲ ﺑﺎﺷﺪ؛ ﭼﺮﺍ ﻛﻪ ﻧﺘﻴﺠﺔ ﺑﺪﺳﺖ ﺁﻣﺪﻩ ﺍﺯ ﺟﺪﺍﺳﺎﺯﻱ ﻛﻠﻤﺎﺕ، ﺧﻄﻮﻁ ﻳﺎ ﻛﺎﺭﺍﻛﺘﺮﻫﺎ ﻣﺴﺘﻘﻴﻤﺎً ﺑﺮ ﺭﻭﻱ ﻧﺮﺥ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺳﻴﺴﺘﻢ ﺗﺄﺛﻴﺮ ﻣﻲ ﮔﺬﺍﺭﺩ. ﻗﻄﻌﻪ ﺑﻨﺪی ﻏﻠﻂ ﻛﺎﺭﺍﻛﺘﺮﻫﺎ، ﻋﺎﻣﻞ ﺑﺴﻴﺎﺭﻱ ﺍﺯ ﺧﻄﺎﻫﺎﻱ OCR است.
مانند : nr →  mیا m →  nr
ﻣﻴﺰﺍﻥ ﺩﻗﺖ ﻳﻚ ﺍﻟﮕﻮﺭﻳﺘﻢ ﻗﻄﻌﻪ ﺑﻨﺪی ﺑﻪ ﺳﺒﻚ ﻧﮕﺎﺭﺵ ﺣﺮﻭﻑ، ﻛﻴﻔﻴﺖ ﺩﺳﺘﮕﺎﻩ ﭘﺮﻳﻨﺖ، ﻛﺎﺭﺍﻛﺘﺮﻫﺎﻱ ﺍﻳﺘﺎﻟﻴﻚ ﻟﻜﻪ ﺷﺪﻩ و ﻧﻴﺰ ﻧﺴﺒﺖ ﺍﻧﺪﺍﺯﺓ ﻓﻮﻧﺖ ﺑﻪ ﺭﺯﻭﻟﻮﺷﻦ ﺩﺳﺘﮕﺎﻩ ﺍﺳﻜﻨﺮ ﺑﺴﺘﮕﻲ ﺩﺍﺭﺩ.


ﺩﻭ ﻧﻮﻉ ﻗﻄﻌﻪ ﺑﻨﺪی ﻭﺟﻮﺩ ﺩﺍﺭﺩ :

الف ) ﻗﻄﻌﻪ ﺑﻨﺪی ﺑﻴﺮﻭﻧﻲ، ﻛﻪ ﻋﺒﺎﺭﺕ ﺍﺳﺖ ﺍﺯ ﺟﺪﺍﺳﺎﺯﻱ ﺑﺨﺸﻬﺎﻱ ﻣﺨﺘﻠﻒ ﻧﮕﺎﺭﺵ ﻣﺎﻧﻨﺪ ﭘﺎﺭﺍﮔﺮﺍﻓﻬﺎ، ﺟﻤﻼﺕ ﻳﺎ ﻛﻠﻤﺎﺕ
ب ) ﻗﻄﻌﻪ ﺑﻨﺪی درونی، ﻛﻪ ﻣﻨﻈﻮﺭ ﺍﺯ ﺁﻥ، ﺟﺪﺍﺳﺎﺯﻱ ﺣﺮﻭﻑ ﻛﻠﻤﺎﺕ ﻣﺨﺼﻮﺻﺎً ﺩﺭ ﻣﻮﺭﺩ ﻛﻠﻤﺎﺕ ﺳﺮ ﻫﻢ ﻧﻮﺷﺘﻪ ﺷﺪﻩ ﺩﺭ ﻣﺘﻮﻥ لاتین ﻭ ﻳﺎ ﺭﺳﻢﺍﻟﺨﻄﻬﺎﻱ ﭘﻴﻮﺳﺘﻪ ﻧﻈﻴﺮ ﻓﺎﺭﺳﻲ ﻭ ﻋﺮﺑﻲ می باشد.

ﻗﻄﻌﻪ ﺑﻨﺪی ﺑﻴﺮﻭﻧﻲ :

ﺩﺭ ﻣﻮﺍﺭﺩﻱ ﻫﻤﭽﻮﻥ ﻣﺘﻮﻥ ﻓﺎﺭﺳﻲ ﻛﻪ ﺣﺮﻭﻑ ﺑﺼﻮﺭﺕ ﺳﺮﻫﻢ ﻧﻮﺷﺘﻪ ﻣﻲ ﺷﻮﻧﺪ، ﺳﻪ ﺭﻭﻳﻜﺮﺩ ﻣﺨﺘﻠﻒ ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺑﺮﻭﻥ ﺧﻂ ﻣﺘﻮﻥ ﻛﻠﻤﺎﺕ ﻳﺎ ﺯﻳﺮكلمات ﻭﺟﻮﺩ ﺩﺍﺭﺩ.
الف ) ﺭﻭﻳﻜﺮﺩ ﻣﺒﺘﻨﻲ ﺑﺮ ﻗﻄﻌﻪ ﺑﻨﺪی ﻛﻠﻤﺎﺕ
ب ) ﺭﻭﻳﻜﺮﺩ ﻣﺒﺘﻨﻲ ﺑﺮ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻛﻠﻤﻪ ﺑﻪ ﻋﻨﻮﺍﻥ ﻳﻚ ﺍﻟﮕﻮﻱ ﻭﺍحد
ج ) ﺭﻭﻳﻜﺮﺩ ﺗﺮﻛﻴﺒﻲ

ﻗﻄﻌﻪ ﺑﻨﺪی درﻭﻧﻲ :

ﺩﺭ ﺭﻭﻳﻜﺮﺩ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﺒﺘﻨﻲ ﺑﺮ ﺟﺪﺍﺳﺎﺯﻱ، ﺍﺑﺘﺪﺍ ﻛﻠﻤﻪ ﺩﺭ ﻣﺮﺣﻠﺔ ﺟﺪﺍﺳﺎﺯﻱ ﺑﻪ ﺣﺮﻭﻑ ﻳﺎ ﺯﻳﺮ ﺣﺮﻭﻑ ﺷﻜﺴﺘﻪ ﻣﻲ ﺷﻮﻧﺪ.
ﺁﻧﮕﺎﻩ ﻗﻄﻌﺎﺕ ﺟﺪﺍ ﺷﺪﻩ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﻲ شوند و ﺍﺯ ﻛﻨﺎﺭ ﻫﻢ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻦ ﺁﻧﻬﺎ ﻛﻠﻤﻪ خواهد ﺷﺩ؛ ﺭﻭﺷﻬﺎﻱ ﺑﻜﺎﺭﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺩﺭ ﺍﻳﻦ ﺭﻭﻳﻜﺮﺩ ﺑﻪ ﺩﻭ ﮔﺮﻭﻩ ﻣﺨﺘﻠﻒ ﺗﻘﺴﻴﻢ ﻣﻲ ﺷﻮﻧﺪ :
–    ﺗﻘﻄﻴﻊ ﻛﻠﻤﻪ ﺑﻪ ﺣﺮﻭﻑ
–    ﺗﻘﻄﻴﻊ ﻛﻠﻤﻪ ﺑﻪ ﺯﻳﺮﺣﺮﻭﻑ
ﺩﺭ ﮔﺮﻭﻩ ﺍﻭﻝ ﻛﻠﻤﻪ ﺑﻪ ﺣﺮﻭﻑ ﺟﺪﺍﺳﺎﺯﻱ می ﺷﻮﺩ ﻭ ﺑﺎ ﺷﻨﺎﺳﺎﻳﻲ ﺣﺮﻭﻑ ﺟﺪﺍ ﺷﺪﻩ، ﻛﻠﻤﻪ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﻲ ﮔﺮﺩﺩ. ﺭﻭﻳﻜﺮﺩ ﺑﻜﺎﺭ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺩﺭ ﺍﻳﻦ ﮔﺮﻭﻩ ﺭﺍ ﺭﻭﻳﻜﺮﺩ ﻣﺒﺘﻨﻲ ﺑﺮ ﺟﺪﺍﺳﺎﺯﻱ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻣﻲ ﻧﺎﻣﻨﺪ.
ﺩﺭ ﮔﺮﻭﻩ ﺩﻭ، ﻛﻠﻤﻪ ﺑﻪ ﺯﻳﺮﺣﺮﻭﻑ ﻣﺜﻞ ﭘﺎﺭﻩ ﻣﻨﺤﻨﻲ ﻫﺎ ﻭ ﺳﺎﺧﺘﺎﺭﻫﺎﻱ ﭘﺎﻳﺔ ﺩﻳﮕﺮ ﺟﺪﺍﺳﺎﺯﻱ ﻣﻲ شود و ﺑﺎ ﺷﻨﺎﺳﺎﻳﻲ ﺯﻳﺮﺣﺮﻭﻑ ﻭ ﺗﺮﻛﻴﺐ ﺁﻧﻬﺎ ﻛﻠﻤﻪ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﻲ ﮔﺮﺩﺩ. ﺩﺭ ﺭﻭﻳﻜﺮﺩ ﺑﻜﺎﺭ گرفته شده در ﮔﺮﻭﻩ ﺩﻭﻡ ﻛﻪ ﺍﺻﻄﻼﺣﺎﹲ ﺟﺪﺍﺳﺎﺯﻱ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺗﻮﺃﻡ ﻧﺎﻣﻴﺪﻩ ﻣﻲ شود. نمیﺗﻮﺍﻥ ﺩﺭ ﺍﺑﺘﺪﺍ ﻣﺮﺯ ﺣﺮﻭﻑ ﺭﺍ ﺑﻄﻮﺭ ﻛﺎﻣﻞ ﻣﺸﺨﺺ ﻛﺮﺩ. ﺑﻠﻜﻪ ﺣﺮﻭﻑ ﺍﺯ ﺍﺑﺘﺪﺍ ﺑﻪ ﺍﻧﺘﻬﺎﻱ ﻛﻠﻤﻪ ﺑﻪ ﺗﺮﺗﻴﺐ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻭ  ﺟﺪﺍﺳﺎﺯﻱ ﻣﻲ ﺷﻮﻧﺪ. ﺩﺭ ﻫﻴﭽﻜﺪﺍﻡ ﺍﺯ ﺩﻭ ﺷﻜﻞ ﺭﻭﻳﻜﺮﺩ ﻣﺒﺘﻨﻲ ﺑﺮ ﺟﺪﺍﺳﺎﺯﻱ، ﺑﻪ ﺷﻜﻞ ﻛﻠﻲ ﻛﻠﻤﻪ ﺗﻮﺟﻬﻲ نمی ﺷﻮﺩ ﻭ ﺳﻌﻲ ﺑﺮ ﺁﻥ ﺍﺳﺖ ﻛﻪ ﺑﺎ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻳﻚ ﻛﻠﻤﻪ، ﺁﻥ ﻛﻠﻤﻪ ﺷﻨﺎﺧﺘﻪ ﺷﻮﺩ.
ﺩﺭ ﺭﻭﻳﻜﺮﺩ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻛﻠﻤﻪ ﺑﻪ ﻋﻨﻮﺍﻥ ﻳﻚ ﺍﻟﮕﻮﻱ ﻭﺍﺣﺪ، ﺗﻼﺷﻲ ﺑﺮﺍﻱ ﺗﻘﻄﻴﻊ ﻛﻠﻤﻪ ﺑﻪ ﺣﺮﻭﻑ ﻭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺣﺮﻭﻑ ﻣﻮﺟﻮﺩ ﺩﺭ ﻛﻠﻤﻪ ﺻﻮﺭﺕ ﻧﻤﻲ ﮔﻴﺮﺩ ﻭ ﻛﻠﻤﻪ ﺩﺭ ﻗﺎﻟﺐ ﻳﻚ ﺍﻟﮕﻮ ﺑﺮﺭﺳﻲ ﻣﻲ گردد.
ﺭﻭﺷﻬﺎﻱ ﺑﻜﺎﺭ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺩﺭ ﺍﻳﻦ ﺭﻭﻳﻜﺮﺩ ﺭﺍ ﻣﻲ ﺗﻮﺍﻥ ﺑﻪ ﺩﻭ ﮔﺮﻭﻩ ﺗﻘﺴﻴﻢ ﻛﺮﺩ :
ﮔﺮﻭﻩ ﺍﻭﻝ ﺭﻭﺷﻬﺎﻳﻲ ﻫﺴﺘﻨﺪ ﻛﻪ ﺗﺼﻮﻳﺮ ﻛﻠﻤﻪ ﺭﺍ ﺑﺼﻮﺭﺕ ﻳﻚ ﺍﻟﮕﻮﻱ ﺩﻭ ﺳﻄﺤﻲ ( ﺑﺎﻳﻨﺮﻱ ) ﻳﺎ ﺑﺎ ﺳﻄﻮﺡ ﺧﺎﻛﺴﺘﺮﻱ ﺩﺭ    ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﻭ ﺍﺯ ﺭﻭﺷﻬﺎﻱ ﻣﻌﻤﻮﻝ ﺩﺭ ﺷﻨﺎﺳﺎﻳﻲ ﺗﺼﺎﻭﻳﺮ ﻛﻪ ﻣﻌﻤﻮﻻً ﻣﺒﺘﻨﻲ ﺑﺮ ﺗﻮﺍﺑﻊ ﻓﺎﺻﻠﻪ ﻣﻲ ﺑﺎﺷﻨﺪ ﻭ ﻳﺎ ﺭﻭﺷﻬﺎﻳﻲ ﻫﻤﭽﻮﻥ ﺷﺒﻜﻪ ﻋﺼﺒﻲ ﻭ ﻏﻴﺮﻩ ﺍﺳﺘﻔﺎﺩﻩ ﻣﻲ ﻧﻤﺎﻳﻨﺪ.
ﮔﺮﻭﻩ ﺩﻭﻡ ﺭﻭﺷﻬﺎﻱ ﻣﺒﺘﻨﻲ ﺑﺮ ﭘﺮﺩﺍﺯﺵ ﺳﻴﮕﻨﺎﻟﻬﺎﻱ ﺗﺼﺎﺩﻓﻲ ﻫﺴﺘﻨﺪ. ﺍﻳﻦ ﺭﻭﺷﻬﺎ ﺍﺑﺘﺪﺍ ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﮔﻔﺘﺎﺭ ﺑﻜﺎﺭ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﻭ ﺳﭙﺲ ﺩﺭ ﺯﻣﻴﻨﺔ ﺑﺎﺯﺷﻨﺎﺳﻲ ﻛﻠﻤﺎﺕ ﻣﺨﺼﻮﺻﺎً ﻛﻠﻤﺎﺕ ﺩﺳﺘﻨﻮﻳﺲ لاتین ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻪ اند.

ﺑﺨﺸﻬﺎی ﻣﺨﺘﻠﻒ ﻳک ﺳﻴﺴﺘﻢ OCRﻛﺎﻣﻞ و انواع آن

ﺍﻧﻮﺍﻉ ﺳﻴﺴﺘﻤﻬﺎی OCR

ﺩﺭ ﻳﻚ ﺗﻘﺴﻴﻢ كلی می توان سیستمهای OCR را به ﻟﺤﺎﻅ ﻧﻮﻉ ﺍﻟﮕﻮﻱ ﻭﺭﻭﺩﻱ ﺑﻪ ﺩﻭ ﮔﺮﻭﻩ ﺍﺻﻠﻲ ﺗﻘﺴﻴﻢ ﻛﺮﺩ :
الف ) ﺳﻴﺴﺘم های ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﺘﻮﻥ ﭼﺎﭘﻲ
ب ) ﺳﻴﺴﺘم های ﺑﺎﺯﺷﻨﺎﺳﻲ ﻣﺘﻮﻥ ﺩﺳﺘﻨﻮﻳﺲ
ﻫﺮ ﻳﻚ ﺍﺯ ﺍﻳﻦ ﮔﺮﻭﻫﻬﺎ ﺗﻜﻨﻴﻜﻬﺎﻱ ﺧﺎﺹ ﺧﻮﺩ ﺭﺍ ﺩﺍﺭﻧﺪ. همچنین ﺍﺯ ﺟﻨﺒﺔ ﻧﺤﻮﺓ ﻭﺭﻭﺩ اطلاعات، سیستمهای OCR به دو دسته زیر تقسیم میﺷﻮﻧﺪ :
الف ) ﺳﻴﺴﺘﻤﻬﺎﻱ ﺑﺮﺧﻂ (OnLine)
ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺑﺮﺧﻂ، حروف در همان زمان نگارش ﺗﻮﺳﻂ ﺳﻴﺴﺘﻢ ﺗﺸﺨﻴﺺ ﺩﺍﺩه می شوند. دستگاههای ورودی ﺍﻳﻦ ﺳﻴﺴﺘﻤﻬﺎ ﻳﻚ ﻗﻠﻢ ﻧﻮﺭﻱ ﺍﺳﺖ. ﺩﺭ ﺍﻳﻦ ﺭﻭﺵ ﻋﻼﻭﻩ ﺑﺮ اطلاعات ﻣﺮﺑﻮﻁ ﺑﻪ ﻣﻮﻗﻌﻴﺖ قلم، اطلاعات ﺯﻣﺎﻧﻲ ﻣﺮﺑﻮﻁ ﺑﻪ ﻣﺴﻴﺮ ﻗﻠﻢ ﻧﻴﺰ ﺩﺭ ﺍﺧﺘﻴﺎﺭ می باشد. ﺍﻳﻦ اطلاعات ﻣﻌﻤﻮﻻً ﺗﻮﺳﻂ ﻳﻚ صفحه Digitizer اخذ می شوند.
ﺩﺭ ﺍﻳﻦ ﺭﻭﺵ ﻣﻲ توان ﺍﺯ اطلاعات ﺯﻣﺎﻧﻲ، ﺳﺮﻋﺖ، شتاب، ﻓﺸﺎﺭ ﻭ ﺯﻣﺎﻥ برداشتن و گذاشتن قلم روی صفحه در بازشناسایی استفاده كرد.
ب ) ﺳﻴﺴﺘﻤﻬﺎﻱ ﺑﺮﻭﻥ ﺧﻂ (OutLine)
ﺩﺭ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺑﺮﻭﻥ خط، ﺍﺯ ﺗﺼﻮﻳﺮ ﺩﻭ ﺑﻌﺪی ﻣﺘﻦ ﻭﺭﻭﺩی ﺍﺳﺘﻔﺎﺩﻩ ﻣﻲشود. ﺩﺭ ﺍﻳﻦ ﺭﻭﺵ ﺑﻪ ﻫﻴﭻ ﻧﻮﻉ ﻭﺳﻴﻠﻪ ﻧﮕﺎﺭﺵ ﺧﺎﺻﻲ ﻧﻴﺎﺯ ﻧﻴﺴﺖ ﻭ ﺗﻔﺴﻴﺮ ﺩﺍﺩﻩ ﻣﺴﺘﻘﻞ ﺍﺯ ﻓﺮﺁﻳﻨﺪ ﺗﻮﻟﻴﺪ ﺁﻧﻬﺎ ﺗﻨﻬﺎ ﺑﺮﺍﺳﺎﺱ ﺗﺼﻮﻳﺮ ﻣﺘﻦ ﺻﻮﺭﺕ ﻣﻲ’گیرد. ﺍﻳﻦ ﺭﻭﺵ ﺑﻪ ﻧﺤﻮﺓ ﺑﺎﺯﺷﻨﺎﺳﻲ ﺗﻮﺳﻂ انسان ﺷﺒﺎﻫﺖ ﺑﻴﺸﺘﺮﻱ ﺩﺍﺭﺩ.


ﺑﺨﺸﻬﺎی ﻣﺨﺘﻠﻒ ﻳﻚ ﺳﻴﺴﺘﻢ OCR ﻛﺎﻣﻞ 

ﻳﻚ ﺳﻴﺴﺘﻢ OCR ﻛﺎﻣﻞ مركب از 5 ﻗﺴﻤﺖ ﺍﺻﻠﻲ زیر می باشد :

الف ) ﭘﻴﺶ ﭘﺮﺩﺍﺯﺵ  (Preprocessing):
ﺷﺎﻣﻞ ﻛﻠﻴه ﺍﻋﻤﺎﻟﻲ ﻛﻪ ﺭﻭﻱ ﺳﻴﮕﻨﺎﻝ ﺗﺼﻮﻳﺮﻱ ﺧﺎﻡ ﺻﻮﺭﺕ ﻣﻲ ﮔﻴﺮﻧﺪ ﺗﺎ موجب ﺗﺴﻬﻴﻞ ﺭﻭﻧﺪ ﺍﺟﺮﺍﻱ ﻓﺎﺯﻫﺎﻱ ﺑﻌﺪﻱﮔﺮﺩﻧﺪ؛ ﻣﺎﻧﻨﺪ ﺑﺎﻳﻨﺮﻱ ﻛﺮﺩﻥ ﺗﺼﻮﻳﺮ ، ﺣﺬﻑ ﻧﻮﻳﺰ ، ﻫﻤﻮﺍﺭﺳﺎﺯﻱ، ﻧﺎﺯﻛﺴﺎﺯﻱ ، ﺗﺸﺨﻴﺺ ﺯﺑﺎﻥ ﻭ ﻓﻮﻧﺖ ﻛﻠﻤﺎﺕ و ﻧﻈﺎﻳﺮ ﺍﻳﻨﻬﺎ.

ب) قطعه بندی (Segmentation) :
ﻋﺒﺎﺭﺕ ﺍﺳﺖ ﺍﺯ ﺭﻭﺷﻬﺎﻳﻲ ﻛﻪ ﺑﺨﺸﻬﺎﻱ ﻣﺨﺘﻠﻔﻲ ﻫﻤﭽﻮﻥ ﭘﺎﺭﺍﮔﺮﺍﻓﻬﺎ، ﺟﻤﻼﺕ ﻳﺎ ﻛﻠﻤﺎﺕ ﻭ ﺣﺮﻭﻑ ﺭﺍ ﺍﺯ ﺗﺼﻮﻳﺮﺳﻨﺪ ﺍﺳﺘﺨﺮﺍﺝ ﻣﻲ کنند.

ج ) ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻴﻬﺎ (Feature Extraction) :
ﻣﺠﻤﻮﻋﺔ از ﻛﻠیه ﻣﺤﺎﺳﺒﺎﺗﻲ است ﻛﻪ ﺭﻭﻱ ﺍﻟﮕﻮﻫﺎﻱ ﺑﺪﺳﺖ ﺁﻣﺪﻩ ﺍﺯ ﻣﺮحله ﭘﻴﺶ پردازش ﺍﻧﺠﺎﻡ ﻣﻲ شود ﺗﺎ ﺑﺮﺩﺍﺭ ﻭﻳﮋﮔﻴﻬﺎﻱ ﻣﺘﻨﺎﻇﺮ ﺑﺎ ﻫﺮ ﺍﻟﮕﻮ ﺗﻌﻴﻴﻦ گردد.

د ) ﺑﺎﺯﺷﻨﺎﺳﻲ ﺑﺎ ﻳﻚ ﻳﺎ ﭼﻨﺪ ﻃﺒﻘﻪ بندی كننده (Classification & Recognition):
ﺷﺎﻣﻞ ﺭﻭﺷﻬﺎﻳﻲ ﺑﺮﺍﻱ ﻣﺘﻨﺎﻇﺮ ﺳﺎﺧﺘﻦ ﻫﺮ ﻳﻚ ﺍﺯ ﺍﻟﮕﻮﻫﺎﻱ ﺑﺪﺳﺖ ﺁﻣﺪﻩ ﺍﺯ ﻣﺮﺣﻠﺔ ﺍﺳﺘﺨﺮﺍﺝ ﻭﻳﮋﮔﻴﻬﺎ ﺑﺎ ﻳﻜﻲ ﺍﺯ ﻛﻼﺳﻬﺎﻱ ﻓﻀﺎﻱ ﺍﻟﮕﻮﻫﺎﻱ ﻣﻮﺭﺩ ﺑﺤﺚ ﺍﺳﺖ ﻛﻪ ﺍﺯ ﻃﺮﻳﻖ ﻛﻤﻴﻨﻪ ﺳﺎﺧﺘﻦ ﻓﺎصله ﺑﺮﺩﺍﺭ ﻭﻳﮋﮔﻴﻬﺎی ﻫﺮ ﺍﻟﮕﻮ ﻧﺴﺒﺖ ﺑﻪ ﻳﻜﻲ ﺍﺯ ﺑﺮﺩﺍﺭﻫﺎﻱ ﻣﺮﺟﻊ ﻣﻮﺟﻮﺩ ﺩﺭ ﭘﺎﻳﮕﺎﻩ ﺩﺍﺩﻩ های ﺳﻴﺴﺘﻢ ﺍﻧﺠﺎﻡ ﻣﻲ ﮔﻴﺮﺩ.

هـ ) ﺑﻜﺎﺭﮔﻴﺮﻱ اطلاعات ﺟﺎﻧﺒﻲ (ﭘﺲ ﭘﺮﺩﺍﺯﺵ) :
ﻣﺎﻧﻨﺪ ﻣﺠﻤﻮﻋﻪ اطلاعات ﺁﻣﺎﺭﻱ ﻣﺮﺑﻮﻁ به رخداد حروف ، اطلاعات ﺩﺳﺘﻮﺭﻱ ﻭ ﻣﻌﻨﺎﻳﻲ.

منبع