ردیابی شی تصاویر ویدیویی. بینایی ماشین با ترکیب روش های مربوط به پردازش تصویر و ابزارهای یادگیری ماشینی.، رایانه را قادر به درک هوشمند معنا و محتوای تصاویر می کند. ردیابی شی یک عمل اساسی برای بسیاری از کاربردهای سطح بالای بینایی ماشین مانند بازشناسی براساس حرکت.، نظارت خودکار.، نمایه گذاری فایل های ویدیویی.، ارتباطات متقابل انسان و رایانه.، نظارت ترافیکی و هدایت وسایل نقلیه است که امروزه در بالاترین سطح توجه خود قرار دارد.
در این پایان نامه الگوریتمی کارا جهت ردیابی شی در تصاویر ویدیویی با استفاده از ویژگی های رنگ و بافت. و به کمک دو شبکه عصبی توابع اساسی شعاعی ارائه شده است. در روش پیشنهادی ابتدا ناحیه ی شی توسط کاربر در فریم اول مشخص می گردد. سپس ناحیه ای هم مساحت با آن و در اطراف آن بعنوان زمینه در نظر گرفته می شود. پس از آن ویژگی های رنگ و بافت از نواحی شی و زمینه استخراج شده. و به شبکه عصبی توابع اساسی شعاعی اول آموزش داده شده و آزمایش می شود. خروجی شبکه عصبی اول تصویر دودویی خواهد بود که در آن شی از زمینه ی اطرافش بطور دقیقی جدا شده است. سپس ویژگی های رنگ و بافت ناحیه ی دقیق زمینه ی بدست آمده از مرحله ی قبل گسترش داده می شود. تا بتواند در برابر تغییرات زمینه در فریم های بعدی مقاوم گردد.
در ادامه
از ویژگی های شی و زمینه ی گسترش داده شده برای آموزش شبکه ی عصبی توابع اساسی شعاعی دوم استفاده می گردد. از شبکه عصبی توابع اساسی شعاعی آموزش داده شده ی دوم بعنوان یک تابع امتیاز دهی استفاده می گردد. که مقادیر بیشتر در آن بیانگر بالاتر بودن احتمال تعلق آن پیکسل به شی است. و از آن برای تشخیص پیکسل های شی در فریم بعد استفاده شده است.
در روش پیشنهادی از مرکز ثقل شی و پروسه ی جابجایی میانگین برای مکان یابی شی استفاده شده است. از آنجا که بافت و رنگ شی و پس زمینه در طول ردیابی و در فریم های بعدی یکسان باقی نخواهد ماند با معرفی و سنجش معیارهایی تغییرات. در مدل و اندازه ی شی بروز رسانی می گردد. نتایج بدست آمده بیانگر این است که روش پیشنهادی قابلیت ردیابی مطمئن شی را با دوربین متحرک. و با وجود پوشیدگی های جزئی شی و تغییرات تدریجی در رنگ و بافت شی و زمینه خواهد داشت و تغییرات در اندازه ی شی را نیز بخوبی جبران می کند.
همچنین نتایج بیانگر این است که روش پیشنهادی. عملکرد بهتری در مقایسه با روش های جابجایی میانگین و تطابق قالب دارد. علاوه بر این.، روش پیشنهادی ناحیه ی اشغال شده در هر فریم توسط شی را فراهم می کند که از آن می توان در پردازش های مرتبه بالاتر مانند تشخیص.، تعبیر و تفسیر نوع رفتار شی و نظایر آن استفاده نمود.
1- ردیابی شی و کاربردهای آن 2
مقدمه 2
1-1- تعریف ردیابی شی 2
2-1- کاربردهای ردیابی شی 3
1-2-1- بازشناسی براساس حرکت 3
2-2-1- نظارت خودکار 3
3-2-1- نمایه گذاری فایل های ویدیویی 4
4-2-1- ارتباطات متقابل انسان و رایانه 4
5-2-1- نظارت ترافیکی 4
6-2-1- هدایت وسایل نقلیه 4
7-2-1- کاربردهای دیگر 4
3-1- اهداف پایان نامه 5
4-1- ساختار پایان نامه 5
جمع بندی 5
2- مروری بر پیشینه ی تحقیق 7
مقدمه 7
1-2- طبقه بندی روش های ردیابی 7
1-1-2- ردیابی نقاط 9
1-1-1-2- روش های قطعی 10
2-1-1-2- روش های آماری 11
2-1-2- ردیابی براساس هسته 12
1-2-1-2- روش های تطابق قالب 12
2-2-1-2- روش های مبتنی بر ویژگی 14
3-2-1-2- روش های مدل های چندتایی 18
3-1-2-ردیابی سیاه نما 20
1-3-1-2- روش های تطابق شکل 20
2-3-1-2- روش های ردیابی کانتور 22
4-1-2- روش های تفریق فریم و تفریق زمینه 23
2-2- ویژگی های بکار رفته در ادبیات تحقیق 24
2-2-2- بافت 24
3-2-2- لبه 25
4-2-2- شار نوری 25
3-2- پیچیدگی ها و موانع مساله ی ردیابی شی 25
1-3-2- کاهش ابعاد 26
2-3-2- حرکت دوربین 26
3-3-2- تغییرات روشنایی صحنه 26
4-3-2- ساختار غیرصلب شی 26
5-3-2- حرکات پیچیده و ناگهانی شی 26
6-3-2- تغییر شکل و اندازه ی شی 27
7-3-2- پوشیدگی شی 27
8-3-2- التزامات پردازش بهنگام 27
جمع بندی 27
3- روش پیشنهادی و جزئیات پیاده سازی 30
مقدمه 30
1-3- فرضیات پژوهش و مروری بر روش پیشنهادی 30
2-3- انتخاب نواحی شی و زمینه 32
3-3- استخراج ویژگی 35
1-3-3- پیش پردازش 35
2-3-3- رنگ 35
1-2-3-3- فضای رنگی R-G-B 36
2-2-3-3- فضای رنگی H-S-V 37
3-3-3- بافت 38
1-3-3-3- روش های استخراج بافت 39
2-3-3-3- انواع تصاویر بافتی 40
3-3-3-3- توصیفگرهای بافت بکار گرفته شده 41
4-3- جدا کردن شی از زمینه 45
1-4-3- دلایل جداسازی شی از زمینه 46
2-4-3- ساختار شبکه عصبی توابع اساسی شعاعی برای جدا سازی شی از زمینه 46
3-4-3- نحوه ی جدا سازی شی از زمینه با استفاده از شبکه عصبی توابع اساسی شعاعی50
4-4-3- انتخاب اندازه پنجره ی بهینه برای استخراج بافت و یافتن تعداد نرون بهینه برای شبکه
عصبی توابع اساسی شعاعی اول 54
5-3- گسترش زمینه 57
1-5-3- دلایل انجام گسترش زمینه 57
2-5-3- گسترش ویژگی های زمینه در فضای ویژگی 59
3-5-3- ساختار شبکه عصبی توابع اساسی شعاعی دوم برای امتیاز دهی به پیکسل ها در فریم های
بعدی 61
4-5-3- بهینه سازی شبکه عصبی توابع اساسی شعاعی دوم 67
6-3- مکان یابی شی 71
1-6-3- جابجایی میانگین 72
7-3- بروز رسانی تغییرات در اندازه و مدل شی 73
1-7-3- بروز رسانی تغییرات در اندازه شی 73
2-7-3- بروز رسانی مدل شی 75
جمع بندی 76
4- آزمایش ها و نتایج 78
مقدمه 78
1-4- شرایط انجام آزمایشات 78
2-4- تغییرات در اندازه ی شی 79
3-4- پوشیدگی جزیی 82
4-4- تغییرات زمینه و بروز رسانی مدل شی و زمینه 86
5-4- حرکات دوربین 96
6-4- ردیابی در دنباله ی تصاویر مادون قرمز 102
7-4- ردیابی در دنباله ی تصاویر نویزی 104
8-4- بررسی و مقایسه ی سرعت الگوریتم 108
9-4- موارد ردیابی اشتباه 110
جمع بندی 113
5- نتیجه گیری و پیشنهادات 115
منابع و مآخذ 118
تصویر ویدئویی , بینایی ماشین , جابجایی میانگین ,ردیابی , سیستم یادگیری , تابع توزیع شعاعی , video image , machine vision , mean shift , tracking , learning system , radial distribution function