در هر سیستمی و با هر عملکردی برای تصمیم گیری به داده های ورودی احتیاج داریم. این ورودی ها میتوانند از یک سنسور صوتی, سنسور فاصله سنج , سنسور مادون قرمز , میکروفن و با تصاویر ارسالی از یه دوربین باشد.
امروزه پردازش تصویر بهترین ابزار برای استخراج ویژگی ها و تحلیل موقعیت و در نهایت تصمیم گیری صحیح می باشد. در مورد انسان نیز به همین صورت است, اطلاعات از طریق چشم به مغز ارسال می شوند و مغز با پردازش این اطلاعات تصمیم نهایی را گرفته و فرمان را صادر می کند.
هدف از پردازش تصویر پیاده سازی عملکرد ذهن انسان در قبال داده ها و انجام پردازش های خاصی برای استخراج ویژگی مورد نیاز برای رسیدن به هدف از پیش تعیین شده می باشد.
کوچکترین جزء PIXEL است . پیکسل مخفف Picture Element به معنی المان تصویر است. یک تصویر متشکل از تعداد زیادی پیکسل است که در کنار هم قرار گرفته اند . در واقع زمانی که با یک دوربین دیجیتال عکس می گیرید اگر رزولوشن دوربین شما 640480x باشد به این معنی است که ماتریس با ابعاد 640480x در اختیار شماست که 640 پیکسل در طول و 480 پیکسل در عرض دارد . به ازای هر پیکسل یک سلول نوری در دوربین وجود دارد. شدت نور این سلول نوری مقدار عددی را برای این پیکسل تعیین می کند. به طور مثال به ازای رنگ سیاه مقدار صفر در پیکسل ذخیره می شود و به ازای رنگ سفید مقدار 255 در آن ذخیره می شود.
در معنای خاص آن پردازش تصویر عبارتست از هر نوع پردازش سیگنال که ورودی یک تصویر است مثل عکس یا صحنهای از یک فیلم. خروجی پردازشگر تصویر میتواند یک تصویر یا یک مجموعه از نشانهای ویژه یا متغیرهای مربوط به تصویر باشد. اغلب تکنیکهای پردازش تصویر شامل برخورد با تصویر به عنوان یک سیگنال دو بعدی و بکاربستن تکنیکهای استاندارد پردازش سیگنال روی آنها میشود. پردازش تصویر اغلب به پردازش دیجیتالی تصویر اشاره میکند ولی پردازش نوری و آنالوگ تصویر هم وجود دارند. این مقاله در مورد تکنیکهای کلی است که برای همه آنها به کار میرود. در هر سیستمی و با هر عملکردی برای تصمیم گیری به داده های ورودی احتیاج داریم. این ورودی ها میتوانند از یک سنسور صوتی, سنسور فاصله سنج , سنسور مادون قرمز , میکروفن و با تصاویر ارسالی از یه دوربین باشد. امروزه پردازش تصویر بهترین ابزار برای استخراج ویژگی ها و تحلیل موقعیت و در نهایت تصمیم گیری صحیح می باشد. در مورد انسان نیز به همین صورت است, اطلاعات از طریق چشم به مغز ارسال می شوند و مغز با پردازش این اطلاعات تصمیم نهایی را گرفته و فرمان را صادر می کند. هدف از پردازش تصویر پیاده سازی عملکرد ذهن انسان در قبال داده ها و انجام پردازش های خاصی برای استخراج ویژگی مورد نیاز برای رسیدن به هدف از پیش تعیین شده می باشد.
مقدمه تاریخچه پردازش تصویر از سال 1964 تاکنون، موضوع پردازش تصویر، رشد فراوانی کرده است. علاوه بر برنامه تحقیقات فضایی، اکنون از فنون پردازش تصویر، در موارد متعددی استفاده می شود. گر چه اغلب این مسائل با هم نامرتبط هستند، اما عموما نیازمند روش هایی هستند که قادر به ارتقای اطلاعات تصویری برای تعبیر و تحلیل انسان باشد. برای نمونه در پزشکی شیوه های رایانه ای Contrast تصویر را ارتقا می دهند یا این که برای تعبیر آسانتر تصاویر اشعه ایکس یا سایر تصاویر پزشکی، سطوح شدت روشنایی را با رنگ، رمز می کنند. متخصصان جغرافیایی نیز از این روش ها یا روش های مشابه برای مطالعه الگوهای آلودگی هوا که با تصویر برداری هوایی و ماهواره ای بدست آمده است، استفاده می کنند. در باستان شناسی نیز روش های پردازش تصویر برای بازیابی عکس های مات شده ای که تنها باقی مانده آثار هنری نادر هستند، مورد استفاده قرار می گیرد. در فیزیک و زمینه های مرتبط، فنون رایانه ای بارها تصاویر آزمایش های مربوط به موضوعاتی نظیر پلاسماهای پرانرژی و تصاویر ریزبینی الکترونی را ارتقا داده اند. کاربردهای موفق دیگری از پردازش تصویر را نیز می توان در نجوم، زیست شناسی، پزشکی هسته ای، اجرای قانون، دفع و صنعت بیان کرد. در اوایل دهه 60 سفینه فضایی رنجر 7 متعلق به ناسا شروع به ارسال تصاویر تلویزیونی مبهمی از سطح ماه به زمین کرد. استخراج جزئیات تصویر برای یافتن محلی برای فرود سفینه آپولو نیازمند اعمال تصمیماتی روی تصاویر بود. این کار مهم به عهده لابراتوار (JPL) Jet Propulsionقرار داده شد. بدین ترتیب زمینه تخصصی پردازش تصاویر رقومی آغاز گردید و مثل تمام تکنولوژیهای دیگر سریعاً استفاده های متعدد پیدا کرد. عملیات اصلی در پردازش تصویر فشردهسازی تصاویر برای ذخیرهسازی تصاویر باید حجم اطلاعات را تا جایی که ممکن است کاهش داد و اساس تمام روشهای فشردهسازی کنار گذاردن بخشهایی از اطلاعات و دادهها است. ضریب یا نسبت فشردهسازی است که میزان و در صد کنار گذاشتن اطلاعات را مشخص میکند. این روش ذخیرهسازی و انتقال اطلاعات را آسانتر میکند و پهنایباند و فرکانس مورد نیاز کاهش مییابد. امروزه روشهایی متعدد و پیشرفته برای فشردهسازی وجود دارد. فشردهسازی تصویر از این اصل مهم تبعیت میکند که چشم انسان حد فاصل دو عنصر تصویری نزدیک به هم را یکسان دیده و تمایز آنها را نمیتواند تشخیص دهد. همچنین اثر نور و تصویر برای مدت زمان معینی در چشم باقی مانده و از بین نمیرود که این ویژگی در ساخت تصاویر متحرک مورد توجه بودهاست. روش JPEG نام این فرم
پردازش تصویر
میتوان با استفاده از کامپیوتر، پردازش و تجزیه و تحلیل های رقمی انجام داد. این پردازش برای افزایش کیفیت داده ها و تفسیرهای چشمی انجام می گیرد. هم چنین میتوان موضوع یا اطلاعات به خصوصی را از تصویر به دست آورد که همگی به صورت خودکار توسط کامپیوتر انجام می گیرد.
تصاویر آنالوگ
تصاویری مانند عکس های هوایی که توسط سیستم های عکس برداری(دوربین) به دست می آیند. از آنجایی که در این عکس ها از فیلم عکاسی استفاده شده است، پس هیچ پردازشی نیاز ندارد.
تصاویر رقمی(دیجیتالی)
تصاویر سنجش شده که از تعداد زیادی مربعات کوچک(پیکسل) تشکیل شده اند. هر پیکسل دارای یک شماره رقمی(Digital Number) میباشد که بیانگر میزان روشنایی آن پیکسل است. به این نوع تصاویر، تصاویر رستری هم میگویند. تصاویر رستری دارای سطر و ستون می باشند.
یک تصویر را می توان توسط تابع دوبعدیf)x,y) که در آن X و Y را مختصات مکانی و مقدار f در هر نقطه را شدت روشنایی تصویر در آن نقطه می نامند. اصطلاح سطح خاکستری نیز به شدت روشنایی تصاویر مونوکروم اطلاق میشود. تصاویر رنگی نیز از تعدادی تصویر دوبعدی تشکیل می شود.
زمانی که مقادیر X و Y و مقدارf(x,y) با مقادیر گسسته و محدود بیان شوند، تصویر را یک تصویر دیجیتالی می نامند. دیجیتال کردن مقادیر X و Y را Sampling و دیجیتال کردن مقدارf(x,y) را quantization گویند.
برای نمایش یک تصویر M * N از یک آرایه دو بعدی( ماتریس) که M سطر و N ستون دارد استفاده می کنیم. مقدار هر عنصر از آرایه نشان دهنده شدت روشنایی تصویر در آن نقطه است. در تمام توابعی که پیاده سازی خواهیم کرد، هر عنصر آرایه یک مقدار 8 بیتی است که می تواند مقداری بین 0 و 255 داشته باشد. مقدار صفر نشان دهنده رنگ تیره(سیاه) و مقدار 255 نشان دهنده رنگ روشن(سفید) است.
به عنوان مثال تصویر زیر که سایز آن 288 * 265 است از یک ماتریس که دارای 288 سطر و 265 ستون است برای نمایش تصویر استفاده می کند.
هر پیکسل از این تصویر نیز مقداری بین 0 و 255 دارد. نقاط روشن مقادیری نزدیک به 255 و نقاط تیره مقادیر نزدیک به 0 دارد. همه توابع پردازش تصویر از این مقادیر استفاده کرده و اعمال لازم را بر روی تصویر انجام می دهند.
مقادیر پیکسلها
مقدار انرژی مغناطیسی که یک تصویر رقمی به هنگام تصویر برداری کسب میکند، رقم های دوتایی(Digit binary) یا بیت ها(Bits) را تشکیل میدهند که از قوه صفر تا 2 ارزش گذاری شده است. هر بیت، توان یک به قوه 2 (1بیت=21) میباشد.
حداکثر تعداد روشنایی بستگی به تعداد بیت ها دارد. بنابراین 8 بیت یعنی 256 شماره رقمی که دامنه ای از 0 تا 255 دارد. به همین دلیل است که وقتی شما تصویر رستری از سنجنده خاصی مانند TM را وارد نرم افزاری میکنید تغییرات میزان روشنایی را بین 0 تا 255 نشان میدهد.
دامنه تغییرات رنگ
مقدار پیکسل
نوع تصویر
0-255
28 = 256
8-bit image
0-65535
216 = 65536
16-bit image
0-16777215
224 = 16777216
24-bit image
دقت تصویر:
دقت تصویر بستگی به عدد پیکسل ها دارد. با یک تصویر ۲ بیتی، حداکثر دامنه روشنایی ۲۲ یعنی ۴ میباشد که دامنه آن از ۰ تا ۳ تغییر میکند. در این حالت تصویر دقت(تفکیک پذیری لازم) را ندارد. تصویر ۸ بیتی حداکثر دامنه ۲۵۶ دارد و تغییرات آن بین ۰ تا ۲۵۵ است. که دقت بالاتری دارد.
روش های پردازش تصاویر:
بخش بندی سطح خاکستری(Gray-Level Slicing)
فرض کنید می خواهیم مساحت کل جنگل های استان را تعیین کنیم. با فرض اینکه عکس هوایی از استان را داشته باشیم، می توانیم از بخش بندی سطح خاکستری استفاده کنیم. بدین صورت که با نمایان کردن سطوح خاکستری نشان دهنده جنگل ها و پایین آوردن شدت سطوح خاکستری دیگر نقاط تصویر، مساحت جنگل ها را محاسبه کنیم. نمودار زیر نحوه نگاشت مقادیر پیکسل ها ی تصویر ورودی را نشان می دهد.
همچنین از نمودار زیر نیز برای نگاشت مقادیر پیکسل های تصویر ورودی می توان استفاده کرد.
شکل نمودار فوق نشان می دهد که تصویر خروجی تولید شده توسط این نمودار یک تصویر باینری است.
ترمیم تصویر(Image restoration):
در بیشتر تصاویری که توسط ماهواره ها یا رادارها ثبت می گردند، اختلالاتی در تصویر به وجود می آید که به دلیل خش می باشد. دو اختلال مهم در تصاویر چند باندی، نواری شدن(Banding) و خطوط از جا افتاده می باشد.
نواری شدن(باندی شدن):
اشتباهی که توسط سنجنده، در ثبت و انتقال داده ها روی می دهد. و یا تغییر پیکسل در بین ردیف ها می تواند باعث ایجاد چنین اشتباهی گردد.
خطوط از جا افتاده( خطا در تصویر):
اشتباهی که در ثبت و انتقال داده ها روی می دهد و در نتیجه، یک ردیف پیکسل در عکس از بین می رود.
بالا بردن دقت عکس
یکی از کار های مهمی که در پردازش تصویر انجام می گردد، بالا بردن دقت عکس به منظور دید و تفسیر چشمی دقیق تر می باشد. روش های بسیاری برای نیل به این هدف وجود دارد ولی مهم ترین آنها، افزایش تباین(Contrast) تصویر و عملیات فیلتر کردن می باشد.
هیستوگرام تصویر
در هر تصویر رقمی، مقادیر پیکسل ها بیانگر خصوصیات آن تصویر(مانند میزان روشنایی تصویر و وضوح آن) می باشد. هیستوگرام تصویر در حقیقت بیان گرافیکی میزان روشنایی تصویر می باشد. مقادیر روشنایی(برای مثال 0-255) در طول محور X بیان شده و میزان فراوانی هر مقدار در محور Y بیان می گردد.
بالا بردن دقت عکس
یکی از کارهای مهمی که در پردازش تصویر انجام می گردد، بالا بردن دقت عکس به منظور دید و تفسیر چشمی دقیق تر می باشد. روش های بسیاری برای نیل به این هدف وجود دارد ولی مهم ترین آنها، افزایش تباین(Contrast) تصویر و عملیات فیلتر کردن می باشد.
هیستوگرام تصویر
در هر تصویر رقمی، مقادیر پیکسل ها بیانگر خصوصیات آن تصویر(مانند میزان روشنایی تصویر و وضوح آن) می باشد. هیستوگرام تصویر در حقیقت بیان گرافیکی میزان روشنایی تصویر می باشد.
مقادیر روشنایی(برای مثال 0-255) در طول محور Xبیان شده و میزان فراوانی هر مقدار در محور Y بیان می گردد.
بالا بردن دقت عکس:
یکی از کار های مهمی که در پردازش تصویر انجام می گردد، بالا بردن دقت عکس به منظور دید و تفسیر چشمی دقیق تر میباشد. روش های بسیاری برای نیل به این هدف وجود دارد ولی مهم ترین آنها، افزایش تباین(Contrast) تصویر و عملیات فیلتر کردن می باشد.
هیستوگرام تصویر:
در هر تصویر رقمی، مقادیر پیکسل ها بیانگر خصوصیات آن تصویر(مانند میزان روشنایی تصویر و وضوح آن) می باشد. هیستوگرام تصویر در حقیقت بیان گرافیکی میزان روشنایی تصویر می باشد.
مقادیر روشنایی(برای مثال 0-255) در طول محور X بیان شده و میزان فراوانی هر مقدار در محور Y بیان م
کد متلب تشخیص تومور با سگمنتیشن تصویر مغز با استفاده از Fuzzy k-means Clustering به صورت GUI (تصویر محصول را مشاهده نمایید.)
حاوی تصاویر لازم جهت تست برنامه
خط های برنامه حاوی توضیحات لازم به صورت کامنت هستند.
برای مشاهده نتایج کد شبیه سازی را در نرم افزار متلب Run نمایید.
کد متلب تبدیل (چرخش) تصویر در دو بعد
خط های برنامه حاوی توضیحات لازم به صورت کامنت هستند.
برای مشاهده نتایج کافیست کد را در نرم افزار متلب Run نمایید.
کد متلب واترمارک مرئی تصویر
خط های برنامه حاوی توضیحات لازم به صورت کامنت هستند.
برای اجرای برنامه ابتدا دو تصویر دلخواه را در پوشه محل کد برنامه قرار داده و سپس برنامه را اجرا نمایید.
فایل دانلودی حاوی مقاله ژورنالی راهنما است.
برای مشاهده نتایج کافیست کد را در نرم افزار متلب Run نمایید.
کد متلب حذف پس زمینه تصویر با الگوریتم EM
خط های کد برنامه دارای توضیحات لازم به صورت کامنت هستند.
برای مشاهده نحوه عملکرد برنامه تصاویر محصول را با هم مقایسه نمایید.
برای نمایش نتایج کافیست کد برنامه را در نرم افزار متلب Run نمایید.
کد متلب اعمال White Balance به تصویر
کد متلب حاضر ابتدا بهره White Balance را محاسبه کرده و سپس آن را به تصویر اعمال می کند; سپس تصاویر ورودی و خروجی نمایش داده می شود.
کد های متلب دارای توضیحات لازم به صورت کامنت هستند.
برای مشاهده نتایج خروجی، کافیست کد را در نرم افزار اجرا نمایید.
کتاب فشرده سازی تصویر با Wavelet سال انتشار (2013)
نویسنده: W. A. Pearlman
فایل PDF کتاب به زبان انگلیسی و در 92 صفحه است.
فایل PDF با بهترین کیفیت و با قابلیت جستجو در متن و کپی برداری از متن است.
کد متلب محاسبه بهره وایت بالانس (White Balance) و اعمال آن به تصویر
خروجی های برنامه تصویر اصلی و تصویر با وایت بالانس اعمال شده در دو تصویر جداگانه است.
کد های متلب حاوی توضیحات لازم به صورت کامنت به زبان انگلیسی هستند.
برای مشاهده خروجی های برنامه کافیست کد را در نرم افزار MATLAB اجرا نمایید.