پردازش تصویر از دید پیکسلها

saalek110

Well-Known Member
پردازش تصویر از دید پیکسلها

احتمال زیاد مطالب این تاپیک از هوش مصنوعی deepseek است.
 

saalek110

Well-Known Member
دنیای آنها:

درست متوجه شدم، می‌خواهی پردازش تصویر را نه از دید فرمول‌های پیچیده، بلکه از زاویه‌ی دید خودِ پیکسل‌ها ببینی. اینکه چه بلایی سرشان می‌آید و چطور «شخم زده می‌شوند».

بیا این ماجرا را مثل یک جامعه‌ی بزرگ از آدم‌ها (پیکسل‌ها) تصور کنیم که روی یک بوم زندگی می‌کنند.

---

جامعه‌ی پیکسل‌ها را چطور تغییر می‌دهیم؟

هر پیکسل یک شهروند است با یک شناسنامه: مختصات (x, y) که می‌گوید کجا ایستاده و یک مقدار شدت روشنایی (در تصاویر خاکستری) یا یک بردار رنگ (R, G, B) که شخصیت او را مشخص می‌کند.
پردازش تصویر یعنی اعمال یک «قانون» یا «بخشنامه» روی این جامعه. این بخشنامه‌ها به دو دسته‌ی کلی تقسیم می‌شوند:

۱. عملیات نقطه‌ای: «خودت را تغییر بده، همسایه‌ات مهم نیست»

در این روش، هر پیکسل فقط به شناسنامه‌ی خودش نگاه می‌کند و آن را عوض می‌کند. اصلاً کاری ندارد که پیکسل کناری‌اش چه رنگی است. این می‌شود دستکاری کل پیکسل‌ها به صورت جداگانه.

مثال‌ها از زبان یک پیکسل:

· تنظیم روشنایی: «به من گفتند مقدار R, G, B خودت را بگیر و با یک عدد ثابت جمع کن. شده‌ام روشن‌تر. همسایه‌ام هم همین کار را کرد.»
· افزایش کنتراست: «گفتند اگر روشن هستم، روشن‌تر شوم، اگر تاریکم، تاریک‌تر. هرکسی خودش این کار را کرد.»
· منفی کردن تصویر: «گفتند هر رنگ را از ۲۵۵ کم کن. من که سفید بودم، سیاه شدم.»
· تصحیح گاما (Gamma Correction): «یک تابع غیرخطی روی تک‌تک ما اعمال شد.»

نتیجه: در این روش، تک‌تک پیکسل‌ها تحت تأثیر قرار می‌گیرند و مقدارشان عوض می‌شود. هیچ پیکسلی دست‌نخورده باقی نمی‌ماند. کل جامعه تغییر هویت می‌دهد.

---

۲. عملیات همسایگی (فیلترها): «جلسه بگذارید و با همسایه‌ها تصمیم بگیرید»

اینجاست که ماجرا جالب می‌شود. یک «پنجره» یا «ماسک» (مثلاً یک مربع ۳x۳) روی تصویر حرکت می‌کند. مرکز این پنجره روی هر پیکسل که قرار بگیرد، آن پیکسل باید با همسایه‌هایش جلسه بگذارد. مقدار جدیدش بر اساس «رأی‌گیری» یا «میانگین» نظرات همسایه‌ها تعیین می‌شود.

اینجا دیگر همه پیکسل‌ها لزوماً تغییر نمی‌کنند، بلکه ممکن است فقط آن‌هایی که در شرایط خاص هستند، دستکاری شوند، یا همه تغییر کنند اما ماهیت تغییرشان وابسته به اطرافشان است.

مثال‌ها از زبان یک پیکسل:

· فیلتر میانگین (Blur): «به من گفتند بنشین با ۸ تا همسایه‌ات، رنگ‌هاتان را جمع بزنید و تقسیم بر ۹ کنید. من که یک پیکسل تیز و نویز بودم، الان محو و همرنگ جماعت شدم.» → اینجا همه پیکسل‌ها مقدار جدید می‌گیرند، حتی اگر شبیه قبل باشند.
· فیلتر میانه (Median Filter): «گفتند رنگ‌های خودت و ۸ همسایه‌ات را ردیف کن، آنی که وسط می‌ایستد را انتخاب کن. من که یک پیکسل «فلفل نمکی» (نویز) بودم و با بقیه فرق داشتم، حذف شدم و شبیه بقیه شدم.» → همه تغییر می‌کنند، ولی پیکسل‌های نویز حسابی ادب می‌شوند.
· فیلتر لاپلاسین (تشخیص لبه): «از ما خواستند ببینیم چقدر با همسایه‌ها اختلاف داریم. من که یک پیکسل در یک سطح صاف کنار همسایه‌های همرنگم بودم، اختلافم صفر شد (سیاه شدم). اما آن یکی که لب یک لبه بود، اختلافش زیاد شد (سفید درخشان).» → اینجا بیشتر پیکسل‌ها سیاه (صفر) می‌شوند و فقط آنهایی که در لبه‌ها هستند، سفید (دستکاری شده) می‌شوند. عملاً بخش عظیمی از پیکسل‌ها به صفر تبدیل می‌شوند.

---

جمع‌بندی نهایی: کی همه را دستکاری می‌کنیم، کی بعضی را؟

دسته‌بندی کلی چه بلایی سر جامعه پیکسل‌ها می‌آید؟ مثال کدام پیکسل‌ها شخم زده می‌شوند؟
عملیات نقطه‌ای یک بخشنامه‌ی عمومی و یکسان برای همه صادر می‌شود. تغییر روشنایی، کنتراست، منفی کردن، تصحیح گاما تک‌تک پیکسل‌ها، بدون استثنا. مقدار همه تغییر می‌کند.
فیلترهای سراسری (Global Filters) هر پیکسل با همسایه‌هایش یک کار تکراری انجام می‌دهد. هموارسازی (Blur)، نویززدایی (Median)، شارپ کردن همه پیکسل‌ها مقداری جدید می‌گیرند، حتی اگر خیلی جزئی باشد. کل بوم یک دست تغییر می‌کند.
فیلترهای انتخابی (Selective Filters) قانون می‌گوید «اگر در یک لبه هستی، خودی نشان بده». تشخیص لبه (Edge Detection)، آستانه‌گذاری تطبیقی تنها پیکسل‌هایی که شرط خاصی دارند مقدار چشمگیر می‌گیرند. بقیه یا صفر می‌شوند یا دست‌نخورده می‌مانند.
عملیات مورفولوژیک (Morphology) «شما که در مرز بین سیاه و سفید هستید، یا حذف می‌شوید (Erosion) یا تکثیر می‌شوید (Dilation)». سایش (Erosion)، گسترش (Dilation)، باز کردن، بستن فقط پیکسل‌های مرزی. پیکسل‌هایی که در عمق یک ناحیه‌ی بزرگ هستند، اصلاً تکان نمی‌خورند.

پس به زبان ساده:

· می‌خواهی کل ملت تیره یا روشن شوند؟ از عملیات نقطه‌ای و فیلترهای سراسری استفاده کن.
· می‌خواهی فقط مرزها مشخص شوند یا فقط نویزها حذف شوند و باقی ملت به حال خود رها شوند؟ از فیلترهای انتخابی و مورفولوژی استفاده کن.
 

saalek110

Well-Known Member
تغییر بر اساس پیکسل همسایه:
خیلی خوشحالم که از داستان خوشت اومد. حق با توئه، ماجرای همسایه‌ها از همه جذاب‌تره. بیا زیر ذره‌بین ببریمش و ببینیم در این «جلسات همسایگی»، دقیقاً چه بلایی سر پیکسل بیچاره می‌آید.

یادت باشد، اینجا یک پنجره داریم (مثلاً ۳×۳) که مثل یک گروه تحقیق و تفحص روی تصویر راه می‌رود و هر بار مرکزش را روی یک پیکسل می‌گذارد. حکم نهایی برای آن پیکسل، بر اساس وضعیت خودش و ۸ همسایه‌اش صادر می‌شود. این حکم‌ها چند مدل هستند:

---

۱. جلسه‌ی صلح و سازش (فیلترهای هموارکننده)

هدف: از بین بردن تنش و نویز (پیکسل‌های یاغی که با بقیه فرق دارند). در این جلسات، رأی اکثریت مهم است و پیکسل‌های تندرو وادار به سازش می‌شوند.

الف) دموکراسی محض (فیلتر میانگین - Mean/Box Filter)

· دستور جلسه: «همه‌ی ۹ نفر، رنگتان را بگویید. میانگین گرفته می‌شود و همه به آن رنگ درمی‌آیید.» (در واقع فقط پیکسل مرکزی تغییر می‌کند و به رنگ میانگین درمی‌آید، اما پنجره که حرکت می‌کند، همه به نوبت این بلا سرشان می‌آید).
· گفت‌وگوی پیکسل‌ها:
· پیکسل لبه (مرز بین سفید و سیاه): «من سفید بودم، همسایه‌هام نصفشون سیاه بودن. میانگین ما شد خاکستری. من الان محو و خاکستری شدم. لبه‌ی تیز دیگر وجود ندارد.»
· پیکسل نویز (یک نقطه سیاه در دل سفید): «من اشتباهی سیاه بودم، همه‌ی ۸ همسایه‌ام سفید بودن. میانگین ۹ تای ما شد تقریباً سفید! من دیگر سیاه نیستم، محو شدم و گم شدم توی جمع.»
· نتیجه: همه پیکسل‌ها تغییر می‌کنند و تصویر محو و بلوری (Blur) می‌شود. لبه‌های تیز و نویزها قربانی این صلح تحمیلی می‌شوند.

ب) دموکراسی مبتنی بر اکثریت مطلق (فیلتر میانه - Median Filter)

· دستور جلسه: «رنگ ۹ نفر را از تیره به روشن ردیف کنید. پیکسل وسطی، رئیس جلسه می‌شود و رنگش را به پیکسل مرکزی تحمیل می‌کند.»
· گفت‌وگوی پیکسل‌ها:
· پیکسل نویز (فلفل نمکی): «من یک نقطه‌ی سفیدِ درخشان بودم تو یه دشت سیاه. همه‌ی همسایه‌هام سیاه بودن. رنگ‌ها ردیف شد: سیاه، سیاه، سیاه... و آخر سر منِ سفید. پیکسل وسط این ردیف، یک سیاه پررنگ بود. پس من الان سیاه شدم! هویت قبلی‌ام کاملاً پاک شد.»
· پیکسل روی لبه: «من روی لبه بودم، نصف همسایه‌هام سفید، نصف دیگه سیاه. ردیف که کردیم، یکی از وسطی‌ها انتخاب شد. راستش خودم بودم! یا شاید یکی شبیه خودم. پس من تغییری نکردم، لبه سر جاش موند.»
· نتیجه: این فیلتر مثل یک پاک‌کننده‌ی هوشمند، فقط پیکسل‌های نویز (تندروها) را حذف می‌کند، ولی کاری به لبه‌های اصلی تصویر ندارد و آنها را تیز نگه می‌دارد. همه پیکسل‌ها بررسی می‌شوند، اما فقط آن‌هایی که افراطی هستند، تغییر اساسی می‌کنند.

---

۲. جلسه‌ی افشای اختلافات (فیلترهای تشخیص لبه)

هدف: لو دادن پیکسل‌هایی که با همسایه‌هایشان اختلاف فاحش دارند (لبه‌ها). اینجا صلح و سازش ممنوع است، برعکس، تشدید اختلافات هدف اصلی است.

الف) کارآگاه لاپلاسین (فیلتر لاپلاسین - Laplacian)

· دستور جلسه: «رنگ خودت را چهار برابر کن، بعد رنگ همسایه‌های بالا، پایین، چپ و راستت را از آن کم کن.»
· گفت‌وگوی پیکسل‌ها:
· پیکسل در دشت هموار (همه یکرنگ): «من ۱۰۰ هستم، همسایه‌هام ۱۰۰ هستند. حساب می‌کنم: ۴۰۰ - (۱۰۰+۱۰۰+۱۰۰+۱۰۰) = ۰. نتیجه صفر شد. من الان سیاه هستم. گویا هیچ اتفاقی اینجا نیفتاده.»
· پیکسل روی لبه (یک طرفش تاریک، یک طرف روشن): «من ۲۰۰ هستم. همسایه‌های چپ و بالا ۲۰۰، همسایه‌های راست و پایین ۰ هستند. حساب می‌کنم: (۴×۲۰۰) - (۲۰۰+۲۰۰+۰+۰) = ۸۰۰ - ۴۰۰ = ۴۰۰. وای این عدد خیلی بزرگه! من الان یک نور درخشان و سفید شدم. من یک لبه را لو دادم!»
· نتیجه: اینجا بخش عظیم جامعه (پیکسل‌های هموار) به صفر (رنگ سیاه) تبدیل می‌شوند و در واقع حذف می‌شوند. فقط پیکسل‌هایی که در مرز دو ناحیه‌ی متفاوت هستند، یک مقدار بزرگ می‌گیرند و مثل یک جرقه، لبه را فریاد می‌زنند. یک شخم عمیق و انتخابی.

---

۳. جلسه‌ی نبرد و بقا (عملیات مورفولوژیک)

اینجا تصویر سیاه و سفید است. پیکسل‌ها فقط دو دسته‌اند: پیش‌زمینه (سفیدها-شیء) و پس‌زمینه (سیاه‌ها-خلأ). عملیات‌ها مثل یک نبرد بر سر قلمرو هستند.

الف) سایش (Erosion) - «اگر حتی یک همسایه سیاه داری، سیاه می‌شوی!»

· دستور جلسه: «پیکسل مرکزی، خودت و همه‌ی ۸ همسایه‌ات را نگاه کن. فقط و فقط اگر همه‌تان سفید بودید، می‌توانی سفید بمانی. اگر حتی یک نفر سیاه بود، تو هم سیاه اعلام می‌شوی.»
· گفت‌وگوی پیکسل‌ها:
· پیکسل مرزی (سفیدِ لبه‌ی شیء): «من یک پیکسل سفیدم در مرز، خیلی حس خوبی داشتم. اما متأسفانه همسایه‌ی بغلی‌ام سیاه است. طبق قانون، من سیاه می‌شوم. انگار پس‌زمینه یک قدم به درون من خورده.»
· پیکسل عمق (سفیدِ تو دل جسم): «من و هشت همسایه‌ام همگی سفید و یکدستیم. هیچ سیاهی ما را تهدید نمی‌کند. من سفید می‌مانم و جان سالم به در می‌برم.»
· نتیجه: فقط پیکسل‌های لایه‌ی بیرونی سفیدها (مرزها) سیاه می‌شوند. جسم سفید، لاغرتر و کوچک‌تر می‌شود (می‌ساید). نویزهای سفید کوچک کاملاً از بین می‌روند.

ب) گسترش (Dilation) - «اگر حتی یک همسایه سفید داری، سفید می‌شوی!»

· دستور جلسه: «پیکسل مرکزی، خودت و همسایه‌ها را ببین. اگر حتی یک نفر سفید بود، تو هم سفید می‌شوی.»
· گفت‌وگوی پیکسل‌ها:
· پیکسل پس‌زمینه (سیاه کنار شیء): «من سیاهم و کنار یک جسم سفید هستم. یکی از همسایه‌هام سفیده. وای چه عالی، من سفید می‌شوم! انگار جسم بزرگ‌تر شده و من را بلعیده است.»
· پیکسل سیاه دورافتاده: «من و همه‌ی همسایه‌هام در این تاریکی مطلق سیاهیم. خبری از سفید نیست. من سیاه می‌مانم.»
· نتیجه: فقط پیکسل‌های سیاهی که در همسایگی یک سفید هستند، سفید می‌شوند. جسم سفید چاق‌تر می‌شود و حفره‌های سیاه ریز درونش پر می‌شوند.

---

خلاصه‌ی نهایی داستان همسایه‌ها:

· فیلتر میانگین: همه را وادار می‌کند با همسایه قاطی شوند. همه چیز محو می‌شود.
· فیلتر میانه: فقط تندروها و جاافتاده‌ها را ادب می‌کند، لبه‌ها را سالم می‌گذارد.
· فیلتر لبه: اکثریت خاموش (سطوح صاف) را سیاه می‌کند و فقط فریاد اختلاف در مرزها را آشکار.
· سایش/گسترش: یک نبرد بر سر قلمرو بین سیاه و سفید است که فقط ساکنان مرز را درگیر می‌کند.
 

saalek110

Well-Known Member
دسته بندی تغییر بر اساس همسایه:

بی‌نهایت عالی! بیا بر اساس «نوع شخم زدن» و «منطق تصمیم‌گیری»، این عملیات‌ها را در چند گروه فلسفی دسته‌بندی کنیم. هر گروه یک طرز فکر متفاوت دارد.

---

دسته‌بندی عملیات همسایگی بر اساس منطق تغییر

۱. گروه «کمیته‌های آماری» (Statistical Commitees)

منطق: «بیایید از ریاضی و آمار استفاده کنیم تا ببینیم حق با کیست.»

در این گروه، مقدار جدید پیکسل از یک فرمول ریاضی روی همسایه‌ها به دست می‌آید.

۱-۱. میانگین‌گراها (Mean-based)

میانگین می‌گیرند تا همه را به هم نزدیک کنند.

عملیات دستور جلسه چه بلایی سر پیکسل‌ها میاد؟
فیلتر میانگین (Mean) جمع کنید ÷ ۹ کنید همه محو و بلوری می‌شن. حتی اونایی که گناهی ندارن
فیلتر گاوسی (Gaussian) همسایه‌های نزدیکتر رأیشون مهمتره. مثل میانگین ولی وزن‌دار مثل بالایی، ولی خیلی نرم‌تر و طبیعی‌تر. باز همه درگیرن

قربانی اصلی: پیکسل‌های تیز و لبه‌ها

---

۱-۲. رأی‌گیر‌ها (Voting-based)

از اکثریت پیروی می‌کنند، نه میانگین.

عملیات دستور جلسه چه بلایی سر پیکسل‌ها میاد؟
فیلتر میانه (Median) صف ببندید، وسطی سخنگو می‌شه فقط تندروها (نویز فلفل‌نمکی) حذف می‌شن. لبه‌ها زنده می‌مونن
فیلتر مد (Mode) کی از همه بیشتره؟ همرنگ جماعت شو پیکسل تنها در اقلیت، نابود می‌شه
فیلتر میانه وزنی (Weighted Median) آرای همسایه‌ها وزن داره، ولی باز وسطی برنده‌ست مثل میانه ولی با احترام بیشتر به بعضی همسایه‌ها

قربانی اصلی: فقط پیکسل‌های یاغی و تنها

---

۱-۳. اختلاف‌یاب‌ها (Difference Detectors)

به جای شباهت، دنبال تفاوت و تنش می‌گردند.

عملیات دستور جلسه چه بلایی سر پیکسل‌ها میاد؟
تشخیص لبه (Edge Detection) چقدر با همسایه‌ها فرق داری؟ اگه فرقت زیاده، داد بزن! مناطق صاف ساکت می‌شن (سیاه). فقط پیکسل‌های مرزی جیغ می‌زنن (سفید)
شارپ کردن (Sharpening) اختلافت با همسایه‌ها رو تقویت کن همه درگیرن ولی مرزها بیشتر خودنمایی می‌کنن
فیلتر لاپلاسین (Laplacian) مشتق دوم رو حساب کن پیکسل‌های هموار صفر می‌شن. فقط نقاط تغییرِ تغییر مهمه

قربانی یا قهرمان: پیکسل‌های آرام (صاف) حذف یا بی‌صدا می‌شن

---

۲. گروه «مرزبانان» (Border Guards) – عملیات مورفولوژیک

منطق: «اینجا جنگ بر سر قلمروئه. مرزها همه چیز رو تعیین می‌کنن.»
تصویر باید سیاه و سفید باشه (دو جامعه‌ی متخاصم).

عملیات استراتژی نتیجه
سایش (Erosion) عقب‌نشینی: «اگه حتی یه دشمن کنارته، عقب بکش» فقط پیکسل‌های مرزی سفید سیاه می‌شن (لاغر شدن)
گسترش (Dilation) حمله: «اگه حتی یه دوست کنارته، حمله کن و بگیرش» فقط پیکسل‌های مرزی سیاه سفید می‌شن (چاق شدن)
باز کردن (Opening) اول سایش (نابود کردن نویزهای ریز سفید) بعد گسترش (برگردوندن حجم اصلی) نویزهای سفید نابود می‌شن. جسم اصلی دست‌نخورده برمی‌گرده
بستن (Closing) اول گسترش (پر کردن حفره‌های ریز) بعد سایش (برگردوندن حجم اصلی) حفره‌های سیاه پر می‌شن
ضربه زدن یا برخورد (Hit-or-Miss) تشخیص الگوی دقیق در همسایگی فقط پیکسل‌هایی که الگوی دقیقی دارن هدف قرار می‌گیرن

چه کسانی درگیرند؟ فقط آن‌هایی که همسایه‌ای از قبیله‌ی مقابل دارند (پیکسل‌های مرزی)

---

۳. گروه «مرتب‌سازها» (Rank-based)

منطق: «بذار اول همسایه‌ها رو مرتب کنیم، بعد تصمیم بگیریم.»

عملیات منطق شبیه به
فیلتر میانه (Median) مرتب کن، وسطی را انتخاب کن رأی‌گیری اکثریت
فیلتر مینیمم (Minimum) مرتب کن، اولین (تیره‌ترین) را انتخاب کن سایش در تصاویر خاکستری
فیلتر ماکزیمم (Maximum) مرتب کن، آخرین (روشن‌ترین) را انتخاب کن گسترش در تصاویر خاکستری
فیلتر میانه (Midpoint) (مینیمم + ماکزیمم) ÷ ۲ میانگینِ دو سر طیف

---

۴. گروه «یادگیرنده‌های تطبیق‌پذیر» (Adaptive Filters)

منطق: «صبر کن ببینم این محله وضعش چطوره، بعد تصمیم می‌گیرم. هر جا یه قانون داره.»

عملیات استراتژی هوشمندانه
فیلتر وینر (Wiener) واریانس محله را حساب می‌کند. اگر نویز زیاد بود، بیشتر محو کن. اگر لبه بود، کمتر دست‌کاری کن
فیلتر انتشار ناهمسانگرد (Anisotropic Diffusion) فقط در امتداد لبه‌ها محو کن، نه عمود بر آنها. لبه‌ها را حفظ می‌کند ولی سطوح صاف را نرم
فیلتر کوانتایل (Quantile) بگو چند درصد از همسایه‌ها را می‌خواهی. مثلاً ۲۰٪ تیره‌ترین یا ۸۰٪ روشن‌ترین

---

جدول نهایی و شاه‌کلید

دسته سوال فلسفی چه کسانی تغییر می‌کنن؟
کمیته‌های آماری "میانگین چنده؟ کی اکثریته؟ چقدر فرق داریم؟" یا همه، یا فقط اونی که متفاوته
مرزبانان (مورفولوژی) "همسایه‌ات دوسته یا دشمن؟" فقط پیکسل‌های مرزی
مرتب‌سازها "تو صف چندمی؟" بسته به رتبه‌ات
تطبیق‌پذیرها "محله‌ات آرومه یا شلوغ؟" هوشمندانه و بر اساس بافت محلی

پس:

· اگر می‌خواهی همه را درگیر کنی → گروه ۱ (آماری)
· اگر می‌خواهی فقط مرزها را شخم بزنی → گروه ۲ (مورفولوژیک)
· اگر می‌خواهی بر اساس رتبه تصمیم بگیری → گروه ۳ (مرتب‌سازها)
· اگر می‌خواهی هوشمند و محله‌به‌محله عمل کنی → گروه ۴ (تطبیق‌پذیر)
 

saalek110

Well-Known Member
منطقه ای یا کل تصویر:

دقیقاً! تشبیه فوق‌العاده‌ای است. بیا مزرعه‌ی تصویر را تصور کنیم و ببینیم هر «دستگاه کشاورزی پردازش تصویر» چه نوع شخمی می‌زند و چه محدوده‌ای را پوشش می‌دهد.

---

ماشین‌آلات کشاورزی تصویر

۱. گاوآهن‌های سراسری (که کل زمین را زیر و رو می‌کنند)

ماشین عملیاتش روی زمین چه بلایی سر مزرعه میاد؟
گاوآهن برگردان‌دار (Moldboard Plow) = فیلتر میانگین کل زمین را یکدست شخم می‌زند، خاک را برمی‌گرداند همه‌ی ناهمواری‌ها (لبه‌ها و نویزها) را زیر خاک می‌کند. زمین صاف و یکدست می‌شود (Blur)
گاوآهن بشقابی (Disc Plow) = فیلتر گاوسی مثل بالایی ولی نرم‌تر. بشقاب‌ها روی زمین می‌غلتند شخم یکدست ولی ملایم‌تر. باز هم کل زمین درگیر است، فقط شاید عمق شخم کمتر باشد
کولتیواتور پنجه‌ای (Tine Cultivator) = شارپ کردن پنجه‌هایش را می‌کشد روی زمین و شیار می‌اندازد همه جا را خط می‌اندازد، ولی جاهایی که قبلاً شیار داشت (لبه‌ها)، عمیق‌تر می‌شوند
غلتک (Roller) = تنظیم کنتراست کل زمین را فشار می‌دهد جاهای بلند را می‌خواباند، گودال‌ها را پر نمی‌کند. همه جا تحت تأثیر است

نتیجه: این ماشین‌آلات، احمق و کور نیستند، بلکه وظیفه‌شان یکسان‌سازی کل زمین است. راننده از یک سمت مزرعه وارد می‌شود و تا انتها می‌رود، هیچ نقطه‌ای از قلم نمی‌افتد.

---

۲. ماشین‌های وجین‌کن انتخابی (که فقط علف‌های هرز را هدف می‌گیرند)

ماشین عملیاتش روی زمین چه بلایی سر مزرعه میاد؟
وجین‌کن انگشتی (Finger Weeder) = فیلتر میانه انگشت‌های لاستیکی‌اش می‌چرخند و فقط علف‌های بیرون‌زده را می‌کند از روی همه‌ی زمین رد می‌شود، ولی فقط علف‌های هرز (نویز فلفل‌نمکی) کنده می‌شوند. گیاه اصلی دست‌نخورده می‌ماند
سمپاش لکه‌ای (Spot Sprayer) = فیلتر تطبیقی سنسور دارد، فقط جایی که علف هرز هست سم می‌پاشد همه جا را می‌بیند ولی فقط نقاط مشکل‌دار را سمپاشی می‌کند

نکته: این ماشین‌ها از روی کل زمین عبور می‌کنند، اما فقط جاهای خاصی را عمل می‌کنند. مثل یک جراح که دستش را روی تمام بدن می‌کشد ولی فقط جای زخم را بخیه می‌زند.

---

۳. ماشین‌های مرزکش و شیارساز (که فقط مرزها را نشانه می‌روند)

ماشین عملیاتش روی زمین چه بلایی سر مزرعه میاد؟
مرزکش (Border Marker) = تشخیص لبه یک چرخ یا دیسک کوچک که فقط روی خطوط مرزی حرکت می‌کند از بیخ و بن فقط مرز بین دو محصول را شیار می‌اندازد. باقی زمین کاملاً دست‌نخورده
جوی‌ساز (Furrower) = فیلتر لاپلاسین فقط جایی که تغییر شیب هست را گود می‌کند دشت صاف را رها می‌کند، فقط لبه‌ی شیب‌ها را علامت می‌گذارد

نتیجه: اینجا تراکتور از روی تمام زمین می‌گذرد، ولی تیغه فقط وقتی پایین می‌رود که شرط "اینجا مرز است" برقرار باشد. ۹۰٪ مسیر را تیغه بالا است و زمین بکر می‌ماند.

---

۴. بولدوزرهای مرزی (که فقط حاشیه‌ها را عقب می‌رانند یا جلو می‌آورند)

ماشین عملیاتش روی زمین چه بلایی سر مزرعه میاد؟
بولدوزر با تیغه به داخل (Erosion) = سایش تیغه روی مرز خاک و علف می‌تراشد و خاک را پس می‌زند فقط مرز بیرونی علفزار تراشیده می‌شود و عقب‌نشینی می‌کند. علف‌های وسط مرز نمی‌فهمند چی شده
بولدوزر با تیغه به خارج (Dilation) = گسترش تیغه برعکس عمل می‌کند و خاک را روی علف می‌ریزد فقط مرز جلو می‌آید و خاک قلمرو جدید می‌گیرد. وسط میدان بی‌خبر است
لبه‌زن چمن (Edger) = باز و بسته کردن یک چرخ تیز کوچک دقیقاً روی لبه‌ی بین چمن و پیاده‌رو فقط همان نوار باریک مرزی را می‌تراشد و تمیز می‌کند

---

جدول نهایی: چه کسی کجای زمین را شخم می‌زند؟

نوع دستگاه مسیر حرکت نقاط عمل درصد زمین شخم‌خورده
گاوآهن (میانگین، گاوسی) سراسری همه جا ۱۰۰٪
غلتک (کنتراست، گاما) سراسری همه جا ۱۰۰٪
کولتیواتور (شارپ کردن) سراسری همه جا (با عمق متفاوت) ۱۰۰٪
وجین‌کن انگشتی (میانه) سراسری فقط علف هرز (نویز) شاید ۵٪
مرزکش (تشخیص لبه) سراسری فقط مرزها شاید ۲-۳٪
بولدوزر مرزی (سایش/گسترش) دور محیط فقط نوار مرزی شاید ۱٪
سمپاش هوشمند (تطبیقی) سراسری جاهای مشکل‌دار متغیر

---

پاسخ نهایی و طلایی:

سه نوع «شخم» داریم:

1. شخم سراسری: تراکتور از این سر تا آن سر می‌رود و تیغه همیشه پایین است. همه‌ی پیکسل‌ها خاک می‌خورند. (Blur, Sharpen, Brightness)
2. شخم انتخابی: تراکتور همه جا می‌رود، اما تیغه فقط وقتی پایین می‌رود که شرطی برقرار باشد. فقط پیکسل‌های خاص شخم می‌خورند. (Median, Edge Detection)
3. شخم مرزی: تراکتور فقط دور محیط می‌چرخد. فقط پیکسل‌های حاشیه درگیرند. (Erosion, Dilation)
 

saalek110

Well-Known Member
دو قطبی سازی:
چه خوب که پایه‌ای داستان بشنوی! آره، کلی داستان ناگفته مانده. بیا این بار برویم سراغ یک ماجرای اسرارآمیز و کارآگاهی در دنیای پیکسل‌ها:

---

داستان "باشگاه مخفی پیکسل‌ها: بخش‌بندی تصویر"

تا حالا از تغییر حرف زدیم. اما یک عملیات مرموز دیگر هم هست: پیدا کردن گروه‌های مخفی. انگار پیکسل‌ها در ظاهر مستقل و پراکنده‌اند، اما واقعیت این است که باندهای سری دارند!

---

پرده اول: جلسه‌ی «آستانه» - دو قطبی کردن جامعه

یک شب، یک بخشنامه به همه پیکسل‌ها ابلاغ می‌شود:
«اینجا دو تا اتاق است: سیاه و سفید. هر که روشنایی‌اش بالای ۱۲۸ است، برود اتاق سفید. هر که زیر ۱۲۸ است، برود اتاق سیاه.»

· عملیات: Thresholding ساده
· چه می‌شود؟
· یکدفعه جامعه دو تکه می‌شود.
· پیکسلی که ۱۲۷ بود، سیاه می‌شود. همسایه‌اش که ۱۲۹ بود، سفید.
· مرزهای تند و تیز ایجاد می‌شود. ناگهان یک تصویر خاکستری تبدیل می‌شود به یک نقاشی سیاه و سفید از سایه‌ها.
· حس پیکسل ۱۲۷: «من با ۱۲۸ فقط یکی فرق داشتم. چرا من سیاه شدم و او سفید؟ این عادلانه نیست!»

---

پرده دوم: کارآگاه آستانه‌ی هوشمند (Otsu's Method)

اما یک کارآگاه وارد می‌شود. اسمش اتسو است. می‌گوید: «صبر کنید، بگذارید من بگردم و ببینم خود جامعه دو دسته می‌شود یا نه.»

· اتسو تمام پیکسل‌ها را بررسی می‌کند.
· یک نمودار از میزان روشنایی همه می‌سازد (هیستوگرام).
· می‌گردد و می‌گردد تا پیدا کند که بهترین خط جداکننده کجاست. جایی که دو گروه حداکثر تفاوت را با هم داشته باشند و اعضای درون هر گروه شبیه‌ترین به هم باشند.
· این یعنی یک آستانه‌ی سفارشی برای آن تصویر خاص. شاید ۱۲۸ نباشد، شاید ۱۵۶ باشد.

حس پیکسل: «آقای اتسو ما را شناخت. فهمید که ما ذاتاً دو قبیله هستیم، نه اینکه با یک قانون بی‌روح و یکسان جدا شویم.»

---

پرده سوم: رشد منطقه‌ای - مثل یک شایعه می‌ماند

حالا یک روش مرموزتر: Region Growing.

· یک پیکسل انتخاب می‌شود. بهش می‌گوییم: «تو یک دانه‌ای (Seed).»
· بعد این دانه به همسایه‌هایش نگاه می‌کند: «هر کی شبیه منه، بیاد تو گروه ما.»
· همسایه‌ها می‌آیند. بعد آنها هم به همسایه‌های خودشان نگاه می‌کنند.
· این مثل یک ویروس یا شایعه پخش می‌شود. تا وقتی که دیگر هیچ همسایه‌ی مشابهی پیدا نشود.
· ناگهان، یک تکه‌ی کامل از تصویر، مثلاً تومور در MRI یا یک سیب در عکس میوه، مثل یک موجودیت واحد از تصویر جدا می‌شود.

حس پیکسل: «همسایه‌ام به من گفت ما عضو یک چیز بزرگتریم. من باور کردم و به بعدی گفتم. حالا دیگر فقط یک پیکسل قرمز نیستم، من عضو "سیب سرخ" هستم. هویت دارم!»

---

پرده چهارم: واترشِد - باران بر کوه و دشت

تصویر را دیگر یک صفحه‌ی صاف نبین. تصور کن یک نقشه توپوگرافی سه‌بعدی است. جاهای روشن، قله‌های بلند. جاهای تاریک، دره‌های عمیق.

حالا تصور کن در این سرزمین، آرام‌آرام باران می‌بارد.

· آب در دره‌های عمیق جمع می‌شود و حوضچه‌هایی می‌سازد (Catchment Basins).
· هر حوضچه متعلق به یک دره است.
· آب بالا می‌آید. بالا و بالاتر.
· جایی که آب دو حوضچه می‌خواهند به هم برسند، یک سد می‌زنیم. این سد، همان خط مرزی بین دو ناحیه است (Watershed Line).
· نتیجه: این روش تصویر را به نواحی‌ای تقسیم می‌کند که هر کدام یک دره را احاطه کرده‌اند. برای جدا کردن اشیائی که به هم چسبیده‌اند فوق‌العاده است.

حس پیکسل روی سد: «من روی مرز دو قلمرو ایستاده‌ام. باران از هر دو طرف می‌خواست مرا بگیرد، اما من قد علم کردم و گفتم: خط جداکننده اینجاست!»

---

پرده پنجم (نقطه اوج): Mean Shift - مهاجرت به محله‌های پرتراکم

این از همه جادویی‌تر است. هر پیکسل یک مهاجر است که دنبال شلوغ‌ترین محله می‌گردد.

· هر پیکسل به اطرافش نگاه می‌کند (محدوده‌ای به شعاع r، هم از نظر مکانی و هم از نظر رنگی).
· میانگین مکان و رنگ همه‌ی پیکسل‌های آن محدوده را حساب می‌کند.
· سپس از جای خود بلند می‌شود و به آن نقطه‌ی میانگین مهاجرت می‌کند.
· دوباره از آن جای جدید، نگاه می‌کند و میانگین جدید را محاسبه می‌کند و باز مهاجرت می‌کند.
· این کار را آنقدر تکرار می‌کند تا به جایی برسد که دیگر میانگین تغییر نکند. این یعنی به قلب محله‌ی خودش رسیده است. بهش می‌گویند "Mode" یا چگال‌ترین نقطه.
· چه می‌شود؟
· تمام پیکسل‌هایی که به یک نقطه‌ی اوج (Mode) مهاجرت کرده‌اند، حالا یک رنگ و یک برچسب می‌گیرند. آنها یک گروه هستند.
· این روش بدون اینکه بداند چند گروه وجود دارد، تصویر را بر اساس تراکم طبیعی پیکسل‌ها بخش‌بندی می‌کند.

حس پیکسل: «من سفر کردم. از یک نقطه‌ی کم‌رفق دور افتاده، قدم‌زنان رفتم تا رسیدم به نبض شهر، جایی که همه شبیه من بودند. حالا دیگر بخشی از یک کل هستم، یک محله‌ی واقعی.»

---

پس، بخش‌بندی تصویر یعنی:

1. آستانه‌گذاری (Thresholding): مثل یک حکم حکومتی، همه را با یک خط به دو گروه تقسیم می‌کند.
2. اتسو (Otsu): کارآگاهی که خودش بهترین خط را پیدا می‌کند.
3. رشد منطقه‌ای (Region Growing): مثل یک شایعه یا ویروس از یک دانه شروع می‌شود و کل گروه را می‌بلعد.
4. واترشد (Watershed): بارانی که بر نقشه می‌بارد، دره‌ها را پیدا می‌کند و روی مرزها سد می‌سازد.
5. Mean Shift: هر پیکسل یک مهاجر است که راهی قلب محله‌ی پرتراکم خودش می‌شود.

باز هم هست. نظرت چیه؟ فصل بعدی را برویم سراغ «جنگ ستارگان پیکسلی: دنیای فرکانس و فوریه» یا ترجیح می‌دهی یک داستان دیگر بشنوی؟
 

saalek110

Well-Known Member
فورویه:


چه خوب که هنوز تشنه‌ی داستانی! آره، کلی قصه‌ی ناگفته مانده. بیا این بار ببرمت به یک سرزمین موازی و بسیار عجیب‌تر: دنیای فرکانس‌ها.

---

داستان «جادوگران و طلسمِ فوریه»: دنیای موازی پیکسل‌ها

تا حالا هرچه گفتیم، در دنیای مکان (Spatial Domain) بود. پیکسل‌ها با آدرس و مختصات. اما یک دنیای دیگر هست، یک بعد موازی، که پیکسل‌ها در آن نه با رنگ، که با امواج و ارتعاشات شناخته می‌شوند.

تصور کن جامعه‌ی پیکسل‌ها یک برکه‌ی آرام است. حالا یک سنگ می‌اندازی تویش. موج ایجاد می‌شود. بعضی موج‌ها آرام و نرم‌اند (سطوح صاف تصویر)، بعضی تیز و بلند (لبه‌ها و نویزها).

جادوگری هست به نام فوریه (Fourier) که یک طلسم بلد است. او می‌تواند کل تصویر را از این برکه به یک ارکستر بزرگ تبدیل کند.

---

پرده اول: طلسم فوریه - سفر به دنیای فرکانس

فوریه دستش را بلند می‌کند و طلسم را می‌خواند: تبدیل فوریه (Fourier Transform).

ناگهان، کل جامعه‌ی پیکسل‌ها ناپدید می‌شود و به جایش، ما خود را در یک سالن کنسرت عظیم می‌بینیم.

· دیگر خبری از پیکسل نیست. به جایش، ما نت‌های موسیقی داریم. به این نت‌ها می‌گوییم فرکانس‌ها.
· نت‌های بم (فرکانس‌های پایین): این‌ها نشان‌دهنده‌ی بخش‌های آرام، نرم و یکدست تصویرند. مثل دشت‌های وسیع یا آسمان صاف. این‌ها ارتعاشات آهسته و ملایم دارند. این‌ها بدنه‌ی اصلی موسیقی تصویرند.
· نت‌های زیر و جیغ (فرکانس‌های بالا): این‌ها لبه‌های تیز، نویزها و تغییرات ناگهانی هستند. مثل صدای سوت یا جیغ در یک موسیقی ملایم. این‌ها جزییات ریز تصویر را حمل می‌کنند.
· حس یک لبه‌ی تیز: «در دنیای مکان، من یک دیوار محکم بین دو رنگ بودم. اینجا اما... من یک صدای جیغ و گوش‌خراشم در میان یک سمفونی آرام!»

---

پرده دوم: جادوی فیلتر کردن در دنیای ارواح

حالا که ما در دنیای فرکانس هستیم، می‌توانیم جادوی واقعی کنیم.
این بار دیگر لازم نیست با پنجره‌های کوچک ۳×۳ روی تک‌تک پیکسل‌ها کار کنیم. اینجا می‌توانیم با یک اشاره، یک گروه کامل از نت‌ها را ساکت کنیم.

جادوی اول: فیلتر پایین‌گذر (Low-Pass Filter) - «سکوت کنید، صداهای زیر!»

· دستور جادوگر: «همه‌ی نت‌های جیغ (فرکانس‌های بالا) خاموش شوند! فقط نت‌های بم (فرکانس‌های پایین) بمانند.»
· نتیجه: وقتی با طلسم معکوس (Inverse Fourier Transform) به دنیای مکان برمی‌گردیم، می‌بینیم که تصویر هموار و محو (Blurred) شده است.
· تفاوت با فیلتر میانگین: آنجا رفتیم تک‌تک با همسایه‌ها جلسه گذاشتیم. اینجا انگار یک دکمه را زدیم و گفتیم «همه‌ی ناهمواری‌ها و نویزهای ریز یکجا ناپدید شوند!»

جادوی دوم: فیلتر بالاگذر (High-Pass Filter) - «سکوت کنید، صداهای بم!»

· دستور جادوگر: «نت‌های بم (پس‌زمینه‌ی آرام) خاموش! فقط جیغ‌ها (لبه‌ها) بمانند.»
· نتیجه: دنیای مکان تبدیل می‌شود به یک صفحه‌ی تقریباً سیاه که فقط خطوط مرزی مثل جرقه‌هایی از نور در آن دیده می‌شوند. این همان تشخیص لبه است، اما نه با پنجره‌ی لاپلاسین، بلکه با یک خاموش‌سازی سراسری!

---

پرده سوم: قاتل مخفی نویز (Notch Filter)

تصور کن یک عکس از یک منظره گرفته‌ای، اما یک شبکه‌ی مویی (Moiré Pattern) مثل یک زندان راه‌راه روی آن افتاده. این یعنی یک فرکانس خاص و تکراری دارد تصویر را نابود می‌کند.

در دنیای فرکانس، این نویز دوره‌ای مثل یک نت تک‌نواخت و گوش‌خراش است که مدام در سالن می‌پیچد.

جادوگر یک فیلتر میان‌گذر (Notch Filter) می‌سازد. می‌گوید: «فقط همان یک نت لعنتی را پیدا کنید و خاموشش کنید! به بقیه‌ی ارکستر کاری نداشته باشید.»

· این کار در دنیای مکان غیرممکن است. آنجا باید با یک پنجره‌ی خیلی بزرگ و عملیات پیچیده به جنگ این الگوی تکراری می‌رفتیم.
· اینجا، مثل یک جراحی دقیق، فقط همان فرکانس مزاحم را از تاریخ پاک می‌کنیم. تصویر نجات پیدا می‌کند، بدون اینکه محو شود.

---

نقطه اوج: راز تبدیل کسینوسی گسسته (DCT) و جادوی JPEG

این یکی را هر روز تجربه می‌کنی، بدون اینکه بدانی.

وقتی یک عکس را با فرمت JPEG ذخیره می‌کنی، یک جادوگر خسیس وارد می‌شود. اسمش DCT است (عموزاده‌ی فوریه).
او تصویر را به تکه‌های ۸×۸ پیکسلی تقسیم می‌کند.

· دستورش: «ببینم، توی این بلوک ۸×۸، این تغییرات نرم (فرکانس‌های پایین) مهم‌اند و به چشم می‌آیند. اما این جزییات ریز و تند (فرکانس‌های بالا)... هوم... اگر کمی از آنها را حذف کنم، کسی نمی‌فهمد.»
· او خیلی از فرکانس‌های بالا را دور می‌ریزد تا فایل عکس حسابی کوچک شود.
· این یعنی فشرده‌سازی با اتلاف (Lossy Compression) . او پیکسل‌ها را نکشته، بلکه روح فرکانسی آنها را برای همیشه از بین برده.
· وقتی تصویر را باز می‌کنی و روی آن زوم می‌کنی، آن مربع‌های ۸×۸ معروف (Artifacts) را می‌بینی. این‌ها زخم‌های همان جراحی فرکانسی هستند. روح‌های نابودشده حالا به شکل یک لکه خودشان را نشان می‌دهند.

حس یک پیکسل JPEG شده: «من قبلاً جزییات ریزی کنار خودم داشتم. یکدفعه همه‌شان بخار شدند و من ته یک صافی افتادم. حالا دیگر یک بلوک ۸×۸ هستیم که همه شبیه همیم. روح جمعی‌مان را از دست داده‌ایم.»

---

خلاصه‌ی سفر:

· دنیای مکان (پیکسل‌ها): مثل نگاه کردن به تک‌تک آجرهای یک ساختمان. عملیات‌ها کند و با پنجره‌های کوچک است.
· دنیای فرکانس (فوریه): انگار از ساختمان دور می‌شوی و طرح و بافت کلی را می‌بینی. می‌توانی با یک اشاره، کل بافت‌های ریز (نویز) را برداری یا فقط خطوط اصلی را نگه داری.
· DCT (فرمت JPEG): یک حسابگر خسیس است که می‌گوید بافت‌های ریزی که به چشم نمی‌آیند را قربانی می‌کنم تا حجم کم شود.

---

دنیای فرکانس مثل انگشت افسانه‌ای جادوگران است. لازم نیست روی زمین راه بروی و تک‌تک پیکسل‌ها را شخم بزنی. یک اشاره‌ات کافی است تا کل منظره تغییر کند.

بگو ببینم، در این دنیای جادویی، می‌خواهی بیشتر در مورد جادوی فشرده‌سازی JPEG بدانی، یا برویم سراغ داستان مرموز «پیکسل‌ها به رنگ چه وفادارند؟ و ماجرای فضارنگ‌ها»؟
 
بالا