Zpracování obrazu pomocí PDE

Editovat
Note

Difúzní filtrování (lineární difuze, nelineární izotropní a nelineární anizotropní difuze). Level set metody (pohyb ve směru normály, pohyb řízený křivostí a pohyb ve vnějším vektorovém poli). Fast marching algoritmus.

PA166

Tip

Doporučuju kouknout na shrnutí v zápiscích z předmětu PA166 od xrosecky

Gradient

Vektorové pole ve směru největšího nárůstu.

Standardně ho spočítáme jako derivaci obrazu podle x a y. V praxi ale používáme aproximaci derivace podle Taylorova rozvoje.

Aproximace derivace

Taylorův polynom vypadá takto: .

Z něho můžeme odvodit rovnici pro první derivaci (v našem případě ji nazýváme dopředná diference):

Tu můžeme dále zpřesnit, pokud si vypíšeme taylorův rozvoj až do druhé derivace včetně (tím získáme centrální diferenci):

Podobným stylem získáme i druhou derivaci

Divergence

Operace, která nám říká, jak moc vektorové pole míří ven z daného bodu. Pokud je , pak se v daném bodě hodnota časem snižuje, pokud je , pak se hodnota zvyšuje.

.

Laplacian

Jak se mění teplota v daném místě s časem, proto to odpovídá derivaci teploty podle času.

Laplacian je vlastně divergence gradientu: .

Difuze

Imituje šíření tepla v 1D tyči / 2D ploše / …​ Řídí se také rovnicí pro šíření tepla: (kde je Laplaceův operátor).

+ Teplo se v takové ploše může šířit různými způsoby v závislosti na vlastnostech materiálu. Je možné že:

  1. Celý materiál ve všech směrech vede teplo stejně = lineární difuze (LD).

  2. Materiál vede v různých místech teplo různě, ale vždy ve všech směrech stejně = nelineární izotropní difuze (NID).

  3. Materiál vede teplo různě v různých směrech = nelineární anizotropní difuze (NAD).

pgv10 diff types

Lineární difuze

Pokud aplikujeme lineární difuzi na obrázek, dojde k jeho rozmazání (Gaussovský filtr).

Pokud vezmeme prostor všech různých Gaussovských rozmazání v různých časem, dostáváme "Gaussovský prostor měřítek" (Gaussian scale space). Pro ten platí

  • Zachování průměrné hodnoty šedé

  • Princip maxima a minima - se zvyšujícím se t se maximum jedině snižuje a minimum jedině zvyšuje

  • Řešení je nezávislé na

  • Posuvu hodnoty šedé - “posun po ose Y”

  • Translaci - “posun po ose X”

  • Škálování

  • Vlastnost porovnání - pokud $u \leq v \rightarrow (T_tu) \leq (T_tv)$

  • Pro dimenze $\geq 2$ mohou vznikat nové extrémy

Chceme vypočítat pomocí aproximace Taylorova rozvoje:

A z této rovnice už vyjádříme . ( je časový krok, a jsou prostorové kroky)

Nelineární izotropní difuze

Zobecníme funkci pro difuzi kombinací Fick’s law a Mass preservation: , kde je divergence.

  • Lineární

    • Rozmazání ve všech bodech stejně ve všech směrech

  • Nelineární izotropní

    • skalární funkce

    • Rozmazání stejně ve všech směrech, ale v každém bodě jinak

  • Nelineární anizotropní

    • maticová funkce

    • Rozmazání v každém bodě a směru jinak

Pro NID chceme typicky zabránit rozmazání na výrazných hranách. Chceme tedy, aby fce byla na hranách (tam, kde je velký gradient) co nejmenší a jinde co největší. Existuje několik různých vzorců:

Perona-Malik difuzivita

.

Charbonnier difuzivita

.

Exponenciální difuzivita

.

Nelineární anizotropní difuze

NID nechával "chlupaté hrany", protože kolem hran nerozmazával vůbec. NAD dokáže kolem hran rozmazat jen v tom správném směru, neboť je v tomto případě matice.

Symetrická matice

Reprezentuje otočení, roztažení a otočení zpátky:

  • Vlastní vektory kolmé na sebe

  • Vlastní čísla jsou reálná

pgv10 sym matrix

Díky symetrickým maticím můžeme sestavit sami maticky s předem danými vlastními vektory a čísly.

Edge-enhancing difuzivita (difuzivita zvýrazňující hrany)

My chceme matici, co má následující vlastnosti:

Kde funkce je funkce nepřímé úměry. Tím zajistíme, že rozmazání podél hran bude maximální a v ostatních směrech bude minimální.

Coherence-enhancing difuzivita (difuzivita zvýrazňující koherenci)

Potřebujeme vypočítat difuzní tenzor a podle něj potom aplikujeme rozmazání. Tenzor je dán jako:

My opět vytvoříme matici s vlastními vektory a čísly. Tentokrát vektory vezmeme z tensoru: Vlastní vektor tensoru s větším vl. číslem vede přes strukturu → Dáme mu malé číslo blízko nuly; vlastní vektor s menším vl. číslem vede kolmo → Dáme mu číslo podle rozdílu koherence (pokud je koherentní, nechceme rozmazávat tolik, může to být roh).

pgv10 structure tensor

Level set metody

Level set metody využívají implicitní reprezentace křivek.

Implicitní reprezentace

Představme si funkci, která má uvnitř křivky záporné hodnoty, na křivce nulu a venku kladné hodnoty. Potom můžeme křivku reprezentovat, jako (nulovou) vrstevnici funkce.

Při takovéto reprezentaci nemáme přístup přímo k hranici, ale můžeme jí získat například pomocí marching squares (cubes) algoritmu. Zároveň musíme mít uloženou hodnotu funkce pro celý obraz, což může být nevýhoda. Výhodou je, že můžeme snadno měnit topologii křivky (přidávat díry, spojovat křivky, …​).

Toto všechno funguje i ve 3D, kde se ale bavíme o povrchu.

Vývoj křivky můžeme definovat, jako (kde je normála a řídí rychlost evoluce). Pokud ho chceme definovat v rámci obalující funkce , můžeme ho zapsat, jako . v této rovnici ovlivňuje směr a rychlost pohybu křivky, je velikost gradientu.

Level set metody se snaží řešit tuto rovnici.

Typy pohybu

Existují 3 základní typy pohybu křivky:

  • Pohyb ve směru normály - = dilatace / eroze

  • Pohyb řízený křivostí - = vyhlazování křivky

  • Pohyb ve vnějším vektorovém poli - , kde je vnější vektorové pole

pgv10 motion types
Pohyb ve vnějším vektorovém poli

popisuje pohyb ve vektorovém poli definovaném parametrem . Aproximujeme opět pomocí Taylorova rozvoje.

Pohyb řízený křivostí

Chceme, aby se křivka vyhlazovala, protože křivost je vlastně druhá derivace. popisuje pohyb křivky ve směru opačném k její křivosti. je křivost a je parametr, který řídí rychlost vyhlazování.

Pohyb ve směru normály

Chceme, aby se křivka rozšiřovala, nebo smršťovala. popisuje pohyb křivky ve směru normály. je parametr, který řídí rychlost pohybu.

Všechny typy pohybu můžeme zapsat do jedné rovnice: a aproximovat pomocí Taylorova rozvoje.

Fast marching algoritmus

FMA je specifický případ Level set metody s pouze jedním typem pohybu ve směru normály .

Pro různé případy můžeme volit různé hodnoty .

Euklidovská vzdálenost

Pro výpočet vzdálenosti od křivky ke všem bodům obrazu zvolíme .

Geodesická vzdálenost

Chceme-li změřit vzdálenost od daného bodu uvnitř objektu, zvolíme uvnitř objektu a venku.

pgv10 geodesic
Segmentace

Můžeme jednoduše segmentovat obraz, pokud zvolíme (kde je obraz a je nějaká funkce, například Perona-Malik). Potom jde k 0 při vysokém gradientu a k 1 při nízkém gradientu.

Samotný výpočet algoritmu je trošku složitější, uděláme si 3 množiny

  • Trial (co chceme testovat, init. kontura)

  • Far (neobjevené, init. všechno krom kontury)

  • Known (vyřešené, init. prázdná množina)

Vždy najdeme v Trial nejmenší hodnotu, přehodíme ji do Known a pro její sousedy vypočítáme nový arrival time minimalizací , kde je časový krok, jsou hodnoty v Known a jsou souřadnice bodu X, které chceme minimalizovat ().

Konkrétní výpočet je ve slidech, nebo v notionu, ale myslím, že je celkem zbytečný.

Složitost je v řádu , kde je počet pixelů v obrazu.