Vizualizace

Je užitečný vizualizovat váhy, nejdůležitější inputy, dopad drobných změn inputů na output.

Filtry

Každý filtr má 3 kanály (RGB), které jsou zkombinované do jednoho obrázku.

Filtry první konvoluční vrstvy AlexNetu

alexnet filters

Maximalizace inputu

Mějme síť, která klasifikuje obrázky tím, že každé třídě obrazků přiřadí pravděpodobnost. Nechť je pravděpodobnost, že obrázek patří do třídy . Chceme získat obrázek "typický" pro třídu .

Zafixujeme váhy a maximalizujeme:

kde znamená L2 regularizaci:

kde je velikost a jsou pixely .

maximizing input

Saliency maps

Pro fixní output neuron a obrázek nás zajímá, které inputy mají největší vliv na . Hodnotu aproximujeme lokálně pomocí lineárního členu Taylorova polynomu:

Ta derivace indikuje, které vstupy stačí změnit nejméně, aby to ovlivnilo nejvíce.

saliency maps
SmoothGrad

Vytvoř několik zašumělých kopií a zprůměruj jejich saliency mapy.

Occlusion

Systematicky zakrývej části obrázku a sleduj, co se bude dít.

Local Interpretable Model-Agnostic Explanations (LIME)

Mějme fixní obrázek , kde jsou jeho superpixely. Uvažme vektory udávající "podobraz" , který vznikne odebráním superpixelů z , kde .

Zafixujme output neuron . Mějme trénovací set:

kde jsou náhodné binarní vektory.

Natrénuj lineární model (ADALINE) s váhami na minimalizací squared erroru (a regularizace). Tento model aproximuje původní síť — vrací pravděpodobnost, že vybrané superpixely podle aproximované sítě odpovídají třídě .

Hlavně nás však zajímají váhy tohoto lineárního modelu. Čím větší váha, tím důležitější superpixel pro klasifikaci jako .

lime