Vizualizace
Je užitečný vizualizovat váhy, nejdůležitější inputy, dopad drobných změn inputů na output.
Filtry
Každý filtr má 3 kanály (RGB), které jsou zkombinované do jednoho obrázku.
- Filtry první konvoluční vrstvy AlexNetu
-
Maximalizace inputu
Mějme síť, která klasifikuje obrázky tím, že každé třídě obrazků přiřadí pravděpodobnost. Nechť je pravděpodobnost, že obrázek patří do třídy . Chceme získat obrázek "typický" pro třídu .
Zafixujeme váhy a maximalizujeme:
kde znamená L2 regularizaci:
kde je velikost a jsou pixely .
Saliency maps
Pro fixní output neuron a obrázek nás zajímá, které inputy mají největší vliv na . Hodnotu aproximujeme lokálně pomocí lineárního členu Taylorova polynomu:
Ta derivace indikuje, které vstupy stačí změnit nejméně, aby to ovlivnilo nejvíce.
- SmoothGrad
-
Vytvoř několik zašumělých kopií a zprůměruj jejich saliency mapy.
Occlusion
Systematicky zakrývej části obrázku a sleduj, co se bude dít.
Local Interpretable Model-Agnostic Explanations (LIME)
Mějme fixní obrázek , kde jsou jeho superpixely. Uvažme vektory udávající "podobraz" , který vznikne odebráním superpixelů z , kde .
Zafixujme output neuron . Mějme trénovací set:
kde jsou náhodné binarní vektory.
Natrénuj lineární model (ADALINE) s váhami na minimalizací squared erroru (a regularizace). Tento model aproximuje původní síť — vrací pravděpodobnost, že vybrané superpixely podle aproximované sítě odpovídají třídě .
Hlavně nás však zajímají váhy tohoto lineárního modelu. Čím větší váha, tím důležitější superpixel pro klasifikaci jako .