Formální definice

Neuron

Hrubá matematická aproximace biologického neuronu.

formal neuron
  •  — inputy

  •  — váhy

  •  — vnitřní potenciál

  •  — výstup

  •  — aktivační funkce udávající výstup

  • bias — udává "jak těžké" je pro neuron se aktivovat (čím vyšší číslo, tím těžší je pro neuron vydat nenulový výstup)

  •  — pro snažší implementaci se závádí dodatečný vstup, který má vždy hodnotu 1 a váhu rovnu -bias

Note
Vnitřní potenciál funguje jako nadrovina (čára při 2D, rovina při 3D, nepředstavitelný mostrum ve vyšších dimenzí), která rozděluje prostor vstupů na část, kde je a kde .
Note
Vnitřní potenciál se u některých typů sítí počítá jako vzdálenost od vstupu od vah:
Note

Jedním neuronem neuronem nelze oddělit spočítat XOR (oddělit nuly od jedniček) v:

xor

(Přinejmenším pokud je unit step function a ani jinak si nejsem jistý.)

Neuronová síť (NN)

Neuronová síť je množina propojených neuronů, jejíž chování je zakódováno do spojení mezi neurony. Je primitivním modelem biologických neuronových sítí a silně se zaměřuje na oblasti jako: samořídicí auta, hry, finanční trhy, zpracování medicinálních obrazů, zpracování textu, rozpoznání hlasu, atd.

Typ neuronové sítě je dán její architekturou (způsobem zapojení), aktivitou (transformací vstupů na výstupy) a učením (metodou změny vah při trénování).

Architektura

Neuron může být input, output nebo hidden. Může být dokonce input i output najednou. Hidden je, právě když není input ani output.

Síť být cyklická — recurrent — nebo acyklická — feed-forward.

Stav síťe

Vektor výstupů všech neuronů sítě (nejen output).

Stavový prostor sítě

Množina všech možných stavů sítě.

Vstup sítě

Vektor reálných čísel (prvek ), kde je počet vstupů.

Vstupní prostor sítě

Množina všech vstupů sítě.

Iniciální stav

Input neuronům je za výstup () dán vektor vstupů (). Všem ostatním neuronům je výstup () nastaven na 0.

Výstup sítě

Vektor výstupů () output neuronů. Výstup se v průběhu výpočtu může měnit.

Výpočet

Typicky po diskrétních krocích:

  1. Zvolí se množina neuronů (vybrané podle pravidla daného architekturou).

  2. Zvoleným neuronům je nastaven výstup — prostě se vyhodnotí aktivační funkce.

  3. Vrať se ke kroku 1.

    Výpočet je konečný, pokud se stav sítě dále nemění po konečném množství opakování postupu výše.

Konfigurace

Vektor hodnot všech vah.

Vahový prostor

Množina všech konfigurací.

Iniciální konfigurace

Počáteční hodnoty vah (než začne trénování).

Supervised learning

Síť se učí na základě vstupů, pro které známe správnou odpověď. Minimalizací chyby (odchylky výstupu od požadovaného výstupu) se hledá "správná" konfigurace.

Unsupervised learning

Síť se učí na základě vstupů, pro které neznáme správnou odpověď. Cílem je zjistit něco o distribuci vstupů.

Note
Mějmě síť s neurony, z toho input a output. Nechť a . Předpokládejme, že výpočet je na každém prvku konečný. Pak řekneme, že ta síť počítá funkci , pokud pro každý vstup platí, že je výstupem sítě po té, co výpočet na zastaví.