Strojové učení: S učitelem i bez něj

Podobně jako žáci a studenti i algoritmy strojového učení se mohou učit s učitelem, nebo samy, bez učitele.

Strojové učení: S učitelem i bez něj


Analogií učení bez učitele v oblasti AI (umělé inteligence) je požadavek, aby učící algoritmus, například neuronová síť, nejen rozpoznal charakteristické rysy nacházející se v souboru údajů, ale, a to je mnohem těžší, určil, čím se tyto vzorky odlišují od náhodných dat. Jinak řečeno, úkolem algoritmu je rozpoznat skryté struktury u analyzovaných dat. Například pokud pustíte dětem úryvek Smetanovy Vltavy a Blaníku, které předtím nikdy neslyšely, většina žáků dokáže rozpoznat, který úryvek se týká řeky a který rytířů, aniž nad tím budou přemýšlet, nebo jim někdo řekne, podle jakého klíče se mají rozhodnout.

Metody strojového učení

Machine learning je typ umělé inteligence, která má schopnost učit se poznávat atributy reálného světa a následně na ně adekvátně reagovat, aniž je řídící počítač inteligentního systému na tyto úkoly explicitně naprogramován. Využívá heuristické algoritmy, neuronové sítě a jiné pokročilé algoritmy a softwarové technologie, především datamining a metody umělé inteligence. Pomáhá se rozhodovat, sledovat a analyzovat trendy a předvídat události.

Supervised learning neboli učení jakoby s učitelem. V praxi to znamená, že pro množinu vstupních údajů je definován správný výstup. V případě regresních algoritmů to bývají zpravidla hodnota či interval hodnot, při klasifikačních algoritmech třída a podobně. Na vyšší úrovni je volba nejvhodnějšího algoritmu, pomocí kterého se daný typ úlohy může vyřešit. Dobrou analogií je klasické vyučování ve škole, kde si žáci na matematických příkladech nebo gramatických cvičeních osvojí takzvané osvědčené postupy. Nevýhodou je nízká flexibilita, a především vysoké náklady na tento způsob strojového učení.

Unsupervised learning neboli učení bez učitele. Ke vstupním datům není znám výstup, dokonce se předem neví, zda úloha má nějaké řešení, jestli je objekt znám nebo patří do nějaké skupiny předem známých shluků, případně zda mezi proměnnými charakterizujícími případ nebo situaci jsou nějaké závislosti. Tato metoda se aplikuje například v různých automatizovaných zařízeních, kde je požadavek rychlé reakce na nepředvídatelnou situaci. Unsupervised learning se často používá i pro screening známých procesů, které neposkytují očekávané výsledky, a proto je třeba najít jiný princip procesu.

Velmi často se používá kombinace obou metod, takzvaný semisupervised learning. Část vstupních dat je k dispozici i se známým výstupem, ale další data takový výstup známý nemají. Analytické algoritmy se „trénují“ na cvičné množině dat, kde jsou známé výstupy. Například algoritmus na podporu rozhodování, zda žadateli schválit, nebo neschválit bankovní úvěr, je natrénovaná na desítkách či stovkách tisíc reálných záznamů z minulosti, kde je znám i výsledek, zda klient půjčku splatil, nebo nesplatil.

Často se metody strojového učení kombinují tak, že v první etapě takzvaného pretrainingu se automaticky identifikují atributy, jež jsou v datech obsaženy častěji. Ve druhé etapě, kterou může realizovat například další skrytá vrstva neuronové sítě, se rozeznávají kombinace těchto atributů, které se vyskytují častěji než jiné kombinace. Tyto etapy se uskutečňují bez učitele. Ve stadiu, kdy je model „naučen“ bez učitele, se aplikuje učení s učitelem. Tento nákladný proces už neprobíhá na syrových, ale předzpracovaných údajích, takže je mnohem efektivnější. Většina atributů je již identifikovaných v předchozích fázích a parametry jsou nastaveny na hodnoty blízké lokálnímu minimu chybových funkcí, takže při učení s učitelem dochází jen k jemným úpravám. Pre-training plní úlohu jakéhosi regulačního mechanismu, který významně zmenšuje prostor možných řešení, a tím snižuje jejich variabilitu. Důležité je, aby při kombinovaném učení nedocházelo při učení s učitelem k anulování atributů identifikovaných během učení bez učitele.

Autor je redaktorem PC Revue.


Úvodní foto: (c) petrovich12 - Fotolia.com




Komentáře