Jaký je rozdíl v extrakci relací (NLP) mezi extrakcí relací pod dohledem, částečně pod dohledem a bez dozoru?


Odpověď 1:

Ve vzdělávání pod dohledem existuje velký soubor dat, který obsahuje vše, co by student mohl potřebovat. Obsahuje dokumenty spolu se všemi vztahy mezi slovy a textem, který chcete. Žák se musí naučit, jak provádět tento úkol na neviditelných dokumentech.

V učení s polovičním dozorem máte velkou sadu dokumentů a pro menší podskupinu z nich máte všechna data.

V učení bez dozoru má student pouze dokumenty. Může hledat zajímavé vzorce, které jsou základem dat. Tyto vzorce mohou mít smysl, ale mohou to být i náhodné artefakty. Pokud bude k dispozici dostatek dat, bude snazší identifikovat smysluplné vzorce. Bez dohledu supervizorů na algoritmy však algoritmus nebude moci dát žádný význam. Mohlo by například zjistit, že slova „prezident“, „Obama“ a „Barack“ se často vyskytují společně nebo se vyskytují v situacích, kdy se obvykle vyskytuje i jiné (indikátor, že by to mohla být synonyma). Obecně nemůže zjistit, že to popisuje člověka.