Automatizace: budoucnost datové vědy a strojového učení?

Strojové učení bylo jedním z největších pokroků v historii výpočetní techniky a nyní je považováno za schopné hrát důležitou roli v oblasti velkých dat a analytiky. Analýza velkých dat je z pohledu podniku obrovská výzva. Například činnosti, jako je porozumění velkému počtu různých datových formátů, analýza přípravy dat a filtrování nadbytečných dat, mohou být náročné na zdroje. Nábor odborníků na datové vědy je nákladný návrh a není prostředkem k dosažení cíle pro každou společnost. Odborníci se domnívají, že strojové učení může automatizovat mnoho úkolů spojených s analytikou - rutinních i složitých. Automatizované strojové učení může uvolnit značné zdroje, které by mohly být použity pro složitější a inovativnější práci. Zdá se, že se strojové učení tímto směrem neustále pohybuje.

Automatizace v kontextu informačních technologií

V IT je automatizace spojením různých systémů a softwaru, což jim umožňuje provádět specifické úkoly bez jakéhokoli zásahu člověka. V IT mohou automatizované systémy provádět jednoduché i složité úlohy. Příkladem jednoduché úlohy může být integrace formulářů s dokumenty PDF a odesílání dokumentů správnému příjemci, zatímco poskytování záloh mimo pracoviště může být příkladem složité úlohy.

Abyste mohli svoji práci dělat správně, musíte naprogramovat nebo dát automatickému systému jasné pokyny. Pokaždé, když je k úpravě rozsahu jeho úlohy zapotřebí automatizovaný systém, musí program nebo sadu instrukcí někdo aktualizovat. Přestože je automatizovaný systém ve své práci účinný, k chybám může docházet z různých důvodů. Pokud dojde k chybám, je třeba identifikovat a opravit hlavní příčinu. Je zřejmé, že automatizovaný systém při své práci zcela závisí na lidech. Čím složitější je povaha práce, tím vyšší je pravděpodobnost chyb a problémů.

Běžným příkladem automatizace v IT průmyslu je automatizace testování webových uživatelských rozhraní. Testovací případy jsou vloženy do automatizačního skriptu a podle toho je testováno uživatelské rozhraní. (Další informace o praktické aplikaci strojového učení najdete v části Strojové učení a Hadoop v detekci podvodů příští generace.)

Argumentem ve prospěch automatizace je, že provádí rutinní a opakovatelné úkoly a uvolňuje zaměstnance k provádění složitějších a kreativnějších úkolů. Tvrdí se však také, že automatizace vyloučila velký počet úkolů nebo rolí, které dříve vykonávali lidé. Nyní, když strojové učení vstupuje do různých průmyslových odvětví, může automatizace přidat nový rozměr.

Budoucnost automatizovaného strojového učení?

Podstatou strojového učení je schopnost systému neustále se učit z dat a vyvíjet se bez zásahu člověka. Strojové učení může fungovat jako lidský mozek. Například doporučovací motory na stránkách elektronického obchodování mohou posoudit jedinečné preference a vkus uživatele a poskytnout doporučení ohledně nejvhodnějších produktů a služeb, ze kterých si můžete vybrat. Vzhledem k této schopnosti je strojové učení považováno za ideální pro automatizaci složitých úkolů spojených s big data a analytikou. Překonala hlavní omezení tradičních automatizovaných systémů, které neumožňují pravidelný zásah člověka. Existuje několik případových studií, které prokazují schopnost strojového učení provádět složité úlohy analýzy dat, o nichž bude pojednáno dále v tomto článku.

Jak již bylo uvedeno, analýza velkých objemů dat je pro podniky náročným návrhem, který lze částečně delegovat na systémy strojového učení. Z obchodního hlediska to může přinést mnoho výhod, jako je uvolnění zdrojů datové vědy pro kreativnější a kritičtější úkoly, vyšší pracovní zátěž, méně času na dokončení úkolů a nákladová efektivita.

Případová studie

V roce 2015 začali výzkumníci z MIT pracovat na nástroji pro datovou vědu, který dokáže vytvářet prediktivní datové modely z velkého množství nezpracovaných dat pomocí techniky zvané algoritmy syntézy hlubokých funkcí. Vědci tvrdí, že algoritmus může kombinovat nejlepší vlastnosti strojového učení. Podle vědců to testovali na třech různých sadách dat a testování rozšiřují o další. V příspěvku, který bude představen na mezinárodní konferenci o datové vědě a analytice, vědci James Max Kanter a Kalyan Veeramachaneni uvedli: „Pomocí automatizovaného ladicího procesu optimalizujeme celou cestu bez lidské účasti a umožníme ji zobecnit na různé datové sady“.

Podívejme se na složitost úkolu: algoritmus má to, co je známé jako schopnost automatického přizpůsobení, s jehož pomocí lze získat informace nebo hodnoty získat nebo je extrahovat z nezpracovaných dat (jako je věk nebo pohlaví), a poté prediktivní data lze vytvářet modely. Algoritmus využívá složité matematické funkce a teorii pravděpodobnosti nazývanou Gaussova kopule. Je proto snadné pochopit úroveň složitosti, kterou algoritmus zvládne. Tato technika také získala ceny v soutěžích.

Strojové učení by mohlo nahradit domácí úkoly

Po celém světě se diskutuje o tom, že strojové učení by mohlo nahradit mnoho zaměstnání, protože plní úkoly s efektivitou lidského mozku. Ve skutečnosti existují určité obavy, že strojové učení nahradí vědce v oblasti dat, a zdá se, že takové obavy existují.

Pro průměrného uživatele, který nemá znalosti v oblasti analýzy dat, ale má v každodenním životě různé stupně analytických potřeb, není možné použít počítače, které dokážou analyzovat obrovské objemy dat a poskytovat analytická data. Techniky zpracování přirozeného jazyka (NLP) však mohou toto omezení překonat tím, že naučí počítače přijímat a zpracovávat přirozený lidský jazyk. Průměrný uživatel tak nepotřebuje sofistikované analytické funkce ani dovednosti.

IBM věří, že potřebu datových vědců lze minimalizovat nebo eliminovat prostřednictvím jejího produktu, platformy Watson Natural Language Analytics. Podle Marca Atschullera, viceprezidenta pro analytiku a obchodní inteligenci společnosti Watson, „u kognitivního systému, jako je Watson, položíte svou otázku - nebo pokud nemáte otázku, stačí nahrát data a Watson se na ni může podívat a vyvodit, co byste možná chtěli vědět. ”

Závěr

Automatizace je dalším logickým krokem ve strojovém učení a již nyní se setkáváme s efekty v našem každodenním životě-weby elektronického obchodování, návrhy přátel na Facebooku, návrhy sítí LinkedIn a žebříčky vyhledávání na Airbnb. S ohledem na uvedené příklady není pochyb o tom, že to lze přičíst kvalitě výstupu vytvářeného automatizovanými systémy strojového učení. Navzdory všem svým kvalitám a výhodám se zdá, že myšlenka strojového učení způsobujícího obrovskou nezaměstnanost je přehnaná. Stroje nahrazují lidi v mnoha částech našeho života po celá desetiletí, ale lidé se vyvinuli a přizpůsobili tak, aby zůstali v tomto odvětví relevantní. Podle názoru je strojové učení pro všechny jeho narušení jen další vlnou, které se lidé přizpůsobí.


Čas odeslání: 3. srpna-20. srpna