Statistické zpracování textu Ing. Karel Šafr, Ph.D.

Začátek: středa 6. listopadu 2024, 09:00
Konec: středa 6. listopadu 2024, 15:00
Místo konání: NB A
Kontaktní osoba: Karel Šafr
Tagy: #fis #innovationweek #studenti #terminy

Cílem tohoto jednodenního workshopu je poskytnout účastníkům úvod do statistického zpracování textových dat od základních technik po moderní metody. Účastníci se naučí, jak lze zpracovat textová data pomocí různých přístupů, včetně dummy proměnných, vektorizace textu a embeddingů. Workshop také pokryje různé klasifikační metody používané nejčastěji při zpracování textu, jako je Naivní Bayesův filtr pro detekci spamu, tak i pokročilejší techniky strojového učení, jako jsou například rozhodovací stromy či SVM. Workshop zakončíme stručným představením pokročilých modelů, jako jsou LSTM a transformery, pro získání přehledu o současných trendech v NLP. Na praktických případových studiích z různých domén (např. analýza sentimentu, klasifikace textu, detekce témat) si účastníci osvojí aplikaci těchto metod a jejich praktické využití v reálných projektech. Workshop je určen pro zájemce s alespoň základními znalostmi programování v Pythonu (součástí workshopu není úvod do Pythonu). Program workshopu zahrnuje teoretickou část, praktická cvičení a diskusi nad konkrétními příklady z praxe.

Určeno pro: studenti FIS, studenti VŠE

Vstupní požadavky: Základní znalost Pythonu a vlastní notebook s přístupem na internet.

Není nutná registrace předem.