Ing. Richard A. Novak, Ph.D., Founder Omnicrane & Data scientist VŠE/FIS Praha
Příspěvek je úvodem do velkých jazykových modelů (LLM) uvede jejich schopnosti a omezení, včetně konceptů vstupních/výstupních tokenů a kontextového okna. Diskutuje, jak LLM generují různé artefakty, jako jsou texty, obrázky, kódy a videa, a vysvětluje klíčové aspekty, jako jsou parametry API, ceny a kompromis mezi výkonem a velikostí modelů.
Uvedeme typické příklady použití zahrnující úlohy, jako je odpovídání na otázky, překlad, analýza sentimentu, sumarizace, generování kódu, analýza dat, reakce chatbotů a klasifikace. Zahrne experimenty s různými modifikátory, styly, perspektivami, autory nebo formátováním, přechod od zero-shot k few-shot inference a využití dat pomocí metod jako je retrieval-augmented generation (RAG). Uvede, jak je důležitá iterativní úprava a ladění výsledků, stejně jako pochopení, jak měřit výkon promptů.