Skip to content

Latest commit

 

History

History
135 lines (114 loc) · 4.58 KB

README.md

File metadata and controls

135 lines (114 loc) · 4.58 KB

Semináře R

Prezentace a ukázkové skripty k semináři v jazyce R.

Termíny seminářů

Název Datum Čas Místo Registrace
Úvod do datové analýzy I 2019-02-07 17:30 - 21:00 Avast HQ Minervo
Úvod do datové analýzy II 2019-02-14 17:30 - 21:00 Opero Minervo
Úvod do datové analýzy III 2019-02-19 17:30 - 21:00 TBA Minervo
Úvod do datové analýzy I 2018-10-31 17:30 - 21:00 UP21 incubator
Úvod do datové analýzy II 2018-11-06 17:30 - 21:00 Animika Hub
Úvod do datové analýzy III 2018-11-13 17:30 - 21:00 Opero

Semináře

Úvod do datové analýzy

Série tří seminářů vám pomůže rychle se zorientovat v jazyce R a interaktivním prostředí RStudia. Budeme se věnovat zejména analýze dat "tidy" přístupem - tedy pomocí knihoven shrnutých do balíku tidyverse. Během všech částí projdeme kompletně celou oblast manipulace s daty a vizualizace - od úplných začátků po pokročilé metody. Na konci seminářů sami uvidíte, kolik práce se dá ušetřit jednoduchými operacemi v R oproti spreadsheet nástrojům, jako například Excel.

Většina kurzů (soukromých i na vysokých školách) učí R klasickým způsobem. Moderní způsob pomocí balíku tidyverse je mnohem jednodušší pro začátečníky, jelikož nevyžaduje takové znalosti datových struktur v jazyce R. Navíc lze pomocí něj vytvářet analýzy a grafy mnohem snadněji s mnohem čitelnějším kódem. Proto se v tomto semináři zaměřujeme zejména na skupinu knihoven, které patří do tohoto balíku: dplyr, tidyr, purrr, ggplot2, ...

Jednotlivé části semináře na sebe obsahově navazují. Doporučujeme proto, aby se zájemci přihlásili na všechny semináře zároveň.

Pro koho je seminář určen:

  • Datový analytici, jejichž každodenním chlebem je Excel a/nebo SQL.
  • Studenti, kteří zpracovávají data pro svoji bakalářskou, nebo diplomovou práci.
  • Všichni, kdo chtějí změnit svoje zaměření na datovou analytiku, nebo data science.

Jaké zkušenosti by měli účastníci mít:

  • Lidé bez zkušeností s jazykem R, kteří mají nějakou zkušenost s některým z nástrojů pro práci s daty: Excel, SQL, nebo Python.
  • Mírně a středně pokročilí v R, kteří dosud nevyužívali knihovnu tidyverse.

Více informací o semináři na zvláštní stránce.

Část I

  • Úvod do jazyka R a RStudia
  • Zdroje pro další vzdělávání a pomoc
  • Úvod do tidyverse
  • Načítání dat z RData, csv a Excelu (readr, readxl)
  • Základy manipulace s daty (dplyr)
  • Základy vizualizace (ggplot2)

Část II

  • Agregování skupinových dat (dplyr)
  • Vizualizace skupinových dat (ggplot2)
  • Funkcionální programování (purrr)
  • Načítání dat z SQL (dbplyr)

Část III

  • Operace s textem (stringr, tidyr)
  • Pokročilá manipulace s daty (dplyr, tidyr)
  • Shrnutí procesu load-transform-vizualize

Připravované semináře

  • Machine Learning in R
  • Neural Networks in R
  • Web Scraping
  • Programming in R
  • Package Development