Kurzusleírás

I. Bevezetés és előzmények

1. Áttekintés

  • Az R barátságosabbá tétele, az R és az elérhető grafikus felhasználói felületek
  • Rstudio
  • Kapcsolódó szoftverek és dokumentációk
  • R és statisztika
  • R interaktív használata
  • Bevezető foglalkozás
  • Segítség kérése a funkciókkal és szolgáltatásokkal kapcsolatban
  • R parancsok, kis- és nagybetűk érzékenysége stb.
  • Korábbi parancsok előhívása és javítása
  • Parancsok végrehajtása fájlból vagy kimenet átirányítása fájlba
  • Adatok állandósága és objektumok eltávolítása
  • Good programozási gyakorlat: Önálló szkriptek, jó olvashatóság, pl. strukturált szkriptek, dokumentáció, leértékelés
  • csomagok telepítése; CRAN és Biovezető

2. Adatok olvasása

  • Txt fájlok (read.delim)
  • CSV fájlok

3. Egyszerű manipulációk; számok és vektorok + tömbök

  • Vektorok és hozzárendelés
  • Vektoros aritmetika
  • Szabályos sorozatok generálása
  • Logikai vektorok
  • Hiányzó értékek
  • Karakter vektorok
  • Indexvektorok; adathalmaz részhalmazainak kiválasztása és módosítása
    • Tömbök
  • Tömb indexelés. Egy tömb alszakaszai
  • Index mátrixok
  • Az array() függvény + egyszerű műveletek tömbökön, pl. szorzás, transzponálás
  • Más típusú objektumok

4. Listák és adatkeretek

  • Listák
  • Listák készítése és módosítása
    • Listák összefűzése
  • Adatkeretek
    • Adatkeretek készítése
    • Munka adatkeretekkel
    • Tetszőleges listák csatolása
    • A keresési útvonal kezelése

5. Adatkezelés

  • Megfigyelések és változók kiválasztása, részhalmaza
  • Szűrés, csoportosítás
  • Átkódolás, átalakítások
  • Összesítés, adathalmazok kombinálása
  • Particionált mátrixok létrehozása, cbind() és rbind()
  • Az összefűzési függvény, (), tömbökkel
  • Karaktermanipuláció, stringr csomag
  • rövid bevezető a grep-be és a regexpr-be

6. További információ az adatok olvasásáról

  • XLS, XLSX fájlok
  • readr és readxl csomagok
  • SPSS, SAS, Stata,… és más formátumú adatok
  • Adatok exportálása txt, csv és egyéb formátumokba

6. Csoportosítás, ciklusok és feltételes végrehajtás

  • Csoportosított kifejezések
  • Ellenőrző nyilatkozatok
  • Feltételes végrehajtás: ha utasítások
  • Ismétlődő végrehajtás: ciklusoknál, ismétlés és while
  • intro into alkalmazni, lapply, sapply, tapply

7. Funkciók

  • Funkciók létrehozása
  • Opcionális argumentumok és alapértelmezett értékek
  • Változó számú argumentum
  • Hatály és következményei

8. Egyszerű grafika R-ben

  • Grafikon létrehozása
  • Sűrűség telkek
  • Dot Plots
  • Bár telkek
  • Vonaldiagramok
  • Kördiagramok
  • Boxplots
  • Scatter Plots
  • Telkek kombinálása

II. Statisztikai elemzés R

1. Valószínűségi eloszlások

  • R statisztikai táblázatok halmazaként
  • Egy adathalmaz eloszlásának vizsgálata

2. Hipotézisek tesztelése

  • Tesztek a népesség átlagáról
  • Valószínűségi arány teszt
  • Egy- és kétmintás tesztek
  • Khi-négyzet Go illeszkedési teszt
  • Kolmogorov-Smirnov egymintás statisztika
  • Wilcoxon Signed-Rank teszt
  • Kétmintás teszt
  • Wilcoxon rangösszeg teszt
  • Mann-Whitney teszt
  • Kolmogorov-Smirnov teszt

3. Hipotézisek többszörös tesztelése

  • I. típusú hiba és FDR
  • ROC görbék és AUC
  • Több tesztelési eljárás (BH, Bonferroni stb.)

4. Lineáris regressziós modellek

  • Általános függvények a modellinformációk kinyeréséhez
  • Beépített modellek frissítése
  • Általánosított lineáris modellek
    • Családok
    • A glm() függvény
  • Osztályozás
    • Logisztikai regresszió
    • Lineáris diszkriminancia analízis
  • Felügyelet nélküli tanulás
    • Főkomponensek elemzése
    • Klaszterezési módszerek (k-átlagok, hierarchikus klaszterezés, k-medoidok)

5. Túlélési elemzés (túlélési csomag)

  • Túlélési tárgyak az r
  • Kaplan-Meier becslés, log-rank teszt, parametrikus regresszió
  • Bizalom sávok
  • Cenzúrázott (intervallum cenzúrázott) adatelemzés
  • Cox PH modellek, állandó kovariánsok
  • Cox PH modellek, időfüggő kovariánsok
  • Szimuláció: Modell-összehasonlítás (Regressziós modellek összehasonlítása)

6. Varianciaanalízis

  • Egyirányú ANOVA
  • Az ANOVA kétirányú osztályozása
  • MANOVA

III. Megoldott problémák a bioinformatikában

  • A limma csomag rövid bemutatása
  • Microarray adatelemzési munkafolyamat
  • Adatok letöltése a GEO-ról: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Adatfeldolgozás (QC, normalizálás, differenciális kifejezés)
  • Vulkán telek
  • Custering példák + hőtérképek
 28 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák