Spalten - Position in Data Frame

Author

Claudia Spannbauer

Spalten anhand ihrer Position im Data Frame auswählen

  • Nutze die select() Funktion aus dem dplyr Paket

  • Alternativ: List expressions (base) nutzen

Wir laden die ersten 5 Zeilen des Pinguin-Datensatzes aus dem Paket palmerpenguins:

library(palmerpenguins)
data("penguins")
pinguine <- head(penguins, 5)
pinguine
# A tibble: 5 × 8
  species island    bill_length_mm bill_depth_mm flipper_length_mm body_mass_g
  <fct>   <fct>              <dbl>         <dbl>             <int>       <int>
1 Adelie  Torgersen           39.1          18.7               181        3750
2 Adelie  Torgersen           39.5          17.4               186        3800
3 Adelie  Torgersen           40.3          18                 195        3250
4 Adelie  Torgersen           NA            NA                  NA          NA
5 Adelie  Torgersen           36.7          19.3               193        3450
# ℹ 2 more variables: sex <fct>, year <int>

dplyr

Eine Spalte wählen

  • Dann mit select() die 2. Spalte auswählen:
library(dplyr)
pinguine |>
  select(2)
# A tibble: 5 × 1
  island   
  <fct>    
1 Torgersen
2 Torgersen
3 Torgersen
4 Torgersen
5 Torgersen

Mehrere Spalten

pinguine |>
  select(1, 3, 4)
# A tibble: 5 × 3
  species bill_length_mm bill_depth_mm
  <fct>            <dbl>         <dbl>
1 Adelie            39.1          18.7
2 Adelie            39.5          17.4
3 Adelie            40.3          18  
4 Adelie            NA            NA  
5 Adelie            36.7          19.3

Eine Spanne von Spalten auswählen

pinguine |>
  select(2:5)
# A tibble: 5 × 4
  island    bill_length_mm bill_depth_mm flipper_length_mm
  <fct>              <dbl>         <dbl>             <int>
1 Torgersen           39.1          18.7               181
2 Torgersen           39.5          17.4               186
3 Torgersen           40.3          18                 195
4 Torgersen           NA            NA                  NA
5 Torgersen           36.7          19.3               193

List expression

Eine Spalte

  • Die Nutzung der doppelten Klammern führt zur Ausgabe eines Vektors:
pinguine[[2]]
[1] Torgersen Torgersen Torgersen Torgersen Torgersen
Levels: Biscoe Dream Torgersen

Mehrere Spalten

  • Einfache Klammern führen zur Ausgabe eines Tibbles und können für die Auswahl von einer oder mehreren Spalten genutzt werden:
pinguine[2]
# A tibble: 5 × 1
  island   
  <fct>    
1 Torgersen
2 Torgersen
3 Torgersen
4 Torgersen
5 Torgersen
pinguine[c(2, 4)]
# A tibble: 5 × 2
  island    bill_depth_mm
  <fct>             <dbl>
1 Torgersen          18.7
2 Torgersen          17.4
3 Torgersen          18  
4 Torgersen          NA  
5 Torgersen          19.3

Matrix-Style

  • Die Auswahl von Spalten kann auch im Matrix-Style stattfinden:
pinguine[, 3]
# A tibble: 5 × 1
  bill_length_mm
           <dbl>
1           39.1
2           39.5
3           40.3
4           NA  
5           36.7
  • Auch hier ist eine Mehrfachauswahl möglich:
pinguine[, c(1, 3)]
# A tibble: 5 × 2
  species bill_length_mm
  <fct>            <dbl>
1 Adelie            39.1
2 Adelie            39.5
3 Adelie            40.3
4 Adelie            NA  
5 Adelie            36.7