Spalten - Namen in Data Frame

Author

Claudia Spannbauer

Spalten in einem Data Frame nach ihren Namen auswählen

  • Wir nutzen wieder die ersten 5 Zeilen aus dem Pinguin Datensatz:
library(palmerpenguins)

data("penguins")
pinguine <- penguins |>
  head(5)
pinguine
# A tibble: 5 × 8
  species island    bill_length_mm bill_depth_mm flipper_length_mm body_mass_g
  <fct>   <fct>              <dbl>         <dbl>             <int>       <int>
1 Adelie  Torgersen           39.1          18.7               181        3750
2 Adelie  Torgersen           39.5          17.4               186        3800
3 Adelie  Torgersen           40.3          18                 195        3250
4 Adelie  Torgersen           NA            NA                  NA          NA
5 Adelie  Torgersen           36.7          19.3               193        3450
# ℹ 2 more variables: sex <fct>, year <int>

dplyr

  • Nutze select() aus dem dplyr Paket mit den Spaltennamen:
library(dplyr)

pinguine |>
  select(species, island)
# A tibble: 5 × 2
  species island   
  <fct>   <fct>    
1 Adelie  Torgersen
2 Adelie  Torgersen
3 Adelie  Torgersen
4 Adelie  Torgersen
5 Adelie  Torgersen

List expression

  • Auswahl mit dem Namen funktioniert auch mit List expressions.

Einzelne Spalte

  • Nutze doppelte Klammern oder den $-Operator:, um einen Vektor zu bekommen:
pinguine[["species"]]
[1] Adelie Adelie Adelie Adelie Adelie
Levels: Adelie Chinstrap Gentoo
pinguine$species
[1] Adelie Adelie Adelie Adelie Adelie
Levels: Adelie Chinstrap Gentoo
  • Nutze einfache Klammern, um ein Tibble mit einer Spalte zu bekommen:
pinguine["species"]
# A tibble: 5 × 1
  species
  <fct>  
1 Adelie 
2 Adelie 
3 Adelie 
4 Adelie 
5 Adelie 

Mehrere Spalten

pinguine[c("species", "island")]
# A tibble: 5 × 2
  species island   
  <fct>   <fct>    
1 Adelie  Torgersen
2 Adelie  Torgersen
3 Adelie  Torgersen
4 Adelie  Torgersen
5 Adelie  Torgersen

Matrix Style

Einzelne Spalte

pinguine[, "species"]
# A tibble: 5 × 1
  species
  <fct>  
1 Adelie 
2 Adelie 
3 Adelie 
4 Adelie 
5 Adelie 

Mehrere Spalten

pinguine[, c("species", "island")]
# A tibble: 5 × 2
  species island   
  <fct>   <fct>    
1 Adelie  Torgersen
2 Adelie  Torgersen
3 Adelie  Torgersen
4 Adelie  Torgersen
5 Adelie  Torgersen