Funksjon for aa laste inn "multifile" datasett fra Google Cloud Storage bucket
open_dataset.Rd
Funksjonen open_dataset
kan brukes til aa lese deler av datasett (bl.a. .parquet-, .feather- og .csv-filer) fra Google Cloud Storage. Det lages en forbindelse til mappen der filen ligger og deretter kan man bruke argumenter fra dplyr
, som filter
og select
, foer man bruker collect
til aa lese inn dataene i R. open_dataset
kan ogsaa brukes til aa lese inn sf-objekter (lagret som .parquet-fil med pakken sfarrow
).
Examples
if (FALSE) { # \dontrun{
data <- open_dataset("ssb-prod-dapla-felles-data-delt/R_smoke_test/1987_1996_dataset") %>%
dplyr::filter(Year == 1996 & TailNum == "N2823W") %>%
dplyr::select(Year, Month, DayofMonth, TailNum) %>%
dplyr::collect()
data <- open_dataset("ssb-prod-dapla-felles-data-delt/GIS/Vegnett/2022") %>%
dplyr::filter(municipality == "301") %>%
sfarrow::read_sf_dataset()
} # }