Funksjon for aa laste inn "multifile" datasett fra Google Cloud Storage bucket
open_dataset.RdFunksjonen open_dataset kan brukes til aa lese deler av datasett (bl.a. .parquet-, .feather- og .csv-filer) fra Google Cloud Storage. Det lages en forbindelse til mappen der filen ligger og deretter kan man bruke argumenter fra dplyr, som filter og select, foer man bruker collect til aa lese inn dataene i R. open_dataset kan ogsaa brukes til aa lese inn sf-objekter (lagret som .parquet-fil med pakken sfarrow).
Examples
if (FALSE) { # \dontrun{
data <- open_dataset("ssb-prod-dapla-felles-data-delt/R_smoke_test/1987_1996_dataset") %>%
 dplyr::filter(Year == 1996 & TailNum == "N2823W") %>%
 dplyr::select(Year, Month, DayofMonth, TailNum) %>%
 dplyr::collect()
data <- open_dataset("ssb-prod-dapla-felles-data-delt/GIS/Vegnett/2022") %>%
 dplyr::filter(municipality == "301") %>%
 sfarrow::read_sf_dataset()
 } # }