Duomenų eksportavimas iš R: kaip eksportuoti duomenis iš R į CSV, „Excel“

Turinys:

Anonim

Kaip eksportuoti duomenis iš

Šioje pamokoje sužinosime, kaip eksportuoti duomenis iš R aplinkos į skirtingus formatus.

Norint eksportuoti duomenis į kietąjį diską, reikia failo kelio ir plėtinio. Visų pirma, kelias yra vieta, kur bus saugomi duomenys. Šioje pamokoje pamatysite, kaip saugoti duomenis:

  • Kietasis diskas
  • Google diskas
  • „Dropbox“

Antra, R leidžia vartotojams eksportuoti duomenis į skirtingų tipų failus. Apimame pagrindinio failo plėtinį:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Apskritai nesunku eksportuoti duomenis iš R.

Šioje pamokoje sužinosite

  • Eksportuoti į standųjį diską
  • Kaip eksportuoti „DataFrame“ į CSV failą
  • Kaip eksportuoti duomenis iš R į „Excel“ failą
  • Duomenų eksportavimas iš R į skirtingą programinę įrangą
  • Duomenų eksportavimas iš R į SAS failą
  • Kaip eksportuoti duomenis iš R į STATA failą
  • Bendraukite su „Cloud Services“
  • Google diskas
  • Eksportuoti į „Dropbox“

Eksportuoti į standųjį diską

Pirmiausia galite išsaugoti duomenis tiesiai į darbo katalogą. Šis kodas atspausdina jūsų darbo katalogo kelią:

directory <-getwd()directory

Išvestis:

## [1] "/Users/15_Export_to_do" 

Pagal numatytuosius nustatymus failas bus išsaugotas žemiau esančiame kelyje.

„Mac OS“:

/Users/USERNAME/Downloads/ 

„Windows“:

C:\Users\USERNAME\Documents\

Galite, žinoma, nustatyti kitą kelią. Pavyzdžiui, galite pakeisti atsisiuntimo aplanko kelią.

Sukurti duomenų rėmelį

Pirmiausia importuokime „mtcars“ duomenų rinkinį ir gaukite mpg ir disp vidurkį, sugrupuotą pagal pavaras.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Išvestis :

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Lentelėje yra trys eilutės ir trys stulpeliai. CSV failą galite sukurti naudodami funkciją write.csv R.

Kaip eksportuoti „DataFrame“ į CSV failą

Pagrindinė „write.csv“ sintakse R, norint eksportuoti „DataFrame“ į CSV R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Pavyzdys:

write.csv(df, "table_car.csv")

Kodo paaiškinimas

  • write.csv (df, "table_car.csv"): sukurkite CSV failą standžiajame diske:
    • df: duomenų rėmelio pavadinimas aplinkoje
    • "table_car.csv": Pavadinkite failą table_car ir išsaugokite jį kaip csv

Pastaba : Funkciją write.csv R galite naudoti kaip write.csv2 (), norėdami atskirti eilutes kabliataškiu, skirtą R eksportuoti į csv duomenis.

write.csv2(df, "table_car.csv")

Pastaba : Tik pedagoginiams tikslams sukūrėme funkciją, pavadintą open_folder (), kad atidarytumėte katalogų aplanką jums. Jums tiesiog reikia paleisti žemiau esantį kodą ir pamatyti, kur saugomas csv failas. Turėtumėte pamatyti failų pavadinimus table_car.csv, jei norite eksportuoti duomenis R į csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Kaip eksportuoti duomenis iš R į „Excel“ failą

Dabar sužinosime, kaip eksportuoti duomenis iš R į „Excel“:

Duomenų eksportavimas iš R į „Excel“ yra nereikšmingas „Windows“ vartotojams, o „Mac OS“ vartotojams - sudėtingesnis. Abu vartotojai naudos „xlsx“ biblioteką „Excel“ failui sukurti. Šiek tiek skiriasi dėl bibliotekos įrengimo. Iš tiesų biblioteka xlsx failui sukurti naudoja „Java“. Jei „Data R“ eksportuojama į „Excel“, jūsų kompiuteryje nėra „Java“.

„Windows“ vartotojai

Jei esate „Windows“ vartotojas, galite įdiegti biblioteką tiesiogiai su „conda“, kad eksportuotumėte duomenų rėmą į „Excel R“:

conda install -c r r-xlsx

Įdiegę biblioteką, galite naudoti funkciją write.xlsx (). Darbiniame kataloge sukuriama nauja „Excel“ darbaknygė, skirta R eksportuoti į „Excel“ duomenis

library(xlsx)write.xlsx(df, "table_car.xlsx")

Jei esate „Mac OS“ vartotojas, turite atlikti šiuos veiksmus:

  • 1 žingsnis: įdiekite naujausią „Java“ versiją
  • 2 žingsnis: įdiekite biblioteką „rJava“
  • 3 žingsnis: įdiekite biblioteką „xlsx“

1 žingsnis) Galite atsisiųsti „Java“ iš oficialios „Oracle“ svetainės ir ją įdiegti.

Galite grįžti į „Rstudio“ ir patikrinti, kuri „Java“ versija yra įdiegta.

system("java -version")

Pamokos metu naujausia „Java“ versija yra 9.0.4.

2 žingsnis) Turite įdiegti „rjava“ į „R.“. Mes rekomendavome įdiegti „R“ ir „Rstudio“ su „Anaconda“. „Anaconda“ valdo priklausomybę tarp bibliotekų. Šia prasme „Anaconda“ spręs „rJava“ diegimo subtilybes.

Visų pirma turite atnaujinti „conda“ ir tada įdiegti biblioteką. Terminale galite nukopijuoti ir įklijuoti kitas dvi eilutes kodo.

conda - conda updateconda install -c r r-rjava

Tada atidarykite „rjava“ „Rstudio“

library(rJava)

3 žingsnis) Pagaliau atėjo laikas įdiegti „xlsx“. Dar kartą galite tai padaryti naudodami „conda“:

conda install -c r r-xlsx

Kaip ir „Windows“ vartotojai, galite įrašyti duomenis naudodamiesi funkcija write.xlsx ()

library(xlsx)

Išvestis:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Duomenų eksportavimas iš R į skirtingą programinę įrangą

Duomenų eksportavimas į skirtingą programinę įrangą yra toks pat paprastas, kaip ir jų importavimas. Bibliotekos „prieglauda“ yra patogus būdas eksportuoti duomenis į

  • spss
  • sas
  • stata

Pirmiausia importuokite biblioteką. Jei neturite „prieglobsčio“, galite apsilankyti čia, kad jį įdiegtumėte.

library(haven) 

SPSS failas

Žemiau yra kodas, skirtas eksportuoti duomenis į SPSS programinę įrangą:

write_sav(df, "table_car.sav") 

Duomenų eksportavimas iš R į SAS failą

Lygiai taip pat paprasta, kaip spss, galite eksportuoti į „sas“

write_sas(df, "table_car.sas7bdat")

Kaip eksportuoti duomenis iš R į STATA failą

Galiausiai „haven“ biblioteka leidžia rašyti .dta failą.

write_dta(df, "table_car.dta")

R

Jei norite išsaugoti duomenų rėmą ar bet kurį kitą R objektą, galite naudoti „save“ (išsaugojimo) funkciją.

save(df, file ='table_car.RData')

Aukščiau sukurtus failus galite patikrinti dabartiniame darbo kataloge

Bendraukite su „Cloud Services“

Paskutinis, bet ne mažiau svarbus dalykas yra tai, kad R turi fantastiškas bibliotekas, galinčias bendrauti su debesų kompiuterijos paslaugomis. Paskutinėje šios pamokos dalyje kalbama apie failų eksportavimą / importavimą iš:

  • Google diskas
  • „Dropbox“

Pastaba : šioje mokymo programos dalyje daroma prielaida, kad turite „Google“ ir „Dropbox“ paskyrą. Jei ne, galite greitai sukurti „Google“ diskui: https://accounts.google.com/SignUp?hl=lt - „Dropbox“: https://www.dropbox.com/h

Google diskas

Norėdami pasiekti funkciją, leidžiančią sąveikauti su „Google“ disku, turite įdiegti bibliotekos „googledrive“.

Biblioteka dar nėra prieinama „Anaconda“. Jį galite įdiegti naudodami žemiau esantį kodą konsolėje.

install.packages("googledrive") 

ir atidarai biblioteką.

library(googledrive)

Ne „conda“ vartotojams lengva įdiegti biblioteką, galite naudoti funkciją install.packages ('PAKUOTĖS PAVADINIMAS] su paketo pavadinimu skliausteliuose. Nepamirškite „“. Atkreipkite dėmesį, kad R turėtų automatiškai įdiegti paketą į `libPaths (). Verta pamatyti tai veikiant.

Įkelti į „Google“ diską

Norėdami įkelti failą į „Google“ diską, turite naudoti funkciją drive_upload ().

Kiekvieną kartą iš naujo paleidę „Rstudio“ būsite paraginti leisti „Google“ diskui prieigą.

Pagrindinė „drive_upload“ () sintaksė yra

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Paleidus kodą, turite patvirtinti kelis klausimus

drive_upload%<("table_car.csv", name ="table_car")

Išvestis:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Norėdami patvirtinti prieigą, konsolėje įveskite 1

Tada būsite nukreipti į „Google“ API, kad leistumėte prieigą. Spustelėkite Leisti.

Baigę autentifikavimą, galite uždaryti naršyklę.

„Rstudio“ pulte galite pamatyti atlikto veiksmo santrauką. „Google“ sėkmingai įkėlė failą, esantį vietoje Diske. „Google“ priskyrė ID kiekvienam diske esančiam failui.

Šį failą galite pamatyti „Google“ skaičiuoklėje.

drive_browse("table_car")

Išvestis:

Būsite nukreipti į „Google“ skaičiuoklę

Importuoti iš „Google“ disko

Patogu įkelti failą iš „Google“ disko su ID. Jei žinote failo pavadinimą, jo ID galite gauti taip:

Pastaba : atsižvelgiant į interneto ryšį ir Disko dydį, tai užtruks.

x <-drive_get("table_car")as_id(x)

Jūs išsaugojote ID kintamajame x. Funkcija drive_download () leidžia atsisiųsti failą iš „Google“ disko.

Pagrindinė sintaksė yra:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Galiausiai galite atsisiųsti failą:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Kodo paaiškinimas

  • drive_download (): funkcija atsisiųsti failą iš „Google“ disko
  • as_id (x): naudokite ID naršydami failą „Google“ diske
  • perrašyti = TRUE: Jei failas yra, perrašykite jį, kitaip vykdymas bus sustabdytas. Norėdami pamatyti failo pavadinimą vietoje, galite naudoti:

Išvestis:

Failas saugomas jūsų darbo kataloge. Atminkite, kad turite atidaryti failo išplėtimą, kad jį atidarytumėte R. Visą pavadinimą galite sukurti naudodami funkciją „paste“) (ty table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Išvestis:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Galiausiai galite pašalinti failą iš „Google“ disko.

## remove filedrive_find("table_car") %>%drive_rm()

Išvestis:

Tai lėtas procesas. Užtrunka ištrinti

Eksportuoti į „Dropbox“

R sąveikauja su „Dropbox“ per „rdrop2“ biblioteką. Biblioteka taip pat nėra „Anaconda“. Jį galite įdiegti per konsolę

install.packages('rdrop2')
library(rdrop2)

Turite suteikti savo laikiną prieigą prie „Dropbox“. Atlikus identifikavimą, R gali sukurti, pašalinti įkėlimą ir atsisiųsti į „Dropbox“.

Visų pirma turite suteikti prieigą prie savo paskyros. Viso seanso metu kredencialai yra talpykloje.

drop_auth()

Būsite nukreipti į „Dropbox“, kad patvirtintumėte autentifikavimą.

Gausite patvirtinimo puslapį. Galite jį uždaryti ir grįžti į R

Galite sukurti aplanką naudodami funkciją drop_create ().

  • drop_create ('my_first_drop'): sukurkite aplanką pirmajame „Dropbox“ filiale
  • drop_create ('First_branch / my_first_drop'): sukurkite aplanką esamo „First_branch“ aplanko viduje.
drop_create('my_first_drop')

Išvestis:

„DropBox“

Jei norite įkelti .csv failą į „Dropbox“, naudokite funkciją drop_upload ().

Pagrindinė sintaksė:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Išvestis:

„DropBox“

Galite perskaityti csv failą iš „Dropbox“ naudodami funkciją drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Išvestis:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Kai baigsite naudoti failą ir norite jį ištrinti. Jūs turite parašyti failo kelią funkcijoje drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Išvestis:

Taip pat galima ištrinti aplanką

drop_delete('my_first_drop')

Išvestis:

Santrauka

Žemiau esančioje lentelėje galime apibendrinti visas funkcijas

Biblioteka

Tikslas

Funkcija

bazė

Eksportuoti csv

rašyti.csv ()

xlsx

Eksportas „Excel“

write.xlsx ()

prieglauda

Eksportuoti spss

rašyti_sav ()

prieglauda

Eksportuoti sas

rašyti_sas ()

prieglauda

Eksportuoti statistiką

rašyti_dta ()

bazė

Eksportuoti R

sutaupyti()

Google diskas

Įkelkite „Google“ diską

drive_upload ()

Google diskas

Atidarykite „Google“ diske

vairuoti_naršyti ()

Google diskas

Gauti failo ID

drive_get (as_id ())

Google diskas

Atsisiųskite iš „Google“ disko

download_google ()

Google diskas

Pašalinti failą iš „Google“ disko

drive_rm ()

rdrop2

Autentifikavimas

drop_auth ()

rdrop2

Sukurkite aplanką

drop_create ()

rdrop2

Įkelti į „Dropbox“

drop_upload ()

rdrop2

Skaitykite csv iš „Dropbox“

drop_read_csv

rdrop2

Ištrinti failą iš „Dropbox“

drop_delete ()