Экспорт данных из R: как экспортировать данные из R в CSV, Excel

Содержание:

Anonim

Как экспортировать данные из R

В этом руководстве мы узнаем, как экспортировать данные из среды R в разные форматы.

Чтобы экспортировать данные на жесткий диск, вам понадобится путь к файлу и расширение. Прежде всего, путь - это место, где будут храниться данные. В этом руководстве вы увидите, как хранить данные:

  • Жесткий диск
  • Гугл Диск
  • Dropbox

Во-вторых, R позволяет пользователям экспортировать данные в файлы разных типов. Мы покрываем существенное расширение файла:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • СТАТА

В целом экспортировать данные из R.

В этом руководстве вы узнаете:

  • Экспорт на жесткий диск
  • Как экспортировать DataFrame в файл CSV в R
  • Как экспортировать данные из R в файл Excel
  • Экспорт данных из R в другое программное обеспечение
  • Экспорт данных из R в файл SAS
  • Как экспортировать данные из R в файл STATA
  • Взаимодействовать с облачными сервисами
  • Гугл Диск
  • Экспорт в Dropbox

Экспорт на жесткий диск

Для начала вы можете сохранить данные прямо в рабочий каталог. Следующий код печатает путь к вашему рабочему каталогу:

directory <-getwd()directory

Выход:

## [1] "/Users/15_Export_to_do" 

По умолчанию файл будет сохранен по указанному ниже пути.

Для Mac OS:

/Users/USERNAME/Downloads/ 

Для Windows:

C:\Users\USERNAME\Documents\

Вы, конечно, можете выбрать другой путь. Например, вы можете изменить путь к папке загрузки.

Создать фрейм данных

Прежде всего, давайте импортируем набор данных mtcars и получим среднее значение mpg и disp, сгруппированных по передаче.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Выход ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Таблица состоит из трех строк и трех столбцов. Вы можете создать CSV-файл с помощью функции write.csv в R.

Как экспортировать DataFrame в файл CSV в R

Базовый синтаксис write.csv в R для экспорта DataFrame в CSV в R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Пример:

write.csv(df, "table_car.csv")

Код Пояснение

  • write.csv (df, "table_car.csv"): создать файл CSV на жестком диске:
    • df: имя фрейма данных в среде
    • "table_car.csv": назовите файл table_car и сохраните его как csv.

Примечание . Вы можете использовать функцию write.csv в R как write.csv2 (), чтобы разделить строки точкой с запятой для экспорта R в данные csv.

write.csv2(df, "table_car.csv")

Примечание : исключительно в педагогических целях мы создали функцию open_folder (), чтобы открыть для вас папку каталога. Вам просто нужно запустить приведенный ниже код и посмотреть, где хранится файл csv. Вы должны увидеть файл с именами table_car.csv для экспорта данных R в csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Как экспортировать данные из R в файл Excel

Теперь мы узнаем, как экспортировать данные из R в Excel:

Экспорт данных из R в Excel тривиален для пользователей Windows и сложнее для пользователей Mac OS. Оба пользователя будут использовать библиотеку xlsx для создания файла Excel. Небольшая разница связана с установкой библиотеки. Действительно, библиотека xlsx использует Java для создания файла. Для экспорта данных R в Excel необходимо установить Java, если она отсутствует на вашем компьютере.

Пользователи Windows

Если вы пользователь Windows, вы можете установить библиотеку напрямую с помощью conda, чтобы экспортировать фрейм данных в Excel R:

conda install -c r r-xlsx

После установки библиотеки вы можете использовать функцию write.xlsx (). В рабочем каталоге создается новая книга Excel для экспорта R в данные Excel.

library(xlsx)write.xlsx(df, "table_car.xlsx")

Если вы являетесь пользователем Mac OS, вам необходимо выполнить следующие действия:

  • Шаг 1. Установите последнюю версию Java.
  • Шаг 2: Установите библиотеку rJava
  • Шаг 3. Установите библиотеку xlsx

Шаг 1) Вы можете загрузить Java с официального сайта Oracle и установить ее.

Вы можете вернуться в Rstudio и проверить, какая версия Java установлена.

system("java -version")

На момент изучения руководства последняя версия Java - 9.0.4.

Шаг 2) Вам необходимо установить rjava в R. Мы рекомендуем вам установить R и Rstudio с Anaconda. Anaconda управляет зависимостями между библиотеками. В этом смысле Anaconda справится с тонкостями установки rJava.

Прежде всего, вам нужно обновить conda, а затем установить библиотеку. Вы можете скопировать и вставить следующие две строки кода в терминал.

conda - conda updateconda install -c r r-rjava

Затем откройте rjava в Rstudio

library(rJava)

Шаг 3) Наконец, пришло время установить xlsx. Еще раз, вы можете использовать conda для этого:

conda install -c r r-xlsx

Как и пользователи Windows, вы можете сохранять данные с помощью функции write.xlsx ()

library(xlsx)

Выход:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Экспорт данных из R в другое программное обеспечение

Экспорт данных в другое программное обеспечение так же просто, как их импорт. Библиотека «Гавань» предоставляет удобный способ экспортировать данные в

  • spss
  • сас
  • Стата

Прежде всего, импортируйте библиотеку. Если у вас нет «приюта», вы можете перейти сюда, чтобы установить его.

library(haven) 

SPSS файл

Ниже приведен код для экспорта данных в программное обеспечение SPSS:

write_sav(df, "table_car.sav") 

Экспорт данных из R в файл SAS

Так же просто, как spss, вы можете экспортировать в sas

write_sas(df, "table_car.sas7bdat")

Как экспортировать данные из R в файл STATA

Наконец, библиотека haven позволяет писать файл .dta.

write_dta(df, "table_car.dta")

р

Если вы хотите сохранить фрейм данных или любой другой объект R, вы можете использовать функцию save ().

save(df, file ='table_car.RData')

Вы можете проверить файлы, созданные выше, в текущем рабочем каталоге.

Взаимодействовать с облачными сервисами

И последнее, но не менее важное: R оснащен фантастическими библиотеками для взаимодействия со службами облачных вычислений. Последняя часть этого руководства посвящена экспорту / импорту файлов из:

  • Гугл Диск
  • Dropbox

Примечание . В этой части руководства предполагается, что у вас есть учетная запись в Google и Dropbox. Если нет, вы можете быстро создать его для - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Гугл Диск

Вам необходимо установить библиотеку googledrive, чтобы получить доступ к функции, позволяющей взаимодействовать с Google Диском.

Библиотека пока недоступна в Anaconda. Вы можете установить его с помощью приведенного ниже кода в консоли.

install.packages("googledrive") 

и вы открываете библиотеку.

library(googledrive)

Для пользователя, не являющегося пользователем conda, установка библиотеки проста: вы можете использовать функцию install.packages ('НАЗВАНИЕ ПАКЕТА) с именем пакета внутри круглых скобок. Не забывайте "". Обратите внимание, что R должен автоматически установить пакет в libPaths (). Стоит увидеть это в действии.

Загрузить на Google Диск

Чтобы загрузить файл на Google диск, вам необходимо использовать функцию drive_upload ().

Каждый раз, когда вы перезапускаете Rstudio, вам будет предлагаться разрешить доступ к tidyverse к Google Диску.

Базовый синтаксис drive_upload ():

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

После запуска кода необходимо подтвердить несколько вопросов.

drive_upload%<("table_car.csv", name ="table_car")

Выход:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Вы вводите 1 в консоли, чтобы подтвердить доступ

Затем вы будете перенаправлены в Google API, чтобы разрешить доступ. Щелкните Разрешить.

После завершения аутентификации вы можете закрыть браузер.

В консоли Rstudio вы можете увидеть сводку выполненного шага. Google успешно загрузил файл, расположенный локально на Диске. Google присвоил идентификатор каждому файлу на диске.

Вы можете увидеть этот файл в таблице Google.

drive_browse("table_car")

Выход:

Вы будете перенаправлены в таблицу Google

Импорт с Google Диска

Загружать файл с Google Диска с идентификатором удобно. Если вы знаете имя файла, вы можете получить его идентификатор следующим образом:

Примечание : в зависимости от вашего интернет-соединения и размера вашего диска, это займет время.

x <-drive_get("table_car")as_id(x)

Вы сохранили идентификатор в переменной x. Функция drive_download () позволяет скачивать файл с Google Диска.

Основной синтаксис:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Наконец, вы можете скачать файл:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Код Пояснение

  • drive_download (): функция для загрузки файла с Google Диска
  • as_id (x): используйте идентификатор для просмотра файла на Google Диске.
  • overwrite = TRUE: если файл существует, перезаписать его, иначе выполнение остановлено. Чтобы увидеть имя файла локально, вы можете использовать:

Выход:

Файл хранится в вашем рабочем каталоге. Помните, что вам нужно добавить расширение файла, чтобы открыть его в R. Вы можете создать полное имя с помощью функции paste () (например, table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Выход:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Наконец, вы можете удалить файл со своего диска Google.

## remove filedrive_find("table_car") %>%drive_rm()

Выход:

Это медленный процесс. Требуется время, чтобы удалить

Экспорт в Dropbox

R взаимодействует с Dropbox через библиотеку rdrop2. Библиотека также недоступна в Anaconda. Вы можете установить его через консоль

install.packages('rdrop2')
library(rdrop2)

Вам необходимо предоставить временный доступ к Dropbox с вашими учетными данными. После того, как идентификация будет выполнена, R сможет создавать, удалять выгрузки и скачивать в ваш Dropbox.

Прежде всего, вам необходимо предоставить доступ к своей учетной записи. Учетные данные кешируются в течение всего сеанса.

drop_auth()

Вы будете перенаправлены в Dropbox для подтверждения аутентификации.

Вы получите страницу подтверждения. Вы можете закрыть его и вернуться в R

Вы можете создать папку с помощью функции drop_create ().

  • drop_create ('my_first_drop'): создать папку в первой ветке Dropbox.
  • drop_create ('First_branch / my_first_drop'): создать папку внутри существующей папки First_branch.
drop_create('my_first_drop')

Выход:

В DropBox

Чтобы загрузить файл .csv в свой Dropbox, используйте функцию drop_upload ().

Базовый синтаксис:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Выход:

В DropBox

Вы можете прочитать CSV-файл из Dropbox с помощью функции drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Выход:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Когда вы закончите использовать файл и захотите его удалить. Вам нужно прописать путь к файлу в функции drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Выход:

Также есть возможность удалить папку

drop_delete('my_first_drop')

Выход:

Резюме

Мы можем обобщить все функции в таблице ниже.

Библиотека

Цель

Функция

основание

Экспорт csv

write.csv ()

xlsx

Экспорт в Excel

write.xlsx ()

убежище

Экспорт spss

write_sav ()

убежище

Экспорт sas

write_sas ()

убежище

Экспорт статистики

write_dta ()

основание

Экспорт R

спасти()

Гугл Диск

Загрузить Google Диск

drive_upload ()

Гугл Диск

Открыть на Google Диске

drive_browse ()

Гугл Диск

Получить идентификатор файла

drive_get (as_id ())

Гугл Диск

Скачать с Google Диска

download_google ()

Гугл Диск

Удалить файл с Google Диска

drive_rm ()

rdrop2

Аутентификация

drop_auth ()

rdrop2

Создать папку

drop_create ()

rdrop2

Загрузить в Dropbox

drop_upload ()

rdrop2

Читать csv из Dropbox

drop_read_csv

rdrop2

Удалить файл из Dropbox

drop_delete ()