Как экспортировать данные из R
В этом руководстве мы узнаем, как экспортировать данные из среды R в разные форматы.
Чтобы экспортировать данные на жесткий диск, вам понадобится путь к файлу и расширение. Прежде всего, путь - это место, где будут храниться данные. В этом руководстве вы увидите, как хранить данные:
- Жесткий диск
- Гугл Диск
- Dropbox
Во-вторых, R позволяет пользователям экспортировать данные в файлы разных типов. Мы покрываем существенное расширение файла:
- csv
- xlsx
- RDS
- SAS
- SPSS
- СТАТА
В целом экспортировать данные из R.
В этом руководстве вы узнаете:
- Экспорт на жесткий диск
- Как экспортировать DataFrame в файл CSV в R
- Как экспортировать данные из R в файл Excel
- Экспорт данных из R в другое программное обеспечение
- Экспорт данных из R в файл SAS
- Как экспортировать данные из R в файл STATA
- Взаимодействовать с облачными сервисами
- Гугл Диск
- Экспорт в Dropbox
Экспорт на жесткий диск
Для начала вы можете сохранить данные прямо в рабочий каталог. Следующий код печатает путь к вашему рабочему каталогу:
directory <-getwd()directory
Выход:
## [1] "/Users/15_Export_to_do"
По умолчанию файл будет сохранен по указанному ниже пути.
Для Mac OS:
/Users/USERNAME/Downloads/
Для Windows:
C:\Users\USERNAME\Documents\
Вы, конечно, можете выбрать другой путь. Например, вы можете изменить путь к папке загрузки.
Создать фрейм данных
Прежде всего, давайте импортируем набор данных mtcars и получим среднее значение mpg и disp, сгруппированных по передаче.
library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df
Выход ::
## # A tibble: 3 x 3## gear mean_mpg mean_disp##lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800
Таблица состоит из трех строк и трех столбцов. Вы можете создать CSV-файл с помощью функции write.csv в R.
Как экспортировать DataFrame в файл CSV в R
Базовый синтаксис write.csv в R для экспорта DataFrame в CSV в R:
write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Пример:
write.csv(df, "table_car.csv")
Код Пояснение
- write.csv (df, "table_car.csv"): создать файл CSV на жестком диске:
- df: имя фрейма данных в среде
- "table_car.csv": назовите файл table_car и сохраните его как csv.
Примечание . Вы можете использовать функцию write.csv в R как write.csv2 (), чтобы разделить строки точкой с запятой для экспорта R в данные csv.
write.csv2(df, "table_car.csv")
Примечание : исключительно в педагогических целях мы создали функцию open_folder (), чтобы открыть для вас папку каталога. Вам просто нужно запустить приведенный ниже код и посмотреть, где хранится файл csv. Вы должны увидеть файл с именами table_car.csv для экспорта данных R в csv.
# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)
Как экспортировать данные из R в файл Excel
Теперь мы узнаем, как экспортировать данные из R в Excel:
Экспорт данных из R в Excel тривиален для пользователей Windows и сложнее для пользователей Mac OS. Оба пользователя будут использовать библиотеку xlsx для создания файла Excel. Небольшая разница связана с установкой библиотеки. Действительно, библиотека xlsx использует Java для создания файла. Для экспорта данных R в Excel необходимо установить Java, если она отсутствует на вашем компьютере.
Пользователи Windows
Если вы пользователь Windows, вы можете установить библиотеку напрямую с помощью conda, чтобы экспортировать фрейм данных в Excel R:
conda install -c r r-xlsx
После установки библиотеки вы можете использовать функцию write.xlsx (). В рабочем каталоге создается новая книга Excel для экспорта R в данные Excel.
library(xlsx)write.xlsx(df, "table_car.xlsx")
Если вы являетесь пользователем Mac OS, вам необходимо выполнить следующие действия:
- Шаг 1. Установите последнюю версию Java.
- Шаг 2: Установите библиотеку rJava
- Шаг 3. Установите библиотеку xlsx
Шаг 1) Вы можете загрузить Java с официального сайта Oracle и установить ее.
Вы можете вернуться в Rstudio и проверить, какая версия Java установлена.
system("java -version")
На момент изучения руководства последняя версия Java - 9.0.4.
Шаг 2) Вам необходимо установить rjava в R. Мы рекомендуем вам установить R и Rstudio с Anaconda. Anaconda управляет зависимостями между библиотеками. В этом смысле Anaconda справится с тонкостями установки rJava.
Прежде всего, вам нужно обновить conda, а затем установить библиотеку. Вы можете скопировать и вставить следующие две строки кода в терминал.
conda - conda updateconda install -c r r-rjava
Затем откройте rjava в Rstudio
library(rJava)
Шаг 3) Наконец, пришло время установить xlsx. Еще раз, вы можете использовать conda для этого:
conda install -c r r-xlsx
Как и пользователи Windows, вы можете сохранять данные с помощью функции write.xlsx ()
library(xlsx)
Выход:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Экспорт данных из R в другое программное обеспечение
Экспорт данных в другое программное обеспечение так же просто, как их импорт. Библиотека «Гавань» предоставляет удобный способ экспортировать данные в
- spss
- сас
- Стата
Прежде всего, импортируйте библиотеку. Если у вас нет «приюта», вы можете перейти сюда, чтобы установить его.
library(haven)
SPSS файл
Ниже приведен код для экспорта данных в программное обеспечение SPSS:
write_sav(df, "table_car.sav")
Экспорт данных из R в файл SAS
Так же просто, как spss, вы можете экспортировать в sas
write_sas(df, "table_car.sas7bdat")
Как экспортировать данные из R в файл STATA
Наконец, библиотека haven позволяет писать файл .dta.
write_dta(df, "table_car.dta")
р
Если вы хотите сохранить фрейм данных или любой другой объект R, вы можете использовать функцию save ().
save(df, file ='table_car.RData')
Вы можете проверить файлы, созданные выше, в текущем рабочем каталоге.
Взаимодействовать с облачными сервисами
И последнее, но не менее важное: R оснащен фантастическими библиотеками для взаимодействия со службами облачных вычислений. Последняя часть этого руководства посвящена экспорту / импорту файлов из:
- Гугл Диск
- Dropbox
Примечание . В этой части руководства предполагается, что у вас есть учетная запись в Google и Dropbox. Если нет, вы можете быстро создать его для - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
Гугл Диск
Вам необходимо установить библиотеку googledrive, чтобы получить доступ к функции, позволяющей взаимодействовать с Google Диском.
Библиотека пока недоступна в Anaconda. Вы можете установить его с помощью приведенного ниже кода в консоли.
install.packages("googledrive")
и вы открываете библиотеку.
library(googledrive)
Для пользователя, не являющегося пользователем conda, установка библиотеки проста: вы можете использовать функцию install.packages ('НАЗВАНИЕ ПАКЕТА) с именем пакета внутри круглых скобок. Не забывайте "". Обратите внимание, что R должен автоматически установить пакет в libPaths (). Стоит увидеть это в действии.
Загрузить на Google Диск
Чтобы загрузить файл на Google диск, вам необходимо использовать функцию drive_upload ().
Каждый раз, когда вы перезапускаете Rstudio, вам будет предлагаться разрешить доступ к tidyverse к Google Диску.
Базовый синтаксис drive_upload ():
drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
После запуска кода необходимо подтвердить несколько вопросов.
drive_upload%<("table_car.csv", name ="table_car")
Выход:
## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv
Вы вводите 1 в консоли, чтобы подтвердить доступ
Затем вы будете перенаправлены в Google API, чтобы разрешить доступ. Щелкните Разрешить.
После завершения аутентификации вы можете закрыть браузер.
В консоли Rstudio вы можете увидеть сводку выполненного шага. Google успешно загрузил файл, расположенный локально на Диске. Google присвоил идентификатор каждому файлу на диске.
Вы можете увидеть этот файл в таблице Google.
drive_browse("table_car")
Выход:
Вы будете перенаправлены в таблицу Google
Импорт с Google Диска
Загружать файл с Google Диска с идентификатором удобно. Если вы знаете имя файла, вы можете получить его идентификатор следующим образом:
Примечание : в зависимости от вашего интернет-соединения и размера вашего диска, это займет время.
x <-drive_get("table_car")as_id(x)
Вы сохранили идентификатор в переменной x. Функция drive_download () позволяет скачивать файл с Google Диска.
Основной синтаксис:
drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Наконец, вы можете скачать файл:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Код Пояснение
- drive_download (): функция для загрузки файла с Google Диска
- as_id (x): используйте идентификатор для просмотра файла на Google Диске.
- overwrite = TRUE: если файл существует, перезаписать его, иначе выполнение остановлено. Чтобы увидеть имя файла локально, вы можете использовать:
Выход:
Файл хранится в вашем рабочем каталоге. Помните, что вам нужно добавить расширение файла, чтобы открыть его в R. Вы можете создать полное имя с помощью функции paste () (например, table_car.csv)
google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car
Выход:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Наконец, вы можете удалить файл со своего диска Google.
## remove filedrive_find("table_car") %>%drive_rm()
Выход:
Это медленный процесс. Требуется время, чтобы удалить
Экспорт в Dropbox
R взаимодействует с Dropbox через библиотеку rdrop2. Библиотека также недоступна в Anaconda. Вы можете установить его через консоль
install.packages('rdrop2')
library(rdrop2)
Вам необходимо предоставить временный доступ к Dropbox с вашими учетными данными. После того, как идентификация будет выполнена, R сможет создавать, удалять выгрузки и скачивать в ваш Dropbox.
Прежде всего, вам необходимо предоставить доступ к своей учетной записи. Учетные данные кешируются в течение всего сеанса.
drop_auth()
Вы будете перенаправлены в Dropbox для подтверждения аутентификации.
Вы получите страницу подтверждения. Вы можете закрыть его и вернуться в R
Вы можете создать папку с помощью функции drop_create ().
- drop_create ('my_first_drop'): создать папку в первой ветке Dropbox.
- drop_create ('First_branch / my_first_drop'): создать папку внутри существующей папки First_branch.
drop_create('my_first_drop')
Выход:
В DropBox
Чтобы загрузить файл .csv в свой Dropbox, используйте функцию drop_upload ().
Базовый синтаксис:
drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Выход:
В DropBox
Вы можете прочитать CSV-файл из Dropbox с помощью функции drop_read_csv ()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car
Выход:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Когда вы закончите использовать файл и захотите его удалить. Вам нужно прописать путь к файлу в функции drop_delete ()
drop_delete('my_first_drop/table_car.csv')
Выход:
Также есть возможность удалить папку
drop_delete('my_first_drop')
Выход:
Резюме
Мы можем обобщить все функции в таблице ниже.
Библиотека |
Цель |
Функция |
---|---|---|
основание |
Экспорт csv |
write.csv () |
xlsx |
Экспорт в Excel |
write.xlsx () |
убежище |
Экспорт spss |
write_sav () |
убежище |
Экспорт sas |
write_sas () |
убежище |
Экспорт статистики |
write_dta () |
основание |
Экспорт R |
спасти() |
Гугл Диск |
Загрузить Google Диск |
drive_upload () |
Гугл Диск |
Открыть на Google Диске |
drive_browse () |
Гугл Диск |
Получить идентификатор файла |
drive_get (as_id ()) |
Гугл Диск |
Скачать с Google Диска |
download_google () |
Гугл Диск |
Удалить файл с Google Диска |
drive_rm () |
rdrop2 |
Аутентификация |
drop_auth () |
rdrop2 |
Создать папку |
drop_create () |
rdrop2 |
Загрузить в Dropbox |
drop_upload () |
rdrop2 |
Читать csv из Dropbox |
drop_read_csv |
rdrop2 |
Удалить файл из Dropbox |
drop_delete () |