R Rūšiuokite duomenų rėmelį naudodami „Order“ ()

Turinys:

Anonim

Atlikdami duomenų analizę, galite rūšiuoti duomenis pagal tam tikrą duomenų rinkinio kintamąjį. R, mes galime naudoti funkcijų tvarkos () pagalbą. R, mes galime lengvai rūšiuoti ištisinio kintamojo ar faktoriaus kintamojo vektorių. Duomenys gali būti išdėstyti didėjimo arba mažėjimo tvarka.

Sintaksė:

sort(x, decreasing = FALSE, na.last = TRUE):

Argumentas:

  • x : vektorius, kuriame yra tęstinis arba faktoriaus kintamasis
  • mažėja : rūšiavimo metodo tvarkos kontrolė. Pagal numatytuosius nustatymus mažinimas yra nustatytas kaip „NETIESA“.
  • paskutinis : nurodo, ar „NA“ reikšmė turėtų būti paskutinė, ar ne

1 pavyzdys

Pvz., Galime sukurti „bibble“ duomenų rėmelį ir rūšiuoti vieną ar kelis kintamuosius. „Tibble“ duomenų rėmas yra naujas požiūris į duomenų rėmą. Tai pagerina duomenų rėmelio sintaksę ir vengia varginančio duomenų tipo formatavimo, ypač atsižvelgiant į simbolius. Tai taip pat yra patogus būdas sukurti duomenų rėmelį rankomis, o tai yra mūsų tikslas. Norėdami sužinoti daugiau apie tibble, žiūrėkite vinjetę: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html

library(dplyr)set.seed(1234)data_frame <- tibble(c1 = rnorm(50, 5, 1.5),c2 = rnorm(50, 5, 1.5),c3 = rnorm(50, 5, 1.5),c4 = rnorm(50, 5, 1.5),c5 = rnorm(50, 5, 1.5))# Sort by c1df <-data_frame[order(data_frame$c1),]head(df)

Išvestis:

# A tibble: 6 x 5## c1 c2 c3 c4 c5##     ## 1 1.481453 3.477557 4.246283 3.686611 6.0511003## 2 1.729941 5.824996 4.525823 6.753663 0.1502718## 3 2.556360 6.275348 2.524849 6.368483 5.4787404## 4 2.827693 4.769902 5.120089 3.743626 4.0103449## 5 2.988510 4.395902 2.077631 4.236894 4.6176880## 6 3.122021 6.317305 5.413840 3.551145 5.6067027

2 pavyzdys

# Sort by c3 and c4df <-data_frame[order(data_frame$c3, data_frame$c4),]head(df)

Išvestis:

# A tibble: 6 x 5## c1 c2 c3 c4 c5##     ## 1 2.988510 4.395902 2.077631 4.236894 4.617688## 2 2.556360 6.275348 2.524849 6.368483 5.478740## 3 3.464516 3.914627 2.730068 9.565649 6.016123## 4 4.233486 3.292088 3.133568 7.517309 4.772395## 5 3.935840 2.941547 3.242078 6.464048 3.599745## 6 3.835619 4.947859 3.335349 4.378370 7.240240

3 pavyzdys

# Sort by c3(descending) and c4(acending)df <-data_frame[order(-data_frame$c3, data_frame$c4),]head(df)

Išvestis:

# A tibble: 6 x 5## c1 c2 c3 c4 c5##     ## 1 4.339178 4.450214 8.087243 4.5010140 8.410225## 2 3.959420 8.105406 7.736312 7.1168936 5.431565## 3 3.339023 3.298088 7.494285 5.9303153 7.035912## 4 3.397036 5.382794 7.092722 0.7163620 5.620098## 5 6.653446 4.733315 6.520536 0.9016707 4.513410## 6 4.558559 4.712609 6.380086 6.0562703 5.044277