Mis on predict() R-is?
R-i funktsiooniga predict() saate teha ennustusi uute, varem nägemata andmete kohta. See funktsioon on oluline vahend masinõppes.
Milleks kasutatakse R-is funktsiooni predict()?
R-funktsioon predict() on mitmekülgne vahend, mida kasutatakse ennustavates mudelites. See genereerib ennustusi uute või olemasolevate andmepunktide jaoks, tuginedes eelnevalt kavandatud statistilistele mudelitele, nagu lineaarne regressioon, loogiline regressioon, otsustuspuud ja muud modelleerimistehnikad.
Mis on R-keeles funktsiooni predict() süntaks?
R-i funktsioon predict() võtab argumentidena vastu treenitud mudeli ja andmepunktid, millele ennustus peaks kehtima. Saate määrata erinevaid valikuid ja parameetreid vastavalt kasutatava mudeli tüübile. Tulemuseks on ennustuste vektor, mis võib olla kasulik mitmesuguste analüütiliste eesmärkide jaoks, sealhulgas mudeli tulemuslikkuse hindamiseks, otsuste tegemiseks või tulemusandmete illustreerimiseks.
predict(object, newdata, interval)Robject: Koolitatud mudel, millele ennustused rakendataksenewdata: Ennustuse andmepunktinterval: Valikuline argument usaldusvahemiku tüübi sisestamiseks (confidencekeskmise vahemiku jaoks,predictionennustuste jaoks)
Näide predict() kasutamisest R-is
Järgmine näide illustreerib, kuidas R-is funktsioon predict() töötab. Kasutame kasutaja määratud andmekogumit, mis sisaldab kiiruse ja vahemaa väärtusi.
Andmete loomine ja kuvamine
# Creating a data frame with custom speed and distance values
custom_data <- data.frame(speed = c(15, 20, 25, 30, 35),
distance = c(30, 40, 50, 60, 70))
# Displaying the custom data frame
print("Custom Data Frame:")
print(custom_data)REsmalt loome kasutaja määratud andmekogumi, et hinnata kiiruse ja vahemaa vahelist seost. Kasutame funktsiooni data.frame(), et luua andmekehik, ja määrame seejärel muutujate speed ja distance väärtused vastavalt c(15, 20, 25, 30, 35) ja c(30, 40, 50, 60, 70).
Pärast andmekogumi loomist kuvame selle funktsiooni print() abil. Nii saame kontrollida uue andmekogumi struktuuri ja määratud väärtusi.
Väljund:
"Custom Data Frame:"
speed distance
1 15 30
2 20 40
3 25 50
4 30 60
5 35 70RLineaarse mudeli loomine
# Creating a linear model for the custom data frame
custom_model <- lm(distance ~ speed, data = custom_data)
# Printing the model results
print("Model Results:")
print(summary(custom_model))RVäljund:
"Model Results:"
Call:
lm(formula = distance ~ speed, data = custom_data)
Residuals:
1 2 3 4 5
-2 -1 1 0 2
Coefficients:
(Intercept) -10.00 15.81 -0.632 0.55897
speed 2.00 0.47 4.254 0.01205RVäljundis näeme lineaarse mudeli (custom_model), mis loodi andmekogumi jaoks ja modelleerib kiiruse ja vahemaa vahelist seost. Saame mudeli tulemuse, sealhulgas koefitsiendid ja statistilised andmed.
Uute kiiruse väärtuste määratlemine ja prognooside tegemine
# Creating a data frame with new speed values
new_speed_values <- data.frame(speed = c(40, 45, 50, 55, 60))
# Predicting future distance values using the linear model
predicted_distance <- predict(custom_model, newdata = new_speed_values)RNüüd oleme loonud uue andmekogumi (new_speed_values) uute kiiruse väärtustega. Seejärel kasutasime R predict(), et teha vastavate kauguste väärtuste prognoose, kasutades eespool loodud lineaarset mudelit.
Prognooside kuvamine
# Displaying the predicted values
print("Predicted Distance Values:")
print(predicted_distance)RVäljund näitab kiiruse põhjal ennustatud kauguse väärtusi:
"Predicted Distance Values:"
1 2 3 4 5
80.0000 90.0000 100.0000 110.0000 120.0000R