R-i funkt­sioo­niga predict() saate teha ennustusi uute, varem nägemata andmete kohta. See funkt­sioon on oluline vahend ma­si­nõp­pes.

Milleks ka­su­ta­takse R-is funkt­siooni predict()?

R-funkt­sioon predict() on mit­me­külgne vahend, mida ka­su­ta­takse en­nus­ta­va­tes mudelites. See ge­ne­ree­rib ennustusi uute või ole­mas­ole­vate and­me­punk­tide jaoks, tuginedes eelnevalt ka­van­da­tud sta­tis­ti­lis­tele mu­de­li­tele, nagu lineaarne reg­res­sioon, loogiline reg­res­sioon, ot­sus­tus­puud ja muud mo­del­lee­ri­mis­teh­ni­kad.

Mis on R-keeles funkt­siooni predict() süntaks?

R-i funkt­sioon predict() võtab ar­gu­men­ti­dena vastu treenitud mudeli ja and­me­punk­tid, millele ennustus peaks kehtima. Saate määrata erinevaid valikuid ja pa­ra­meetreid vastavalt ka­su­ta­tava mudeli tüübile. Tu­le­mu­seks on en­nus­tuste vektor, mis võib olla kasulik mit­me­su­guste ana­lüü­ti­liste ees­mär­kide jaoks, seal­hul­gas mudeli tu­le­mus­lik­kuse hin­da­miseks, otsuste te­ge­miseks või tu­le­musand­mete il­lust­ree­ri­miseks.

predict(object, newdata, interval)
R
  • object: Koo­li­ta­tud mudel, millele en­nus­tused ra­ken­da­takse
  • newdata: Ennustuse and­me­punkt
  • interval: Va­li­ku­line argument usal­dus­va­he­miku tüübi si­ses­ta­miseks (confidence keskmise vahemiku jaoks, prediction en­nus­tuste jaoks)

Näide predict() ka­su­ta­mi­sest R-is

Järgmine näide il­lust­ree­rib, kuidas R-is funkt­sioon predict() töötab. Kasutame kasutaja määratud and­me­ko­gu­mit, mis sisaldab kiiruse ja vahemaa väärtusi.

Andmete loomine ja kuvamine

# Creating a data frame with custom speed and distance values
custom_data <- data.frame(speed = c(15, 20, 25, 30, 35),
    distance = c(30, 40, 50, 60, 70))
# Displaying the custom data frame
print("Custom Data Frame:")
print(custom_data)
R

Esmalt loome kasutaja määratud and­me­ko­gumi, et hinnata kiiruse ja vahemaa vahelist seost. Kasutame funkt­siooni data.frame(), et luua and­me­kehik, ja määrame seejärel muutujate speed ja distance väärtused vastavalt c(15, 20, 25, 30, 35) ja c(30, 40, 50, 60, 70).

Pärast and­me­ko­gumi loomist kuvame selle funkt­siooni print() abil. Nii saame kont­rol­lida uue and­me­ko­gumi struk­tuuri ja määratud väärtusi.

Väljund:

"Custom Data Frame:"
    speed distance
1        15        30
2        20        40
3        25        50
4        30        60
5        35        70
R

Lineaarse mudeli loomine

# Creating a linear model for the custom data frame
custom_model <- lm(distance ~ speed, data = custom_data)
# Printing the model results
print("Model Results:")
print(summary(custom_model))
R

Väljund:

"Model Results:"
Call:
lm(formula = distance ~ speed, data = custom_data)
Residuals:
     1        2        3        4        5
    -2     -1        1        0        2
Coefficients:
(Intercept)     -10.00    15.81    -0.632    0.55897
speed                         2.00        0.47            4.254    0.01205
R

Väljundis näeme lineaarse mudeli (custom_model), mis loodi and­me­ko­gumi jaoks ja mo­del­lee­rib kiiruse ja vahemaa vahelist seost. Saame mudeli tulemuse, seal­hul­gas koe­fit­sien­did ja sta­tis­ti­li­sed andmed.

Uute kiiruse väärtuste mää­rat­le­mine ja prog­noo­side tegemine

# Creating a data frame with new speed values
new_speed_values <- data.frame(speed = c(40, 45, 50, 55, 60))
# Predicting future distance values using the linear model
predicted_distance <- predict(custom_model, newdata = new_speed_values)
R

Nüüd oleme loonud uue and­me­ko­gumi (new_speed_values) uute kiiruse väär­tus­tega. Seejärel ka­su­ta­sime R predict(), et teha vastavate kauguste väärtuste prognoose, kasutades eespool loodud li­neaar­set mudelit.

Prog­noo­side kuvamine

# Displaying the predicted values
print("Predicted Distance Values:")
print(predicted_distance)
R

Väljund näitab kiiruse põhjal en­nus­ta­tud kauguse väärtusi:

"Predicted Distance Values:"
               1                2                  3                 4                   5
 80.0000     90.0000    100.0000  110.0000     120.0000
R
Go to Main Menu