Kas ir predict() programmā R?
Izmantojot R predict() funkciju, varat veikt prognozes par jauniem, neredzētiem datiem. Šī funkcija ir svarīgs rīks mašīnmācībai.
Kādam nolūkam R izmanto predict()?
R funkcija predict() ir daudzpusīgs rīks, ko izmanto prognozēšanas modelēšanā. Tā ģenerē prognozes jauniem vai esošiem datu punktiem, pamatojoties uz iepriekš izstrādātiem statistiskiem modeļiem, piemēram, lineāro regresiju, loģisko regresiju, lēmumu kokiem un citām modelēšanas metodēm.
Kāda ir sintakse funkcijas predict() izmantošanai programmā R?
R funkcija predict() kā argumentus izmanto apmācītu modeli un datu punktus, uz kuriem jāattiecina prognoze. Jūs varat norādīt dažādas opcijas un parametrus atkarībā no izmantotā modeļa veida. Rezultāts ir prognožu vektors, kas var būt noderīgs dažādiem analītiskiem mērķiem, tostarp modeļa veiktspējas novērtēšanai, lēmumu pieņemšanai vai rezultātu datu ilustrēšanai.
predict(object, newdata, interval)Robject: Apmācītais modelis, uz kuru tiek attiecinātas prognozesnewdata: Datu punkts prognozeiinterval: Papildu arguments, lai ievadītu konfidences intervāla veidu (confidencevidējam intervālam,predictionprognozēm)
Piemērs, kā lietot predict() R valodā
Šis piemērs ilustrē, kā darbojas funkcija predict() programmā R. Mēs izmantosim lietotāja definētu datu kopu ar ātruma un attāluma vērtībām.
Datu izveide un attēlošana
# Creating a data frame with custom speed and distance values
custom_data <- data.frame(speed = c(15, 20, 25, 30, 35),
distance = c(30, 40, 50, 60, 70))
# Displaying the custom data frame
print("Custom Data Frame:")
print(custom_data)RVispirms izveidosim lietotāja definētu datu kopu, lai novērtētu ātruma un attāluma savstarpējo saistību. Izmantosim funkciju data.frame(), lai izveidotu datu rāmi, un pēc tam definēsim mainīgo speed un distance vērtības kā c(15, 20, 25, 30, 35) un c(30, 40, 50, 60, 70).
Pēc datu kopas izveidošanas mēs to parādīsim, izmantojot funkciju print(). Tādējādi mēs varam pārbaudīt jauno datu rāmja struktūru un piešķirtās vērtības.
Rezultāts:
"Custom Data Frame:"
speed distance
1 15 30
2 20 40
3 25 50
4 30 60
5 35 70RLineārā modeļa izveide
# Creating a linear model for the custom data frame
custom_model <- lm(distance ~ speed, data = custom_data)
# Printing the model results
print("Model Results:")
print(summary(custom_model))RRezultāts:
"Model Results:"
Call:
lm(formula = distance ~ speed, data = custom_data)
Residuals:
1 2 3 4 5
-2 -1 1 0 2
Coefficients:
(Intercept) -10.00 15.81 -0.632 0.55897
speed 2.00 0.47 4.254 0.01205RRezultātā redzam lineāro modeli (custom_model), kas tika izveidots datu kopai un modelē attiecības starp ātrumu un attālumu. Mēs iegūstam modeļa rezultātu, ieskaitot koeficientus un statistisko informāciju.
Jaunu ātruma vērtību definēšana un prognožu izstrāde
# Creating a data frame with new speed values
new_speed_values <- data.frame(speed = c(40, 45, 50, 55, 60))
# Predicting future distance values using the linear model
predicted_distance <- predict(custom_model, newdata = new_speed_values)RTagad esam izveidojuši vēl vienu datu kopu (new_speed_values) ar jaunām ātruma vērtībām. Tad izmantojām R predict(), lai izdarītu prognozes par atbilstošajām attāluma vērtībām, izmantojot iepriekš izveidoto lineāro modeli.
Prognožu parādīšana
# Displaying the predicted values
print("Predicted Distance Values:")
print(predicted_distance)RRezultāti parāda attāluma vērtības, kas prognozētas, pamatojoties uz ātrumu:
"Predicted Distance Values:"
1 2 3 4 5
80.0000 90.0000 100.0000 110.0000 120.0000R