Kas yra predict() R kalboje?
Naudodami R programos funkciją predict(), galite prognozuoti naujus, nematytus duomenis. Ši funkcija yra svarbus mašininio mokymosi įrankis.
Kam naudojama funkcija predict() programoje R?
R funkcija predict() yra universalus įrankis, naudojamas prognozavimo modeliavimui. Ji generuoja prognozes naujiems ar esamiems duomenų taškams, remdamasi anksčiau sukurtais statistiniais modeliais, tokiais kaip linijinė regresija, loginė regresija, sprendimų medžiai ir kitos modeliavimo technikos.
Kokia yra predict() sintaksė R kalboje?
R funkcija predict() kaip argumentus naudoja apmokytą modelį ir duomenų taškus, kuriems turėtų būti taikomas prognozavimas. Galite nurodyti įvairias parinktis ir parametrus, atsižvelgdami į naudojamo modelio tipą. Rezultatas yra prognozių vektorius, kuris gali būti naudingas įvairiems analitiniams tikslams, įskaitant modelio veikimo vertinimą, sprendimų priėmimą ar gautų duomenų iliustravimą.
predict(object, newdata, interval)Robject: apmokytas modelis, kuriam taikomi prognozavimainewdata: Duomenų taškas prognozeiinterval: Pasirinktinis argumentas, skirtas įvesti pasikliautumo intervalo tipą (confidencevidutiniam intervalui,predictionprognozėms)
Pavyzdys, kaip naudoti predict() R kalboje
Šis pavyzdys iliustruoja, kaip veikia funkcija predict() programoje R. Naudosime vartotojo apibrėžtą duomenų rinkinį su greičio ir atstumo reikšmėmis.
Duomenų kūrimas ir rodymas
# Creating a data frame with custom speed and distance values
custom_data <- data.frame(speed = c(15, 20, 25, 30, 35),
distance = c(30, 40, 50, 60, 70))
# Displaying the custom data frame
print("Custom Data Frame:")
print(custom_data)RPirmiausia sukursime vartotojo apibrėžtą duomenų rinkinį, skirtą greičio ir atstumo santykiui įvertinti. Naudosime funkciją data.frame(), kad sukurtume duomenų rėmelį, tada apibrėšime kintamųjų speed ir distance vertes atitinkamai kaip c(15, 20, 25, 30, 35) ir c(30, 40, 50, 60, 70).
Sukūrę duomenų rinkinį, jį parodysime naudodami funkciją print(). Taip galėsime patikrinti naujojo duomenų rėmo struktūrą ir priskirtas reikšmes.
Išvestis:
"Custom Data Frame:"
speed distance
1 15 30
2 20 40
3 25 50
4 30 60
5 35 70RLinijinio modelio kūrimas
# Creating a linear model for the custom data frame
custom_model <- lm(distance ~ speed, data = custom_data)
# Printing the model results
print("Model Results:")
print(summary(custom_model))RIšvestis:
"Model Results:"
Call:
lm(formula = distance ~ speed, data = custom_data)
Residuals:
1 2 3 4 5
-2 -1 1 0 2
Coefficients:
(Intercept) -10.00 15.81 -0.632 0.55897
speed 2.00 0.47 4.254 0.01205RRezultatuose matome linijinį modelį (custom_model), kuris buvo sukurtas duomenų rinkiniui ir modeliuoja greičio ir atstumo santykį. Gauname modelio rezultatą, įskaitant koeficientus ir statistinę informaciją.
Naujų greičio verčių nustatymas ir prognozės
# Creating a data frame with new speed values
new_speed_values <- data.frame(speed = c(40, 45, 50, 55, 60))
# Predicting future distance values using the linear model
predicted_distance <- predict(custom_model, newdata = new_speed_values)RDabar sukūrėme kitą duomenų rinkinį (new_speed_values) su naujomis greičio reikšmėmis. Tada naudojome R predict(), kad pagal aukščiau sukurtą linijinį modelį prognozuotume atitinkamas atstumo reikšmes.
Prognozių rodymas
# Displaying the predicted values
print("Predicted Distance Values:")
print(predicted_distance)RRezultatuose rodomos atstumo vertės, apskaičiuotos pagal greitį:
"Predicted Distance Values:"
1 2 3 4 5
80.0000 90.0000 100.0000 110.0000 120.0000R