Hvad er krydsvalidering i AWS?

Hvad Er Krydsvalidering I Aws



Machine Learning bruges til at anvende forskellige modeller på de givne data for at forudsige fremtiden baseret på de data, der bruges til at træne dem. Der er forskellige maskinlæringsmodeller, der indlejrer kunstig intelligens såsom logistisk regression, K-Nærmeste naboer osv. For at finde hvilken model der skal anvendes i henhold til datasættet og scenarierne kan gøres ved krydsvalidering.

Denne vejledning vil forklare krydsvalidering og dens funktion ved hjælp af AWS Service.

Hvad er krydsvalidering?

Krydsvalidering giver udviklere mulighed for at sammenligne forskellige maskinlæringsmodeller og få en fornemmelse af deres arbejde i det virkelige liv. Det hjælper brugeren med at finde ud af, hvilken Machine Learning (ML) eller Deep Learning (DL) model, der vil fungere bedre for et bestemt data eller scenarie. Der er situationer, hvor flere modeller kan bruges til ét datasæt, her bruger udviklere krydsvalidering for at få en passende model for at få optimerede resultater:









Hvordan fungerer krydsvalidering?

For at kontrollere ML-modellerne på et datasæt, skal brugeren estimere funktionerne i modellen, som kaldes træning af algoritmen. En anden ting at tjekke er evalueringen af ​​modellen for at finde ud af, hvor godt den klarede sig, og det kaldes test af modellen. Det er ikke en god idé at teste modellen på alle data, men vi bruger 75% af dataene til træning og 25% til test for at få bedre resultater. Krydsvalidering udfører test på hver 25 % af dataene for at kontrollere, hvilken blok der klarer sig bedst:







Hvad er Amazon SageMaker?

Krydsvalidering i AWS kan udføres ved hjælp af Amazon SageMaker-tjenesten, da den er designet til at bygge, træne og implementere maskinlæringsmodeller. Det hjælper datavidenskabsfolk og udviklere med at forberede data til at bygge effektive ML- eller DL-modeller ved at samle specialbyggede funktioner. Disse egenskaber er nyttige til at bygge optimerede og nøjagtige modeller, der vil have evnen til at forbedre sig over tid:



Funktioner i Amazon SageMaker

Amazon SageMaker er en administreret tjeneste, og den kræver ikke administration af ML-miljøer. Den har brug for en masse data for at træne og bygge ML-modeller, så den forbinder godt med Amazon S3- eller Amazon Redshift-tjenesterne for at indsamle data. Rådata kan være svære at få information fra, så det kræver også funktioner at bygge modeller. Brug derefter dataene til at træne modeller og udfør derefter test på dem ved at bruge hver 25 % af dataene for at få bedre resultater/forudsigelser:

Det handler om krydsvalidering i AWS.

Konklusion

Krydsvalidering er processen med at få den optimale maskinlærings- eller deep learning-model for dataene for at få bedre resultater. Den vil udføre test for hver 25 % sektion af dataene for at forstå, hvilken blok der giver det maksimale output, hvilket gør den til en passende model. AWS leverer SageMaker-tjenesten til at udføre krydsvalidering og bygge maskinlæringsmodeller i skyen. Denne vejledning har forklaret krydsvalideringsprocessen og dens funktion i AWS.