Hvad er Amazon Redshift Data Warehouse System Architecture?

Hvad Er Amazon Redshift Data Warehouse System Architecture



Hosting og håndtering af data i databaser og datavarehuse har altid været en hektisk og besværlig opgave. Det kræver mange ressourcer og regnekraft at give mening med dataene. Amazon Web Services har en one-stop-løsning til dette formål. Det har en tjeneste kaldet Amazon Redshift, der fuldt ud administrerer brugernes datavarehuse.

Denne artikel vil i detaljer forklare Amazon Redshift sammen med dets datavarehusarkitektur. Alle komponenterne i Redshifts datavarehussystemarkitektur vil blive forklaret i detaljer.







Hvad er Amazon Redshift?

IT er en data warehousing-tjeneste leveret af Amazon. Det administrerer og analyserer effektivt store datasæt til analyser og rapportering. Den er bygget på en søjleformet opbevaringsmodel. Den bruger klynger af computerknudepunkter styret af en lederknude til at levere højtydende databehandling.



Det tager data fra forskellige kilder og samler dem for at lave et datavarehus. Det tilbyder forskellige funktioner, såsom datadeling og realtidsanalyse. Se billedet nedenfor for at forstå funktionerne og mulighederne i Amazon Redshift:







Lad os gå til dets datavarehussystemarkitektur nu.

Hvad er Amazon Redshift Data Warehouse System Architecture?

Denne systemarkitektur har tre kernedele. Disse dele er:



  • Opbevaring
  • Acceleration
  • Beregning

Lad os forstå deres formål:

Opbevaring
Lagerdelen omhandler lagertjenester, som Redshift har. Den har sin egen mulighed for administreret lagerservice samt en S3-bøttemulighed.

Acceleration
Accelerationsdelen er afhængig af den anvendte lagertjeneste og den anvendte regnekraft. Redshift-administreret lagring er hurtigere sammenlignet med andre lagringsmuligheder

Beregning
Beregningsdelen beskæftiger sig udelukkende med computerkraft i brug. Beregning udføres med klynger, og klynger har noder. Noder har til gengæld skiver.

For bedre at forstå alle elementer og komponenter i denne arkitektur, se billedet nedenfor:

Lad os forstå dets komponenter én efter én.

Hvad er de arkitektoniske komponenter i Amazon Redshift?

Følgende er de arkitektoniske komponenter i Amazon Redshift:

  • Klynger
  • Noder
  • Nodeskiver
  • Opbevaring
  • Internt netværk
  • Databaser

Lad os diskutere disse en efter en:

Klynger
En klynge er den grundlæggende og kerneenhed. Den omfatter en række knudepunkter. Hvis en klynge består af flere beregningsknuder, træder en yderligere lederknude ind for at koordinere aktiviteterne for disse beregningsknuder og administrere ekstern kommunikation.

Noder

Noder i klynger er af to typer. Disse er:

  • Leder Node
  • Beregn node

Lad os forstå disse efter én:

Leder Node
Det styrer kommunikation med klientprogrammer og koordinerer interaktioner med computerknudepunkter. Lederknudepunktet spiller en afgørende rolle i udførelse af komplekse forespørgsler. Den kompilerer kode baseret på udførelsesplanen, som er distribueret til beregningsknudepunkter og tildeler datadele til hver enkelt beregningsknude.

Beregn node
Compute noder er rygraden i Amazon Redshifts arkitektur. De udfører både lagring og behandling af data. Disse har dedikerede ressourcer, såsom hukommelse og CPU.

Nodeskiver
Beregningsknuder er yderligere opdelt i skiver. Disse udsnit arbejder sammen om at behandle tildelte arbejdsbelastninger og opnå parallelitet for at forbedre forespørgselsbehandlingen.

Opbevaring
Datalagring i Amazon Redshift administreres af 'Redshift Managed Storage (RMS)'. Den har evnen til at skalere lagring uafhængigt ved hjælp af 'Amazon S3' lagring. RMS bruger højtydende SSD-baseret lokal lagring som tier-1 cache, som optimerer ydeevnen.

Internt netværk
Dette interne netværk i Amazon Redshift hjælper med hurtig og sikker kommunikation mellem ledernoder og computerknudepunkter. Dette netværk er ikke direkte tilgængeligt for klientapplikationer.

Databaser
Klynger har en eller flere databaser. Data fra disse databaser er på compute noder. Klientapplikationer kommunikerer med lederknudepunktet. Beregningsknuden styrer udførelse af forespørgsler på tværs af beregningsnoder.

Dette handler om Amazon Redshift og dets arkitektoniske elementer. Denne artikel har udførligt forklaret de fungerende komponenter i Amazon Redshift

Konklusion

Arkitekturen i Amazon Redshift er grunden til, at dens muligheder står. Ledernoden styrer og administrerer beregningsknuderne og knudepunkterne hjælper med parallel behandling. Redshift Managed Storage bruger SSD-baseret lagring til at forbedre ydeevnen. Denne artikel har forklaret Amazon Redshift Data Warehouse System Architecture.