logo

Wat is roodverschuiving?

  • Redshift is een snelle en krachtige, volledig beheerde datawarehouse-service op petabyte-schaal in de cloud.
  • Klanten kunnen de Redshift gebruiken voor slechts $ 0,25 per uur, zonder verplichtingen of kosten vooraf, en kunnen opschalen naar een petabyte of meer voor $ 1.000 per terabyte per jaar.

OLAP

OLAP is een Online analyseverwerkingssysteem gebruikt door de Roodverschuiving .

OLAP-transactie Voorbeeld:

Stel dat we de nettowinst voor EMEA en Pacific voor het digitale radioproduct willen berekenen. Hiervoor moet een groot aantal records worden opgehaald. Hieronder volgen de gegevens die nodig zijn om een ​​nettowinst te berekenen:

  • Som van verkochte radio's in EMEA.
  • Som van verkochte radio's in de Stille Oceaan.
  • Eenheidskosten van radio in elke regio.
  • Verkoopprijs van elke radio
  • Verkoopprijs - eenheidskosten

De complexe query's zijn vereist om de hierboven gegeven records op te halen. Data Warehousing-databases gebruiken verschillende typen architectuur, zowel vanuit databaseperspectief als vanuit de infrastructuurlaag.

Roodverschuivingsconfiguratie

Roodverschuiving

Roodverschuiving bestaat uit twee soorten knooppunten:

    Enkel knooppunt Meerdere knooppunten

Enkel knooppunt: Eén knooppunt kan maximaal 160 GB opslaan.

Meerdere knooppunten: Multi-node is een knooppunt dat uit meer dan één knooppunt bestaat. Het bestaat uit twee soorten:

    Leider knooppunt
    Het beheert de clientverbindingen en ontvangt vragen. Een leiderknooppunt ontvangt de vragen van de clienttoepassingen, parseert de vragen en ontwikkelt de uitvoeringsplannen. Het coördineert de parallelle uitvoering van deze plannen met het rekenknooppunt en combineert de tussenresultaten van alle knooppunten, en stuurt het eindresultaat vervolgens terug naar de clienttoepassing.Rekenknooppunt
    Een rekenknooppunt voert de uitvoeringsplannen uit, waarna de tussenresultaten ter aggregatie naar het leiderknooppunt worden verzonden voordat ze worden teruggestuurd naar de clienttoepassing. Het kan maximaal 128 rekenknooppunten hebben.

Laten we het concept van leiderknooppunt en rekenknooppunten begrijpen aan de hand van een voorbeeld.

Roodverschuiving

Redshift-magazijn is een verzameling computerbronnen die bekend staan ​​als knooppunten, en deze knooppunten zijn georganiseerd in een groep die bekend staat als een cluster. Elk cluster draait in een Redshift Engine die een of meer databases bevat.

Wanneer u een Redshift-instantie start, begint deze met een enkel knooppunt met een grootte van 160 GB. Als u wilt groeien, kunt u extra knooppunten toevoegen om te profiteren van parallelle verwerking. U hebt een leiderknooppunt dat de meerdere knooppunten beheert. Het Leader-knooppunt verzorgt zowel de clientverbinding als de rekenknooppunten. Het slaat de gegevens op in rekenknooppunten en voert de query uit.

Waarom Roodverschuiving 10 keer sneller is

Roodverschuiving is 10 keer sneller vanwege de volgende redenen:

    Zuilvormige gegevensopslag
    In plaats van gegevens op te slaan als een reeks rijen, organiseert Amazon Redshift de gegevens per kolom. Op rijen gebaseerde systemen zijn ideaal voor transactieverwerking, terwijl op kolommen gebaseerde systemen ideaal zijn voor datawarehousing en -analyse, waarbij zoekopdrachten vaak aggregaten betreffen die worden uitgevoerd over grote datasets. Omdat alleen de kolommen die bij de zoekopdrachten betrokken zijn, worden verwerkt en kolomgegevens sequentieel in een opslagmedium worden opgeslagen, hebben kolomgebaseerde systemen minder I/O's nodig, waardoor de prestaties van de zoekopdrachten worden verbeterd.Geavanceerde compressie
    Gegevensopslag in kolommen kan veel meer worden gecomprimeerd dan op rijen gebaseerde gegevensopslag, omdat vergelijkbare gegevens sequentieel op schijf worden opgeslagen. Amazon Redshift maakt gebruik van meerdere compressietechnieken en kan vaak aanzienlijke compressie bereiken in vergelijking met traditionele relatiegegevensopslag.
    Amazon Redshift vereist geen indexen of gematerialiseerde weergaven en vereist dus minder ruimte dan traditionele relationele databasesystemen. Wanneer gegevens in een lege tabel worden geladen, bemonstert Amazon Redshift uw gegevens automatisch en selecteert de meest geschikte compressietechniek.Massaal parallelle verwerking
    Amazon Redshift verdeelt de gegevens automatisch en laadt de query over verschillende knooppunten. Een Amazon Redshift maakt het eenvoudig om nieuwe knooppunten aan uw datawarehouse toe te voegen, en hierdoor kunnen we snellere queryprestaties realiseren naarmate uw datawarehouse groeit.

Roodverschuivingsfuncties

Kenmerken van Redshift worden hieronder gegeven:

Linux-opdracht voor zip
Roodverschuiving
    Eenvoudig in te stellen, te implementeren en te beheren
      Geautomatiseerde inrichting
      Redshift is eenvoudig in te stellen en te bedienen. U kunt met slechts een paar klikken in de AWS Console een nieuw datawarehouse implementeren, en Redshift richt de infrastructuur automatisch voor u in. In AWS zijn alle administratieve taken geautomatiseerd, zoals back-ups en replicatie, u moet zich concentreren op uw gegevens, niet op het beheer.Geautomatiseerde back-ups
      Redshift maakt automatisch een back-up van uw gegevens naar S3. U kunt de momentopnamen in S3 ook in een andere regio repliceren voor noodherstel.
    Kostenefficiënt
      Geen kosten vooraf, betaal naar gebruik
      Amazon Redshift is de meest kosteneffectieve datawarehouse-service, omdat u alleen hoeft te betalen voor wat u gebruikt.
      De kosten beginnen bij
      • Redshift is een snelle en krachtige, volledig beheerde datawarehouse-service op petabyte-schaal in de cloud.
      • Klanten kunnen de Redshift gebruiken voor slechts $ 0,25 per uur, zonder verplichtingen of kosten vooraf, en kunnen opschalen naar een petabyte of meer voor $ 1.000 per terabyte per jaar.

      OLAP

      OLAP is een Online analyseverwerkingssysteem gebruikt door de Roodverschuiving .

      OLAP-transactie Voorbeeld:

      Stel dat we de nettowinst voor EMEA en Pacific voor het digitale radioproduct willen berekenen. Hiervoor moet een groot aantal records worden opgehaald. Hieronder volgen de gegevens die nodig zijn om een ​​nettowinst te berekenen:

      • Som van verkochte radio's in EMEA.
      • Som van verkochte radio's in de Stille Oceaan.
      • Eenheidskosten van radio in elke regio.
      • Verkoopprijs van elke radio
      • Verkoopprijs - eenheidskosten

      De complexe query's zijn vereist om de hierboven gegeven records op te halen. Data Warehousing-databases gebruiken verschillende typen architectuur, zowel vanuit databaseperspectief als vanuit de infrastructuurlaag.

      Roodverschuivingsconfiguratie

      Roodverschuiving

      Roodverschuiving bestaat uit twee soorten knooppunten:

        Enkel knooppunt Meerdere knooppunten

      Enkel knooppunt: Eén knooppunt kan maximaal 160 GB opslaan.

      Meerdere knooppunten: Multi-node is een knooppunt dat uit meer dan één knooppunt bestaat. Het bestaat uit twee soorten:

        Leider knooppunt
        Het beheert de clientverbindingen en ontvangt vragen. Een leiderknooppunt ontvangt de vragen van de clienttoepassingen, parseert de vragen en ontwikkelt de uitvoeringsplannen. Het coördineert de parallelle uitvoering van deze plannen met het rekenknooppunt en combineert de tussenresultaten van alle knooppunten, en stuurt het eindresultaat vervolgens terug naar de clienttoepassing.Rekenknooppunt
        Een rekenknooppunt voert de uitvoeringsplannen uit, waarna de tussenresultaten ter aggregatie naar het leiderknooppunt worden verzonden voordat ze worden teruggestuurd naar de clienttoepassing. Het kan maximaal 128 rekenknooppunten hebben.

      Laten we het concept van leiderknooppunt en rekenknooppunten begrijpen aan de hand van een voorbeeld.

      Roodverschuiving

      Redshift-magazijn is een verzameling computerbronnen die bekend staan ​​als knooppunten, en deze knooppunten zijn georganiseerd in een groep die bekend staat als een cluster. Elk cluster draait in een Redshift Engine die een of meer databases bevat.

      Wanneer u een Redshift-instantie start, begint deze met een enkel knooppunt met een grootte van 160 GB. Als u wilt groeien, kunt u extra knooppunten toevoegen om te profiteren van parallelle verwerking. U hebt een leiderknooppunt dat de meerdere knooppunten beheert. Het Leader-knooppunt verzorgt zowel de clientverbinding als de rekenknooppunten. Het slaat de gegevens op in rekenknooppunten en voert de query uit.

      Waarom Roodverschuiving 10 keer sneller is

      Roodverschuiving is 10 keer sneller vanwege de volgende redenen:

        Zuilvormige gegevensopslag
        In plaats van gegevens op te slaan als een reeks rijen, organiseert Amazon Redshift de gegevens per kolom. Op rijen gebaseerde systemen zijn ideaal voor transactieverwerking, terwijl op kolommen gebaseerde systemen ideaal zijn voor datawarehousing en -analyse, waarbij zoekopdrachten vaak aggregaten betreffen die worden uitgevoerd over grote datasets. Omdat alleen de kolommen die bij de zoekopdrachten betrokken zijn, worden verwerkt en kolomgegevens sequentieel in een opslagmedium worden opgeslagen, hebben kolomgebaseerde systemen minder I/O's nodig, waardoor de prestaties van de zoekopdrachten worden verbeterd.Geavanceerde compressie
        Gegevensopslag in kolommen kan veel meer worden gecomprimeerd dan op rijen gebaseerde gegevensopslag, omdat vergelijkbare gegevens sequentieel op schijf worden opgeslagen. Amazon Redshift maakt gebruik van meerdere compressietechnieken en kan vaak aanzienlijke compressie bereiken in vergelijking met traditionele relatiegegevensopslag.
        Amazon Redshift vereist geen indexen of gematerialiseerde weergaven en vereist dus minder ruimte dan traditionele relationele databasesystemen. Wanneer gegevens in een lege tabel worden geladen, bemonstert Amazon Redshift uw gegevens automatisch en selecteert de meest geschikte compressietechniek.Massaal parallelle verwerking
        Amazon Redshift verdeelt de gegevens automatisch en laadt de query over verschillende knooppunten. Een Amazon Redshift maakt het eenvoudig om nieuwe knooppunten aan uw datawarehouse toe te voegen, en hierdoor kunnen we snellere queryprestaties realiseren naarmate uw datawarehouse groeit.

      Roodverschuivingsfuncties

      Kenmerken van Redshift worden hieronder gegeven:

      Roodverschuiving
        Eenvoudig in te stellen, te implementeren en te beheren
          Geautomatiseerde inrichting
          Redshift is eenvoudig in te stellen en te bedienen. U kunt met slechts een paar klikken in de AWS Console een nieuw datawarehouse implementeren, en Redshift richt de infrastructuur automatisch voor u in. In AWS zijn alle administratieve taken geautomatiseerd, zoals back-ups en replicatie, u moet zich concentreren op uw gegevens, niet op het beheer.Geautomatiseerde back-ups
          Redshift maakt automatisch een back-up van uw gegevens naar S3. U kunt de momentopnamen in S3 ook in een andere regio repliceren voor noodherstel.
        Kostenefficiënt
          Geen kosten vooraf, betaal naar gebruik
          Amazon Redshift is de meest kosteneffectieve datawarehouse-service, omdat u alleen hoeft te betalen voor wat u gebruikt.
          De kosten beginnen bij $0,25 per uur, zonder verplichtingen en zonder kosten vooraf, en kunnen oplopen tot $250 per terabyte per jaar.
          Amazon Redshift is de enige datawarehouse-service die on-demand-prijzen biedt zonder kosten vooraf, en ook gereserveerde instance-prijzen die tot 75% besparen door een looptijd van 1-3 jaar te bieden.Kies uw knooppunttype.
          U kunt een van de twee knooppunten kiezen om de roodverschuiving te optimaliseren.
            Dichte rekenknooppunt
            Een Dense Compute Node kan krachtige datawarehouses creëren door gebruik te maken van snelle CPU's, een grote hoeveelheid RAM en solid-state schijven.Dicht opslagknooppunt
            Als u de kosten wilt verlagen, kunt u het Dense Storage-knooppunt gebruiken. Het creëert een kosteneffectief datawarehouse door een grotere harde schijf te gebruiken.
        Schaal snel om aan uw behoeften te voldoen.
          Datawarehousing op petabyteschaal
          Amazon Redshift schaalt de knooppunten automatisch omhoog of omlaag, afhankelijk van de behoefteveranderingen. Met slechts een paar klikken in de AWS Console of een enkele API-aanroep kunt u eenvoudig het aantal knooppunten in een datawarehouse wijzigen.Data Lake-analyses op exabyteschaal
          Het is een functie van Redshift waarmee u de zoekopdrachten kunt uitvoeren op exabytes aan gegevens in Amazon S3. Amazon S3 is een veilige en kosteneffectieve gegevensopslag voor het opslaan van onbeperkte gegevens in een open formaat.Grenzeloze gelijktijdigheid
          Het is een functie van Redshift, wat betekent dat meerdere zoekopdrachten toegang hebben tot dezelfde gegevens in Amazon S3. Hiermee kunt u de query's op meerdere knooppunten uitvoeren, ongeacht de complexiteit van een query of de hoeveelheid gegevens.
        Voer een query uit op uw data lake
        Amazon Redshift is het enige datawarehouse dat wordt gebruikt om het Amazon S3-datameer te bevragen zonder gegevens te laden. Dit biedt flexibiliteit door de vaak gebruikte gegevens op te slaan in Redshift en ongestructureerde of weinig gebruikte gegevens in Amazon S3.Zeker
        Met een paar parameterinstellingen kunt u de Redshift instellen om SSL te gebruiken om uw gegevens te beveiligen. U kunt ook codering inschakelen; alle gegevens die naar de schijf worden geschreven, worden gecodeerd.Snellere prestaties
        Amazon Redshift biedt kolomvormige gegevensopslag, compressie en parallelle verwerking om de hoeveelheid I/O die nodig is om zoekopdrachten uit te voeren te verminderen. Dit verbetert de queryprestaties.

      ,25 per uur, zonder verplichtingen en zonder kosten vooraf, en kunnen oplopen tot 0 per terabyte per jaar.
      Amazon Redshift is de enige datawarehouse-service die on-demand-prijzen biedt zonder kosten vooraf, en ook gereserveerde instance-prijzen die tot 75% besparen door een looptijd van 1-3 jaar te bieden.Kies uw knooppunttype.
      U kunt een van de twee knooppunten kiezen om de roodverschuiving te optimaliseren.
        Dichte rekenknooppunt
        Een Dense Compute Node kan krachtige datawarehouses creëren door gebruik te maken van snelle CPU's, een grote hoeveelheid RAM en solid-state schijven.Dicht opslagknooppunt
        Als u de kosten wilt verlagen, kunt u het Dense Storage-knooppunt gebruiken. Het creëert een kosteneffectief datawarehouse door een grotere harde schijf te gebruiken.
    Schaal snel om aan uw behoeften te voldoen.
      Datawarehousing op petabyteschaal
      Amazon Redshift schaalt de knooppunten automatisch omhoog of omlaag, afhankelijk van de behoefteveranderingen. Met slechts een paar klikken in de AWS Console of een enkele API-aanroep kunt u eenvoudig het aantal knooppunten in een datawarehouse wijzigen.Data Lake-analyses op exabyteschaal
      Het is een functie van Redshift waarmee u de zoekopdrachten kunt uitvoeren op exabytes aan gegevens in Amazon S3. Amazon S3 is een veilige en kosteneffectieve gegevensopslag voor het opslaan van onbeperkte gegevens in een open formaat.Grenzeloze gelijktijdigheid
      Het is een functie van Redshift, wat betekent dat meerdere zoekopdrachten toegang hebben tot dezelfde gegevens in Amazon S3. Hiermee kunt u de query's op meerdere knooppunten uitvoeren, ongeacht de complexiteit van een query of de hoeveelheid gegevens.
    Voer een query uit op uw data lake
    Amazon Redshift is het enige datawarehouse dat wordt gebruikt om het Amazon S3-datameer te bevragen zonder gegevens te laden. Dit biedt flexibiliteit door de vaak gebruikte gegevens op te slaan in Redshift en ongestructureerde of weinig gebruikte gegevens in Amazon S3.Zeker
    Met een paar parameterinstellingen kunt u de Redshift instellen om SSL te gebruiken om uw gegevens te beveiligen. U kunt ook codering inschakelen; alle gegevens die naar de schijf worden geschreven, worden gecodeerd.Snellere prestaties
    Amazon Redshift biedt kolomvormige gegevensopslag, compressie en parallelle verwerking om de hoeveelheid I/O die nodig is om zoekopdrachten uit te voeren te verminderen. Dit verbetert de queryprestaties.