Het proces van het converteren van gegevens van de ene vorm naar de andere vorm staat bekend als codering. Het wordt gebruikt om de gegevens te transformeren, zodat gegevens door verschillende systemen kunnen worden ondersteund en gebruikt. Coderen werkt op dezelfde manier als het omzetten van de temperatuur van Celsius naar Fahrenheit, omdat het gewoon in een andere vorm wordt omgezet, maar de oorspronkelijke waarde blijft altijd hetzelfde. Codering wordt hoofdzakelijk op twee gebieden gebruikt:
Opmerking: Coderen verschilt van encryptie omdat het hoofddoel ervan niet is om de gegevens te verbergen, maar om ze om te zetten in een formaat zodat ze op de juiste manier kunnen worden geconsumeerd.
In dit onderwerp gaan we de verschillende soorten coderingstechnieken bespreken die bij computers worden gebruikt.
Type coderingstechniek
Tekencodering
Tekencodering codeert tekens in bytes . Het informeert de computers hoe ze de nul en de enen moeten interpreteren in echte tekens, cijfers en symbolen. De computer begrijpt alleen binaire gegevens; daarom is het nodig om deze karakters om te zetten in numerieke codes. Om dit te bereiken wordt elk teken omgezet in binaire code en hiervoor worden tekstdocumenten opgeslagen met coderingstypen. Dit kan worden gedaan door cijfers aan tekens te koppelen. Als we geen tekencodering toepassen, zal onze website de tekens en tekst niet in het juiste formaat weergeven. Hierdoor wordt de leesbaarheid verminderd en kan de machine de gegevens niet correct verwerken. Verder zorgt tekencodering ervoor dat elk teken een juiste weergave heeft in computer- of binair formaat.
Er zijn verschillende soorten tekencoderingstechnieken, die hieronder worden gegeven:
HTML-codering
HTML-codering wordt gebruikt om een HTML-pagina in het juiste formaat weer te geven. Met codering weet een webbrowser welke tekenset moet worden gebruikt.
In HTML worden verschillende tekens gebruikt in HTML Markup, zoals . Om deze tekens als inhoud te coderen, moeten we een codering gebruiken.
URL-codering
URL (Uniform resource locator) Er wordt gebruik gemaakt van codering tekens omzetten in een zodanig formaat dat ze via internet kunnen worden verzonden . Het wordt ook wel procentcodering genoemd. De URL-codering wordt uitgevoerd om de URL naar internet te verzenden met behulp van de ASCII-tekenset. Niet-ASCII-tekens worden vervangen door een %, gevolgd door de hexadecimale cijfers.
UNICODE-codering
Unicode is een coderingsstandaard voor een universele tekenset. Het maakt het coderen, weergeven en verwerken van de tekst mogelijk die wordt weergegeven in de meeste talen of schrijfsystemen die wereldwijd beschikbaar zijn. Het biedt een codepunt of nummer voor elk teken in elke ondersteunde taal. Het kan ongeveer alle mogelijke tekens in alle talen vertegenwoordigen. Een bepaalde reeks bits staat bekend als een codeereenheid.
Een UNICODE-standaard kan 8, 16 of 32 bits gebruiken om de tekens weer te geven.
De Unicode-standaard definieert Unicode Transformation Format (UTF) om de codepunten te coderen.
UNICODE-coderingsstandaard heeft de volgende UTF-schema's:
De UTF8 wordt gedefinieerd door de UNICODE-standaard, een tekencodering met variabele breedte die wordt gebruikt in elektronische communicatie. UTF-8 kan alle 1.112.064 geldige tekencodepunten in Unicode coderen met behulp van één tot vier één-byte (8-bit) code-eenheden.
UTF16-codering vertegenwoordigt de codepunten van een teken met behulp van een van de twee gehele getallen van 16 bits.
UTF32-codering vertegenwoordigt elk codepunt als gehele getallen van 32 bits.
Base64-codering
Base64-codering wordt gebruikt om binaire gegevens te coderen in gelijkwaardige ASCII-tekens. De Base64-codering wordt gebruikt in het mailsysteem, omdat mailsystemen zoals SMTP niet met binaire gegevens kunnen werken omdat ze alleen ASCII-tekstuele gegevens accepteren. Het wordt ook gebruikt bij eenvoudige HTTP-authenticatie om de inloggegevens te coderen. Bovendien wordt het ook gebruikt om de binaire gegevens over te zetten naar cookies en andere parameters om gegevens onleesbaar te maken en manipulatie te voorkomen. Als een afbeelding of een ander bestand wordt overgedragen zonder Base64-codering, raakt het beschadigd omdat het mailsysteem niet in staat is om met binaire gegevens om te gaan.
Base64 vertegenwoordigt de gegevens in blokken van 3 bytes, waarbij elke byte 8 bits bevat; daarom vertegenwoordigt het 24 bits. Deze 24 bits zijn verdeeld in vier groepen van 6 bits. Elk van deze groepen of chunks wordt omgezet in een gelijkwaardige Base64-waarde.
ASCII-codering
Amerikaanse standaardcode voor informatie-uitwisseling (ASCII) is een type tekencodering. Het was de eerste tekencoderingsstandaard die in 1963 werd uitgebracht.
De ASCII-code wordt gebruikt om Engelse karakters als cijfers weer te geven, waarbij aan elke letter een nummer wordt toegewezen 0 tot 127. De meeste moderne tekencoderingsschema's zijn gebaseerd op ASCII, hoewel ze veel extra tekens ondersteunen. Het is een single-byte-codering die alleen de onderste 7 bits gebruikt. In een ASCII-bestand wordt elk alfabetisch, numeriek of speciaal teken weergegeven met een 7-bits binair getal. Elk teken van het toetsenbord heeft een equivalente ASCII-waarde.
Beeld- en audio- en videocodering
Beeld-, audio- en videocodering worden uitgevoerd om opslagruimte te besparen. Een mediabestand zoals afbeelding, audio en video wordt gecodeerd om ze in een efficiënter en gecomprimeerd formaat op te slaan.
Deze gecodeerde bestanden bevatten dezelfde inhoud met doorgaans dezelfde kwaliteit, maar in gecomprimeerde grootte, zodat ze in minder ruimte kunnen worden opgeslagen, gemakkelijk via e-mail kunnen worden overgedragen of op het systeem kunnen worden gedownload.
We kunnen het begrijpen als een . WAV-audiobestand wordt geconverteerd naar .MP3-bestand om de grootte met 1/10 te verkleinenenaar zijn oorspronkelijke grootte.