Wat zijn gegevens?
Gegevens zijn een verzameling van een afzonderlijke kleine eenheid informatie. Het kan in verschillende vormen worden gebruikt, zoals tekst, cijfers, media, bytes, enz. Het kan worden opgeslagen in stukjes papier of in een elektronisch geheugen, enz.
Het woord 'Data' is afgeleid van het woord 'datum' dat 'enkel stukje informatie' betekent. Het is het meervoud van het woord datum.
In de computerwereld zijn gegevens informatie die kan worden vertaald in een vorm voor efficiënte verplaatsing en verwerking. Gegevens zijn uitwisselbaar.
Wat is database?
A database is een georganiseerde verzameling gegevens, zodat deze gemakkelijk toegankelijk en beheerd kan worden.
U kunt gegevens ordenen in tabellen, rijen en kolommen en deze indexeren, zodat u gemakkelijker relevante informatie kunt vinden.
Database-handlers een database op zo'n manier creëren dat slechts één set softwareprogramma's toegang tot gegevens biedt aan alle gebruikers.
De belangrijkste doel van de database is het beheren van een grote hoeveelheid informatie door gegevens op te slaan, op te halen en te beheren.
Er zijn veel dynamische websites die tegenwoordig via databases worden afgehandeld op het World Wide Web. Bijvoorbeeld een model dat de beschikbaarheid van kamers in een hotel controleert. Het is een voorbeeld van een dynamische website die gebruik maakt van een database.
Er zijn veel databanken beschikbaar zoals MySQL, Sybase, Oracle, MongoDB, Informix, PostgreSQL, SQL Server, enz.
Moderne databases worden beheerd door het databasemanagementsysteem (DBMS).
SQL of Structured Query Language wordt gebruikt om te werken met de gegevens die in een database zijn opgeslagen. SQL is afhankelijk van relationele algebra en relationele calculus.
Een cilindrische structuur wordt gebruikt om het beeld van een database weer te geven.
Evolutie van databases
De database heeft meer dan 50 jaar van zijn evolutie voltooid van flat-file-systemen naar relationele en object-relationele systemen. Het heeft verschillende generaties doorgemaakt.
De evolutie
Op bestanden gebaseerd
1968 was het jaar waarin op bestanden gebaseerde databases werden geïntroduceerd. In op bestanden gebaseerde databases werden de gegevens bijgehouden in een plat bestand. Hoewel bestanden veel voordelen hebben, zijn er ook verschillende beperkingen.
Een van de belangrijkste voordelen is dat het bestandssysteem verschillende toegangsmethoden heeft, bijvoorbeeld sequentieel, geïndexeerd en willekeurig.
Het vereist uitgebreide programmering in een taal van de derde generatie, zoals COBOL, BASIC.
Hiërarchisch gegevensmodel
1968-1980 was het tijdperk van de hiërarchische database. Een prominent hiërarchisch databasemodel was IBM's eerste DBMS. Het heette IMS (Informatie Management Systeem).
In dit model zijn bestanden op een ouder/kind-manier gerelateerd.
Het onderstaande diagram vertegenwoordigt het hiërarchische gegevensmodel. Kleine cirkel vertegenwoordigt objecten.
Net als het bestandssysteem had dit model ook enkele beperkingen, zoals een complexe implementatie, een gebrek aan structurele onafhankelijkheid, niet gemakkelijk overweg met een veel-veel-relatie, enz.
Netwerkdatamodel
Charles Bachman ontwikkelde het eerste DBMS bij Honeywell genaamd Integrated Data Store (IDS). Het werd ontwikkeld in het begin van de jaren zestig, maar werd in 1971 gestandaardiseerd door de CODASYL-groep (Conference on Data Systems Languages).
In dit model zijn bestanden gerelateerd als eigenaren en leden, net als bij het algemene netwerkmodel.
Het netwerkdatamodel identificeerde de volgende componenten:
- Netwerkschema (databaseorganisatie)
- Subschema (weergaven van database per gebruiker)
- Taal voor gegevensbeheer (procedureel)
Dit model had ook enkele beperkingen, zoals systeemcomplexiteit en moeilijk te ontwerpen en te onderhouden.
Relationele database
1970 - heden: Het is het tijdperk van relationele databases en databasebeheer. In 1970 werd het relationele model voorgesteld door E.F. Codd.
Relationeel databasemodel heeft twee hoofdterminologieën: instance en schema.
De instantie is een tabel met rijen of kolommen
Schema specificeert de structuur, zoals de naam van de relatie, het type van elke kolom en de naam.
Dit model maakt gebruik van een wiskundig concept zoals de verzamelingenleer en predikatenlogica.
De eerste internetdatabase-applicatie werd in 1995 gemaakt.
Tijdens het tijdperk van de relationele database waren er veel meer modellen geïntroduceerd, zoals objectgeoriënteerd model, objectrelationeel model, enz.
Cloud-database
Met een clouddatabase kunt u hun gestructureerde, ongestructureerde gegevens opslaan, beheren en ophalen via een cloudplatform. Deze gegevens zijn toegankelijk via internet. Clouddatabases worden ook wel een database as service (DBaaS) genoemd omdat ze als managed service worden aangeboden.
Enkele beste cloudopties zijn:
- AWS (Amazon Web Services)
- Sneeuwvlokcomputers
- Oracle Database Cloud-services
- Microsoft SQL-server
- Google cloudsleutel
Voordelen van clouddatabase
Lagere kosten
Over het algemeen hoeft de bedrijfsaanbieder niet in databases te investeren. Het kan één of meerdere datacenters onderhouden en ondersteunen.
Geautomatiseerd
Clouddatabases zijn verrijkt met een verscheidenheid aan geautomatiseerde processen, zoals herstel, failover en automatisch schalen.
Verhoogde toegankelijkheid
U heeft vanaf elke locatie en op elk moment toegang tot uw cloudgebaseerde database. Het enige wat je nodig hebt is alleen een internetverbinding.
NoSQL-database
Een NoSQL-database is een benadering om dergelijke databases te ontwerpen die geschikt zijn voor een grote verscheidenheid aan datamodellen. NoSQL staat voor 'niet alleen SQL.' Het is een alternatief voor traditionele relationele databases waarin gegevens in tabellen worden geplaatst en het gegevensschema perfect wordt ontworpen voordat de database wordt gebouwd.
NoSQL-databases zijn nuttig voor een grote set gedistribueerde gegevens.
Enkele voorbeelden van een NoSQL-databasesysteem met hun categorie zijn:
- MongoDB, CouchDB, Cloudant (Documentgebaseerd)
- Memcached, Redis, Coherentie (sleutelwaardeopslag)
- HBase, grote tafel, accumulatie (tabelvormig)
Voordeel van NoSQL
Hoge schaalbaarheid
NoSQL kan vanwege de schaalbaarheid een grote hoeveelheid gegevens verwerken. Als de gegevens groeien, schaalt de NoSQL-database deze om die gegevens op een efficiënte manier te verwerken.
Hoge beschikbaarheid
NoSQL ondersteunt automatische replicatie. Automatische replicatie zorgt voor een hoge beschikbaarheid omdat, in geval van een storing, de gegevens zichzelf repliceren naar de vorige consistente staat.
Nadeel van NoSQL
Open source
NoSQL is een open-source database, dus er bestaat nog geen betrouwbare standaard voor NoSQL.
mb versus gb
Managementuitdaging
Gegevensbeheer in NoSQL is veel ingewikkelder dan relationele databases. Het is een hele uitdaging om te installeren en zelfs nog hectischer om dagelijks te beheren.
GUI is niet beschikbaar
GUI-tools voor de NoSQL-database zijn niet gemakkelijk verkrijgbaar op de markt.
Back-up
Back-up is een groot zwak punt voor NoSQL-databases. Sommige databases, zoals MongoDB, hebben geen krachtige benaderingen voor gegevensback-up.
De objectgeoriënteerde databases
De objectgeoriënteerde databases bevatten gegevens in de vorm van objecten en klassen. Objecten zijn de entiteit in de echte wereld, en typen zijn de verzameling objecten. Een objectgeoriënteerde database is een combinatie van relationele modelkenmerken met objectgeoriënteerde principes. Het is een alternatieve implementatie voor die van het relationele model.
Objectgeoriënteerde databases bevatten de regels van objectgeoriënteerd programmeren. Een objectgeoriënteerd databasebeheersysteem is een hybride applicatie.
Het objectgeoriënteerde databasemodel bevat de volgende eigenschappen.
Objectgeoriënteerde programmeereigenschappen
- Voorwerpen
- Klassen
- Erfenis
- Polymorfisme
- Inkapseling
Relationele database-eigenschappen
- Atomiciteit
- Samenhang
- Integriteit
- Duurzaamheid
- Gelijktijdigheid
- Queryverwerking
Grafiekdatabases
Een grafiekdatabase is een NoSQL-database. Het is een grafische weergave van gegevens. Het bevat knooppunten en randen. Een knooppunt vertegenwoordigt een entiteit en elke rand vertegenwoordigt een relatie tussen twee randen. Elk knooppunt in een grafiekdatabase vertegenwoordigt een unieke identificatie.
Grafiekdatabases zijn nuttig bij het zoeken naar de relatie tussen gegevens, omdat ze de relatie tussen relevante gegevens benadrukken.
Grafiekdatabases zijn erg handig wanneer de database een complexe relatie en een dynamisch schema bevat.
Het wordt vooral gebruikt bij voorraadketenbeheer , het identificeren van de bron van IP-telefonie .
DBMS (Databasebeheersysteem)
Databasebeheersysteem is software die wordt gebruikt om de database op te slaan en op te halen. Bijvoorbeeld Oracle, MySQL, enz.; dit zijn enkele populaire DBMS-tools.
- DBMS biedt de interface voor het uitvoeren van de verschillende bewerkingen, zoals aanmaken, verwijderen, wijzigen, enz.
- Met DBMS kan de gebruiker zijn databases maken volgens zijn vereisten.
- DBMS accepteert het verzoek van de applicatie en levert specifieke gegevens via het besturingssysteem.
- DBMS bevat de groep programma's die handelt volgens de gebruikersinstructie.
- Het biedt beveiliging aan de database.
Voordeel van DBMS
Controleert redundantie
Het slaat alle gegevens op in één databasebestand, zodat gegevensredundantie kan worden gecontroleerd.
Het delen van gegevens
Een geautoriseerde gebruiker kan de gegevens delen met meerdere gebruikers.
Back-up
Het biedt een back-up- en herstelsubsysteem. Dit herstelsysteem creëert automatisch gegevens na systeemfouten en herstelt gegevens indien nodig.
Meerdere gebruikersinterfaces
Het biedt een ander type gebruikersinterfaces, zoals GUI, applicatie-interfaces.
Nadeel van DBMS
Maat
Het neemt grote schijfruimte en groot geheugen in beslag om efficiënt te kunnen werken.
Kosten
DBMS vereist een snelle dataprocessor en een groter geheugen om DBMS-software uit te voeren, dus het is kostbaar.
Complexiteit
DBMS creëert extra complexiteit en vereisten.
RDBMS (relationeel databasebeheersysteem)
Het woord RDBMS wordt 'Relationeel Database Management Systeem' genoemd. Het wordt weergegeven als een tabel die rijen en kolommen bevat.
RDBMS is gebaseerd op het relationele model; het werd geïntroduceerd door EF Codd.
Een relationele database bevat de volgende componenten:
- Tafel
- Opnemen / Tupel
- Veld-/kolomnaam/kenmerk
- Voorbeeld
- Schema
- Sleutels
Een RDBMS is een DBMS in tabelvorm dat de veiligheid, integriteit, nauwkeurigheid en consistentie van de gegevens handhaaft.