Samenvatting: databank. Database-concept

Een database is een gestructureerde set gegevens die kan worden bewerkt en geopend, bijgewerkt of verwijderd. Afhankelijk van hun organisatorische benadering, inhoudstype en volume, kunnen databases worden onderverdeeld in verschillende typen.

Als u van plan bent om als databasebeheerder te werken, moet u bekend zijn met een aantal tools zoals Oracle, SQL Server en Sybase, aangezien de relationele database de meest voorkomende van alle databases is.

Gegevens zijn elk stukje informatie, terwijl een database wordt gedefinieerd als een geïntegreerde set logisch gerelateerde gegevens die worden opgeslagen in elektronische bestanden (records) voor gemakkelijke toegang. Door gegevens op te slaan in een database heeft de gebruiker toegang tot informatie voor verschillende doeleinden.

Databases zijn elektronische archiveringssystemen die gegevens opslaan in de vorm van velden, records, enz. Sommige databases kunnen toegangsrechten verlenen waarmee de gebruiker verschillende bewerkingen kan uitvoeren, zoals bewerken, bijwerken, verwijderen, enz.

Hieronder vindt u de classificatie van databases, afhankelijk van het doel van opslag en mogelijkheden.

Analytische databases zijn alleen-lezen. Ze worden voornamelijk gebruikt op internet waar je de verzameling van de aanwezige items kunt zien, maar je kunt ze niet wijzigen. U kunt deze zien als voorraaddirectory's. Het beste voorbeeld van het gebruik van analytische databases is elke online winkel die een catalogus met producten en gegevens over hen heeft. De informatie die is opgeslagen in analytische databases wordt voornamelijk opgehaald uit de exploitatie van interne of externe databases. Ze selecteren en bewerken vooral data die veel gebruikt worden bij het besturen van een organisatie. Het wordt uitgedrukt in de vorm van een samenvatting van de organisatie of de activiteiten van de medewerker, of verkoop, marketingrapporten, enz. Het belangrijkste doel van de analytische database is om de gebruiker data-analyse te bieden, afhankelijk van het managementbeleid.

Het is een digitale database die gegevens in een tabel opslaat als rijen en kolommen. Elke rij heeft een unieke sleutel. Het helpt bij het koppelen van de ene tabel aan de andere (dit wordt een externe sleutel genoemd). Over het algemeen heeft elk object een tabel ― rijen, een instantie ervan, en kolommen hebben waarden die aan een instantie zijn toegewezen. In dit type database worden alle gegevens opgeslagen en opgehaald met behulp van "relaties", die niet alleen verzamelingen tabellen zijn; vandaar de naam "relationele databases".

Operationele databases slaan informatie op die nodig is voor de activiteiten van de organisatie. Dit is eigenlijk alle informatie over een bepaalde persoon of medewerker, afdeling of onderwerp. Daarom worden ze ook wel het databasedomein genoemd. Deze databases zijn dus gebaseerd op de functionele lijn van de organisatie.

Deze databases slaan alle informatie op één plek op - gecentraliseerde rekenkracht. Via een computernetwerk kunnen gebruikers op verschillende locaties toegang krijgen tot deze gegevens. Voorbeelden hiervan zijn een computer, een server, een processor, enz. De voordelen van dit type database zijn de zuinigheid en het bewaren van alle gegevens op één plek, waardoor de integriteit van de gegevens toeneemt. De bewerkingen zijn echter afhankelijk van de netwerkverbinding.

Gedistribueerde databases zijn databases van een organisatie die op verschillende geografische locaties zijn verspreid. Databases kunnen gemeenschappelijk zijn voor alle sites, of alleen specifiek voor een lokale site. Gedistribueerde databases worden verwijderd uit de relevante autoriteit van de lokale site. De reden waarom dit type database is ontwikkeld, is de parallelle uitvoering van werk, de verdeling van taken, waardoor de totale tijd wordt verkort.

Eindgebruikersdatabases

Eindgebruikersdatabases zijn databases waarvan de resultaten zijn samengesteld uit verschillende bewerkingen die een gebruiker op verschillende databases uitvoert. Ze bevatten informatie over de eindgebruikers van de organisatie. Dergelijke databases worden gebruikt om een ​​overzicht van alle transacties in een organisatie weer te geven. Dit is sneller dan het gebruik van online databases, hoewel deze laatste hetzelfde doel kunnen dienen. Dit zijn bijvoorbeeld spreadsheets, Word-documenten of gedownloade bestanden.

Externe databases

Externe databases verwijzen naar online toegang tot externe, privégegevens. Deze toegang is meestal gratis en beschikbaar via commerciële onlinediensten. Daarom worden ze ook wel "commerciële databases" genoemd. Deze databases zijn meestal voor externe gebruikers die het zich niet kunnen veroorloven om een ​​enorme database te onderhouden. Voorbeelden hiervan zijn toegang tot informatie met betrekking tot een specifieke persoon of hun adres / telefoonnummer via online-gidsen.

Hypermedia-databases

Wanneer u op internet surft, ziet u webpagina's die afbeeldingen, videoclips, koppelingen, afbeeldingen, multimediabestanden en meer bevatten. Deze informatie wordt opgehaald uit hypermediadatabases. Ze omvatten een verzameling onderling verbonden multimedia-webpagina's waar informatie online wordt opgeslagen en de gegevens toegankelijk zijn voor meerdere gebruikers tegelijk.

Datawarehouses

Zoals de naam al doet vermoeden, is een datawarehouse een grote verzameling gegevens die uit verschillende andere databases wordt gehaald. Deze gegevens kunnen door elk van het managementpersoneel worden gebruikt voor de eindgebruiker. Gegevens worden voornamelijk uitgedrukt als bewerkbare en gescreende informatie.

Afhankelijk van de hoeveelheid gegevens kunnen databases worden ingedeeld in drie hoofdtypen.

Gedeelde databases

Algemene databases zijn databases die informatie bieden over niet-numerieke onderwerpen. Het doel van dergelijke databases is om de gebruiker alle nodige informatie te verstrekken over elk onderwerp dat hij zoekt. Ze worden voornamelijk gebruikt voor onderzoekswerk.

Disciplinaire specifieke databases

Disciplinaire specifieke databases zijn vergelijkbaar met algemene databases, maar de informatie die ze bevatten is meer gestructureerd. Dit type database is handig voor specialisten op een bepaald gebied.

Onderwerpspecifieke databases

Onderwerpspecifieke databases zijn alleen gewijd aan een specifiek onderwerp. Ze worden voornamelijk gebruikt voor academische doeleinden. Informatie, meestal in de vorm van wetenschappelijke artikelen uit tijdschriften, etc.

Er zijn veel programmeertalen beschikbaar om u te helpen toegang te krijgen tot verschillende soorten databases. Met deze talen kunnen talloze bewerkingen op gegevens worden uitgevoerd. Met databases kunt u dus op elk gewenst moment gegevens opslaan, bekijken, openen en bijwerken.

F sectie gaat over databases en informatiesystemen. De basisconcepten van databases en databasebeheersystemen worden beschreven. De kenmerken van de mogelijkheden om het informatiesysteem in te richten volgens de client-server architectuur worden gegeven. De classificatie van het DBMS wordt gegeven, de belangrijkste functies worden beschreven en er wordt gekeken naar opties voor het maken van applicaties en het organiseren van gebruikersinteractie met informatiesystemen.

1.1. Databases en informatiesystemen

De oplossing voor veel problemen is gebaseerd op informatieverwerking. Om de verwerking van informatie te vergemakkelijken, worden informatiesystemen (IS) in het leven geroepen. Geautomatiseerde IC's worden IC's genoemd waarin technische middelen worden gebruikt, met name computers. De meeste bestaande IS'en zijn geautomatiseerd, dus kortheidshalve zullen we ze gewoon IS'en noemen.

V breed begrip elk informatieverwerkingssysteem valt onder de definitie van IS. Door Toepassingsgebieden IP kan worden onderverdeeld in systemen die worden gebruikt in de productie, het onderwijs, de gezondheidszorg, de wetenschap, militaire zaken, de sociale sfeer, de handel en andere industrieën. Door objectieve functie IS kan voorwaardelijk worden onderverdeeld in de volgende hoofdcategorieën: managers, informatie en referentie, beslissingsondersteuning.

Merk op dat soms meer enge definitie van IP als een set hardware- en softwaretools die worden gebruikt om een ​​toegepast probleem op te lossen. In een organisatie kunnen er bijvoorbeeld informatiesystemen zijn, die respectievelijk zijn belast met de volgende taken: boekhouding van personeel en materiële en technische middelen, afrekening met leveranciers en klanten, boekhouding, enz.

Database is een soort IS, die de functies van gecentraliseerde opslag en accumulatie van verwerkte informatie implementeert, georganiseerd in een of meerdere databases.

Een databank (BND) bestaat over het algemeen uit de volgende onderdelen: een database (meerdere databases) met gegevens, een databasebeheersysteem, een datadictionary, een beheerder, een computersysteem en servicepersoneel. Laten we eens kijken naar de genoemde componenten en enkele van de belangrijke concepten die ermee verbonden zijn.

database (DB) is een verzameling speciaal georganiseerde gegevens die zijn opgeslagen in het geheugen van een computersysteem en die de toestand van objecten en hun onderlinge relaties in het betreffende onderwerp weerspiegelen.

De logische structuur die in de database is opgeslagen heet datapresentatiemodel. De belangrijkste modellen voor datapresentatie (datamodellen) zijn: hiërarchisch, netwerk-, relationeel, post-relationeel, multidimensionaal en objectgeoriënteerd (zie paragraaf 2).

Sispy ma en management 6a ami dunny (DBMS) is een complex van taal en pro. framework tools ontworpen voor het maken, onderhouden en delen van databases door veel gebruikers. Meestal onderscheidt het DBMS zich door het gebruikte datamodel. Dus DBMS gebaseerd op het gebruik van een relationeel datamodel wordt relationele DBMS genoemd.

Enkele van de eerste DBMS'en zijn de volgende systemen: IMS (IBM, 1968), IDMS (Cullinet, 1971), ADABAS (SoftwareAG, 1969) en INES (VNIISIAII USSR, 1976). Er zijn duizenden moderne databasebeheersystemen.

Sollicitatie is een programma of een reeks programma's die de informatieverwerking voor een toegepaste taak automatiseren. Ggeya-applicaties hebben overwogen met behulp van een database Applicaties kunnen worden gemaakt in de omgeving of buiten de DBMS-omgeving - met behulp van het npoi ramming-systeem met behulp van tools voor toegang tot de database, bijvoorbeeld Delphi of C++ Builder. Applicaties die zijn ontwikkeld in een DBMS-omgeving worden vaak aangeduid als: DBMS-toepassingen, en applicaties ontwikkeld rhc DBMS, - externe prikkelingen.

Om met een database te werken, zijn DBMS-tools vaak voldoende en hoeft u ze niet te gebruiken. Oproeptoepassingen, waarvan de creatie npoi-rammen vereist. Applicaties worden voornamelijk ontwikkeld in cases koi ja, u moet zorgen voor het gemak van het werk< БД неква тифицироьанным пользователям или ин­терфейс СУБД не устраивает пользователей.

buitenlands woordenboek (SD) is een BND-subsysteem dat is ontworpen voor gecentraliseerde opslag van informatie over datastructuren> pax, de relatie van databasebestanden met elkaar, gegevenstypen en formaten van hun presentatie, gegevens van gebruikers, beveiligingscodes en toegangscontrole, enz.

Functioneel is de SD aanwezig in alle BND's, maar het onderdeel dat deze functies uitvoert, heeft niet altijd deze naam. Meestal worden de functies van de cd uitgevoerd door het DBMS en worden ze opgeroepen vanuit het hoofdmenu van het systeem of geïmplementeerd met behulp van de hulpprogramma's.

AOminsh Trator over de basis van data ( AD) is een persoon of personen die verantwoordelijk zijn voor de ontwikkeling van vereisten voor een database, het ontwerp, de creatie, het effectieve gebruik en het onderhoud ervan. Tijdens de werking bewaakt een DB meestal de werking van het informatiesysteem, biedt bescherming tegen onbevoegde toegang, controleert de redundantie, consistentie, veiligheid en betrouwbaarheid van de informatie die in de DB is opgeslagen. Voor gel-informatiesystemen voor één gebruiker worden DBA-functies meestal toegewezen aan personen die rechtstreeks met de DB-toepassing werken.

In een computernetwerk werkt ADB in de regel samen met: netwerkadministrator. Tot de taken van deze laatste behoren het bewaken van de werking van de netwerkhardware en -software, het herconfigureren van het netwerk, het herstellen van software na storingen en storingen van apparatuur, preventieve maatregelen en het zorgen voor toegangscontrole.

Computersysteem: (VS) is een reeks onderling verbonden en gecoördineerde werkende computers of processors en andere apparaten die de processen voor het ontvangen, verwerken en verstrekken van informatie aan consumenten automatiseren. Aangezien de belangrijkste functies van BnD gegevensopslag en -verwerking zijn, moet het gebruikte vliegtuig, samen met het acceptabele vermogen van centrale verwerkingseenheden (CPU), voldoende RAM en extern direct toegangsgeheugen hebben.

Algemeen personeel voert de functies uit om hardware en software in een werkende staat te houden. Hij voert preventief, routinematig, herstel- en ander werk uit volgens planning, evenals indien nodig

annotatie: Het college behandelt de algemene betekenis van de begrippen database (DB) en database management systeem (DBMS). Basisconcepten met betrekking tot de database worden gegeven, zoals algoritme, tuple, object, entiteit. Basisvereisten voor de databank. Definities van DB en DBMS.

Het doel van de lezing: Begrijp het verschil tussen een database en een databasebeheersysteem. Maak kennis met de basisvereisten die gelden voor de databank en de basisdefinities met betrekking tot de database en DBMS.

Laten we eens kijken naar de algemene betekenis van de concepten database (DB) en databasebeheersysteem (DBMS).

Vanaf het allereerste begin van de ontwikkeling van computertechnologie werden twee hoofdrichtingen voor het gebruik ervan gevormd.

De eerste richting is het gebruik van computertechnologie om numerieke berekeningen uit te voeren die te lang duren of zelfs onmogelijk zijn om handmatig uit te voeren. De opkomst van deze richting droeg bij aan de intensivering van methoden voor de numerieke oplossing van complexe wiskundige problemen, de ontwikkeling van een klasse programmeertalen gericht op het gemakkelijk schrijven van numerieke algoritmen, de vorming van feedback met de ontwikkelaars van nieuwe computerarchitecturen .

De tweede richting is het gebruik van computertechnologie in automatische of geautomatiseerde informatiesystemen... In de breedste zin van het woord is een informatiesysteem een ​​softwarepakket met als functies het ondersteunen van betrouwbare opslag van informatie in het computergeheugen, het uitvoeren van toepassingsspecifieke informatietransformaties en/of berekeningen en het bieden van een handige en gemakkelijk te - leer-interface. Gewoonlijk zijn de hoeveelheden informatie waarmee dergelijke systemen te maken hebben vrij groot en heeft de informatie zelf een vrij complexe structuur. Klassieke voorbeelden van informatiesystemen zijn: banksystemen, reserveringssystemen voor vlieg- of treintickets, hotelkamers, enz.

In feite is de tweede richting iets later ontstaan ​​dan de eerste. Dit komt door het feit dat computers aan het begin van de computertijd beperkte capaciteiten hadden op het gebied van geheugen. Het is duidelijk dat we alleen over betrouwbare en langdurige opslag van informatie kunnen praten als er geheugenapparaten zijn die informatie opslaan nadat de stroomtoevoer is uitgeschakeld. RAM heeft deze eigenschap meestal niet. In het begin werden twee soorten externe opslagapparaten gebruikt: magneetbanden en trommels. Tegelijkertijd was de capaciteit van magnetische banden vrij groot, maar door hun fysieke aard boden ze: sequentiële toegang naar de gegevens. Magnetische trommels (ze lijken het meest op moderne magnetische schijven met vaste koppen) gaven willekeurige toegang tot gegevens, maar waren van beperkte omvang.

Het is gemakkelijk in te zien dat deze beperkingen niet erg belangrijk zijn voor puur numerieke berekeningen. Zelfs als het programma een grote hoeveelheid informatie moet verwerken (of produceren), kun je tijdens het programmeren nadenken over de locatie van deze informatie in het externe geheugen, zodat het programma zo snel mogelijk draait.

Aan de andere kant, voor informatiesystemen waarin de behoefte aan actuele gegevens door de gebruiker wordt bepaald, is de beschikbaarheid van alleen magneetbanden en trommels niet bevredigend. Stel je voor dat een kaartkoper aan de kassa staat te wachten tot de band helemaal is teruggespoeld. Een van de natuurlijke vereisten voor dergelijke systemen is de gemiddelde snelheid van de operaties.

Het waren de vereisten voor computertechnologie van niet-numerieke toepassingen die de opkomst van verwijderbare . veroorzaakten magnetische schijven met bewegende koppen, wat een revolutie was in de geschiedenis van de informatica. Deze externe geheugenapparaten had een aanzienlijk hogere capaciteit dan magnetische trommels, bood een bevredigende snelheid van toegang tot gegevens in willekeurige toegangsmodus, en de mogelijkheid om het schijfpakket op het apparaat te veranderen maakte het mogelijk om een ​​bijna onbeperkt gegevensarchief te hebben.

Met de komst van magnetische schijven begon de geschiedenis van gegevensbeheersystemen in extern geheugen. Daarvoor bepaalde elk applicatieprogramma dat gegevens in het externe geheugen moest opslaan zelf de locatie van elk stuk gegevens op een magneetband of trommel en voerde het uitwisselingen uit tussen RAM en extern geheugen met behulp van low-level software en hardware (machine-instructies of oproepen naar de overeenkomstige programma's van het besturingssysteem). Deze manier van werken maakt het niet mogelijk of zeer moeilijk om meerdere archieven van langdurig opgeslagen informatie op één extern medium te onderhouden. Bovendien moest elke applicatie de problemen oplossen van het benoemen van stukjes gegevens en het structureren van gegevens in het externe geheugen.

De overstap naar het gebruik van bestandsbeheersystemen was een historische stap. Vanuit het oogpunt van het applicatieprogramma is het bestand: genoemd gebied extern geheugen waarnaar kan worden geschreven en waaruit gegevens kunnen worden gelezen. Regels voor bestandsnaamgeving, de manier om toegang te krijgen tot de gegevens die in het bestand zijn opgeslagen en de structuur van deze gegevens zijn afhankelijk van de specifieke bestandsbeheersystemen en mogelijk op het bestandstype. Bestandsbeheersysteem zorgt voor het toewijzen van extern geheugen, het toewijzen van bestandsnamen aan corresponderende externe geheugenadressen en het verstrekken van gegevenstoegang.

Elke taak van informatieverwerking en besluitvorming kan worden weergegeven in de vorm van een diagram dat wordt getoond in Fig. 1.1.


Rijst. 1.1.

Definitie van basistermen

Laten we definities geven van de belangrijkste termen. Informatie (input en output) en de regels voor de transformatie ervan worden onderscheiden als componenten van het schema.

Regels kunnen de vorm hebben van algoritmen, procedures en heuristische reeksen.

Algoritme - een reeks regels voor de overgang van de initiële gegevens naar het resultaat. Regels kunnen worden uitgevoerd door een computer of een persoon.
Gegevens - een reeks objectieve informatie.
Informatie - informatie die voorheen onbekend was bij de ontvanger van informatie, zijn kennis aanvullen, de bepalingen en bijbehorende overtuigingen bevestigen of weerleggen. Informatie is subjectief van aard en wordt bepaald door het kennisniveau van het onderwerp en de mate van zijn waarneming. Informatie wordt door de proefpersoon uit de relevante gegevens gehaald.
Kennis - een reeks feiten, patronen en heuristische regels, met behulp waarvan de taak wordt opgelost.

De opeenvolging van gegevensverwerkingen wordt informatietechnologie (IT) genoemd. Vanwege de aanzienlijke hoeveelheid informatie in moderne taken, moet deze worden besteld. Er zijn twee manieren om te bestellen.

  1. Gegevens zijn gekoppeld aan een specifieke taak (arraytechnologie) - bestellen op gebruik. Algoritmen zijn echter flexibeler (ze kunnen vaker veranderen) dan data. Dit maakt het noodzakelijk om gegevens opnieuw te ordenen, die bovendien in verschillende taken kunnen worden herhaald.
  2. In dit opzicht is een andere veelgebruikte databasetechnologie voorgesteld, namelijk het bestellen van opslag.

Onder databank (DB) inzicht in de verzameling gegevens die samen worden opgeslagen met een zodanige minimale redundantie dat deze op een optimale manier kan worden gebruikt voor een of meer toepassingen. Het doel databases maken, als een vorm van informatietechnologie en een vorm van gegevensopslag, is het bouwen van een gegevenssysteem dat niet afhankelijk is van de gebruikte algoritmen (software), de gebruikte technische middelen en de fysieke locatie van de gegevens in de computer; het verstrekken van consistente en volledige informatie voor ad-hocverzoeken. De database gaat uit van een multifunctioneel gebruik (meerdere gebruikers, vele documentvormen en verzoeken van één gebruiker).

Kennisbank (KB) is een verzameling van de database en de gebruikte regels, ontvangen van de beslissers (DM).

Naast het concept "database" is er de term "databank", die twee interpretaties heeft.

  1. Gegevens worden momenteel verwerkt gedecentraliseerd(op werkplekken) met behulp van personal computers (pc). Aanvankelijk werd gecentraliseerde verwerking op mainframes gebruikt. Door centralisatie werd de database een databank genoemd en wordt daarom vaak geen onderscheid gemaakt tussen databases en databanken.
  2. Database- database en het beheersysteem (DBMS). DBMS (bijvoorbeeld FoxPro) is een applicatie voor: databases maken als een verzameling tweedimensionale tabellen.
Databank (BnD) is een systeem van speciaal georganiseerde gegevens, software, taalkundige, organisatorische en technische middelen bedoeld voor gecentraliseerde accumulatie en collectief multifunctioneel gebruik van gegevens.
Databases (DB) is een benoemde verzameling gegevens die de status van objecten en hun relaties in het beschouwde domein weergeeft. Kenmerkend voor databases is consistentie: gegevens worden voortdurend verzameld en gebruikt; de samenstelling en structuur van de gegevens, die nodig zijn voor het oplossen van bepaalde toegepaste problemen, zijn meestal constant en stabiel in de tijd; individuele of zelfs alle data-elementen kunnen veranderen - maar dit zijn manifestaties van constantheid - constante relevantie.
Databasebeheersysteem (DBMS) is een set taal- en softwaretools die is ontworpen voor het maken, onderhouden en delen van een database door veel gebruikers.

Soms worden archieven toegewezen als onderdeel van de databank. De reden hiervoor is een speciale manier van gegevensgebruik, waarbij slechts een deel van de gegevens onder de operationele controle van het DBMS staat. Alle andere gegevens bevinden zich meestal op media die niet operationeel worden beheerd door het DBMS. Dezelfde gegevens op verschillende tijdstippen kunnen zowel in databases als in archieven worden opgenomen. Databanken mogen geen archieven hebben, maar als ze dat wel hebben, dan kan de databank ook een archiefbeheersysteem bevatten.

Doeltreffend management extern geheugen zijn de belangrijkste functie van het DBMS. Deze meestal gespecialiseerde tools zijn zo belangrijk vanuit het oogpunt van efficiëntie dat als ze niet beschikbaar zijn, het systeem sommige taken gewoon niet kan uitvoeren, simpelweg omdat het te lang duurt om ze te voltooien. Geen van deze gespecialiseerde functies is echter zichtbaar voor de gebruiker. Ze zorgen voor onafhankelijkheid tussen de logische en fysieke lagen van het systeem: de applicatieprogrammeur hoeft geen indexeringsprogramma's te schrijven, schijfruimte toe te wijzen, enz.

Basisvereisten voor databanken

De ontwikkeling van de theorie en praktijk van het creëren van informatiesystemen op basis van het concept van databases, het creëren van uniforme methoden en hulpmiddelen voor het organiseren en ophalen van gegevens maken het mogelijk om informatie over steeds complexere objecten en hun onderlinge relaties op te slaan en te verwerken, waardoor multidimensionale informatiebehoeften van verschillende gebruikers worden geboden . De belangrijkste eisen voor databanken kunnen als volgt worden geformuleerd:

  • Hergebruik van gegevens: gebruikers moeten de gegevens op verschillende manieren kunnen gebruiken.
  • Eenvoud: gebruikers moeten gemakkelijk kunnen weten en begrijpen welke gegevens tot hun beschikking staan.
  • Makkelijk te gebruiken: gebruikers moeten in staat zijn (procedureel) gemakkelijk toegang te krijgen tot de gegevens, met alle complexiteiten van toegang tot de gegevens verborgen in het databasebeheersysteem zelf.
  • Flexibiliteit in gebruik: gegevenstoegang of zoekopdrachten moeten worden uitgevoerd met behulp van verschillende toegangsmethoden.
  • Snelle verwerking van gegevensverzoeken: verzoeken om gegevens moeten worden afgehandeld met behulp van een query-taal op hoog niveau, niet alleen toepassingen die zijn geschreven om specifieke verzoeken af ​​te handelen.
  • Interactie taal eindgebruikers met het systeem moeten eindgebruikers de mogelijkheid bieden om gegevens te verkrijgen zonder toepassingsprogramma's te gebruiken.

De database is het fundament voor toekomstige applicatiegroei: databases moeten het mogelijk maken om snel en goedkoop nieuwe applicaties te ontwikkelen.

  • Geestelijke arbeidskosten besparen: bestaande programma's en logische structuren gegevens mogen niet worden gewijzigd wanneer er wijzigingen in de database worden aangebracht.
  • Beschikbaarheid van een applicatieprogrammeerinterface: Applicatieprogramma's moeten eenvoudig en efficiënt aan gegevensverzoeken kunnen voldoen; programma's moeten worden geïsoleerd van bestandslocaties en manieren van aanspreken gegevens.
  • Gedistribueerde gegevensverwerking: het systeem moet functioneren onder de omstandigheden van computernetwerken en efficiënte gebruikerstoegang bieden tot alle gegevens van een gedistribueerde database die zich overal in het netwerk bevindt.
  • Aanpassingsvermogen en uitbreidbaarheid: de database moet aanpasbaar zijn en de aanpassing mag er niet toe leiden dat applicatieprogramma's worden overschreven. Bovendien moet de set vooraf gedefinieerde gegevenstypen die bij het DBMS worden geleverd, uitbreidbaar zijn - het systeem moet middelen hebben om nieuwe typen te definiëren en er mogen geen verschillen zijn in het gebruik van door het systeem en door de gebruiker gedefinieerde typen.
  • Controle van gegevensintegriteit: het systeem moet datafouten beheersen en de onderlinge logische consistentie van de data controleren.
  • Gegevensherstel na storingen: automatisch herstel zonder transactiegegevens te verliezen. In het geval van hardware- of softwarestoringen, moet het systeem terugkeren naar een consistente gegevensstatus.
  • AIDS moet de ontwikkelaar toestaan ​​of
  • taalkundige hulpmiddelen;
  • Software;
  • technische middelen;
  • Organisatorische en administratieve subsystemen en regelgevende en methodologische ondersteuning.

Organisatorische en methodologische middelen is een reeks instructies, methodologisch en regelgevend materiaal, beschrijvingen van de structuur en procedures voor een gebruiker om met een DBMS en DB te werken.

DB- en DBMS-gebruikers

Gebruikers (DBMS) kunnen worden onderverdeeld in twee hoofdcategorieën: eindgebruikers; databasebeheerders.

Speciale aandacht moet worden besteed aan de databasebeheerder (DBA). Uiteraard wordt de database gebouwd voor de eindgebruiker (KP). Aanvankelijk werd echter aangenomen dat KP's niet zouden kunnen werken zonder een gespecialiseerde programmeur, die de databasebeheerder werd genoemd. Met de komst van DBMS namen ze een aanzienlijk deel van de DBMS-functies over, vooral voor databases met een kleine hoeveelheid gegevens. Voor grote gecentraliseerde en gedistribueerde databases blijft de behoefte aan DBA's echter bestaan. In brede zin worden onder DBA's verstaan ​​systeemanalisten, ontwerpers van datastructuren en informatieondersteuning, ontwerpers van verwerkingstechnologie, systeem- en applicatieprogrammeurs, operators, specialisten op het vakgebied en onderhoud. Met andere woorden, in grote databases kunnen dit teams van specialisten zijn. De taken van de ADB zijn onder meer:

  1. analyse van het vakgebied, status van informatie en gebruikers;
  2. structuurontwerp en gegevensmodificatie;
  3. opdracht- en integriteitsborging;
  4. gegevensbescherming;
  5. zorgen voor databaseherstel;
  6. verzameling en statistische verwerking van verzoeken aan de database, analyse van de effectiviteit van het functioneren van de database;
  7. werken met de gebruiker.

Korte samenvatting

Databases (DB) zijn een benoemde verzameling gegevens die de staat van objecten en hun relaties in het beschouwde onderwerpgebied weergeeft.

Een databasebeheersysteem (DBMS) is een set taal- en softwaretools die is ontworpen voor het maken, onderhouden en delen van een database door veel gebruikers.

De belangrijkste vereisten voor databanken zijn: datahergebruik, eenvoud, gebruiksgemak, flexibiliteit in gebruik, snelle verwerking van verzoeken om data, taal van interactie.

Gebruikers (DBMS) kunnen worden onderverdeeld in twee hoofdcategorieën: eindgebruikers; database beheerders.

Zelftestvragen

  • Geef de definitie van de database.
  • Geef de definitie van een databank.
  • Noem twee interpretaties van de databank.
  • Wat is een databasebeheersysteem?
  • Basisvereisten voor de databank.
  • Wat is data, informatie, kennis?
  • DBMS en DB-gebruikers?
  • De belangrijkste functies van de databasebeheerder.
  • Wat maakt het mogelijk om snel en goedkoop nieuwe toepassingen te ontwikkelen?

Wat is een database in de informatica?

In de informatica is het concept van een database een verzameling gegevens voor informatienetwerken en gebruikers, opgeslagen in een speciale, georganiseerde vorm. Het type gegevensopslag wordt bepaald door de gegeven structuur (schema) van de database en de regels voor het beheer ervan.

Op zichzelf zijn databases nutteloos als er geen manier is om ze te beheren. Met databasebeheer bedoelen we de mogelijkheid om individueel of collectief informatie toe te voegen, te sorteren, te kopiëren of volledig te kopiëren en te verplaatsen, twee of meer databases te combineren. Om databases te beheren zijn er softwareproducten gemaakt, namelijk databasesoftware. Ze worden genoemd DBMS - databasebeheersystemen.

Wat is DBMS en SQL?

Dit is waar consumenten mee te maken hebben, u en ik. Moderne DBMS kan niet alleen tekst of afbeeldingen verwerken, maar ook mediabestanden (audio- en videobestanden).

Elk softwareproduct heeft zijn eigen taal waarmee het wordt bestuurd. DBMS is geen uitzondering. Een van de belangrijkste talen voor communicatie met het DBMS is: SQL (gestructureerde querytaal).

Opgemerkt moet worden dat DBMS's door de aard van hun gebruik zijn onderverdeeld in één gebruiker (voor één gebruiker - een lokale computer) en veel gebruikers (voor netwerken).

Ik weet zeker dat je niet denkt dat er één universele DBMS is. En terecht, het zijn er tientallen. In het kader van deze paragraaf zullen we ons beperken tot het werken met het gratis en meest voorkomende databasebeheersysteem MySQL.

MySQL DBMS

MySQL DBMS werkt alleen met relationele databases. Relationele databases zijn in eerste instantie het gemakkelijkst te leren. Daarnaast worden ze op alle hosting en servers gebruikt voor massaal gebruik.

Rest ons nog het concept van een relationele database te geven. Dit zijn eenvoudige tabellen met informatieve rijen en kolommen. Het snijpunt van een rij en een kolom wordt een cel genoemd. De hele database bestaat uit meerdere of veel tabellen en alle tabellen werken met elkaar samen.

Elke site-eigenaar weet dat om de site goed te laten werken, niet alleen bestanden met de paginacode nodig zijn, maar ook databases. Databasebeheersystemen (DBMS) worden gebruikt om te communiceren met databases. In dit artikel wil ik het hebben over databases en DBMS, over welke typen er bestaan ​​en hoe ze van elkaar verschillen.

Database

Een database is een specifieke set gegevens, die in de regel zijn gekoppeld door een verenigende functie of een eigenschap (of meerdere). Deze gegevens zijn bijvoorbeeld alfabetisch gesorteerd. De overvloed aan verschillende gegevens die in één database kunnen worden gestopt, leidt tot veel variaties op wat kan worden vastgelegd: persoonlijke gegevens van gebruikers, records, datums, bestellingen, enzovoort. Als u bijvoorbeeld een online winkel heeft, kan de database van uw site prijslijsten, een catalogus van goederen of diensten, rapporten, statistieken en klantinformatie bevatten.

Allereerst is het handig omdat informatie snel in de database kan worden ingevoerd en indien nodig net zo snel weer kan worden opgevraagd. Als aan het begin van de webontwikkeling alle benodigde gegevens in de paginacode moesten worden geschreven, is dat nu niet nodig - de benodigde informatie kan met behulp van scripts uit de database worden opgevraagd. Speciale algoritmen voor het opslaan en ophalen van informatie die in databases worden gebruikt, stellen u in staat om de informatie die u nodig hebt in slechts een fractie van een seconde te vinden - en wanneer u in een virtuele ruimte werkt, is de snelheid van een resource belangrijker dan wat dan ook.

Ook de relatie van informatie in de database is van belang: een wijziging in één regel kan leiden tot significante wijzigingen in andere regels. Op deze manier met data werken is veel makkelijker en sneller dan wanneer de wijzigingen op slechts één plek in de database zouden plaatsvinden.

Dit betekent echter niet dat elke site een database moet hebben - als u bijvoorbeeld een site voor visitekaartjes heeft en u plaatst geen nieuwe informatie op de site, dan heeft u gewoon geen database nodig. De eenvoudigste manier om een ​​eenvoudige website te maken, is door er een te maken.

Databasemanagementsysteem

Zoals je uit de naam kunt afleiden, is een databasebeheersysteem (of afgekort DBMS) software die wordt gebruikt om databases te maken en ermee te werken. De belangrijkste functie van het DBMS is gegevensbeheer (dat zowel extern als in RAM kan zijn). Het DBMS ondersteunt noodzakelijkerwijs databasetalen en is ook verantwoordelijk voor het kopiëren en herstellen van gegevens na eventuele fouten.

Met betrekking tot de classificatie van databases zijn er verschillende mogelijkheden.
U kunt de databases bijvoorbeeld delen door: datamodellen: hiërarchisch (hebben een boomstructuur), netwerk (vergelijkbaar in structuur met hiërarchische type databases).

Of, als de verdeling gaat volgens: waar bevindt de DBMS zich?, ze kunnen worden onderverdeeld in lokaal - het volledige DBMS bevindt zich op één computer en gedistribueerde - delen van het databasebeheersysteem bevinden zich op meerdere computers.

File-server, client-server en embedded - dit zijn de namen van het DBMS, indien gedeeld door manier om toegang te krijgen tot databases... Bestandsserver-DBMS'en worden nu als verouderd beschouwd; voornamelijk het gebruik van client-server (DBMS, die zich samen met de database op de server bevindt) en embedded (geen afzonderlijke installatie vereist) systemen.

De informatie die wordt opgeslagen in databases is niet alleen beperkt tot tekst- of grafische bestanden - moderne versies van het DBMS ondersteunen ook audio- en videobestandsindelingen.

In dit artikel zal ik me concentreren op DBMS, die worden gebruikt om informatie van verschillende webbronnen op te slaan.

Waarom zijn deze DBMS'en nodig? Naast hun hoofdfunctie - het opslaan en organiseren van een enorme hoeveelheid informatie - stellen ze u in staat om klantverzoeken snel te verwerken en verse en relevante informatie te verstrekken.

Dit geldt ook voor de wijzigingen die u aanbrengt - in plaats van de informatie in elk bestand van de site te wijzigen, kunt u deze in de database wijzigen, waarna de juiste informatie onmiddellijk op elke pagina wordt weergegeven.

Relationele DBMS en SQL

Relationele en object-relationele DBMS behoren tot de meest voorkomende systemen. Het zijn tabellen waarin elke kolom (een "veld" of "veld" genoemd) is geordend en een specifieke, unieke naam heeft. De volgorde van regels (ze worden "records" of "records" genoemd) wordt bepaald door de volgorde waarin informatie in de tabel wordt ingevoerd. In dit geval kan de verwerking van kolommen en rijen in willekeurige volgorde plaatsvinden. Tabellen met gegevens zijn door speciale relaties aan elkaar gekoppeld, zodat u met één query kunt werken met gegevens uit verschillende tabellen, bijvoorbeeld kunt combineren.

Om relationele databases te beheren, wordt een speciale programmeertaal gebruikt - SQL. De afkorting staat voor "Structured query language", vertaald in het Russisch "taal van gestructureerde zoekopdrachten".

De opdrachten die in SQL worden gebruikt, zijn onderverdeeld in die voor het manipuleren van gegevens, die voor het definiëren van gegevens en die voor het manipuleren van gegevens.

Het schema voor het werken met de database is als volgt:


MySQL

MySQL is een van de meest populaire en wijdverbreide DBMS die door veel bedrijven wordt gebruikt (bijvoorbeeld Facebook, Wikipedia, Twitter, LinkedIn, Alibaba en anderen). MySQL is een relationeel databasebeheersysteem met gratis software dat is gelicentieerd onder de voorwaarden van de GNU Public License. Doorgaans wordt dit databasebeheersysteem gedefinieerd als een goed, snel en flexibel systeem, aanbevolen voor gebruik in kleine tot middelgrote projecten. MySQL heeft veel verschillende voordelen. Het ondersteunt bijvoorbeeld verschillende soorten tabellen: zowel het bekende MyISAM en InnoDB, als het meer exotische HEAP en MERGE; bovendien groeit het aantal ondersteunde typen voortdurend. MySQL voert alle opdrachten snel uit - het is misschien wel de snelste database die momenteel bestaat. Een onbeperkt aantal gebruikers kan tegelijkertijd met dit databasebeheersysteem werken en het aantal rijen in tabellen kan gelijk zijn aan 50 miljoen.

Omdat MySQL in vergelijking met sommige andere DBMS minder functies ondersteunt, is het veel gemakkelijker om ermee te werken dan bijvoorbeeld met PostgreSQL, dat hieronder zal worden besproken.

De eerste versie van MySQL werd in 1995 uitgebracht en sindsdien zijn er verschillende volgende releases geweest, die elk aanzienlijke veranderingen met zich meebrachten.

Om met MySQL te werken, wordt niet alleen tekst, maar ook grafische modus gebruikt. Dit is mogelijk dankzij de phpMyAdmin-applicatie: je hoeft niet eens SQL-commando's te kennen om in de applicatie te werken, en je kunt je database rechtstreeks via je browser beheren.

In het algemeen kan worden opgemerkt dat MySQL de keuze is van diegenen die een DBMS nodig hebben voor een klein of middelgroot project, snel en gemakkelijk te gebruiken en zonder enige administratieve problemen.


PostgreSQL

Dit open source databasebeheersysteem is een object-relationeel type DBMS. Net als in het geval van MySQL is PostgreSQL gebaseerd op de SQL-taal, maar in tegenstelling tot MySQL ondersteunt PostgreSQL de SQL-2011-standaard. Dit DBMS heeft geen beperkingen voor de maximale grootte van de database of het maximale aantal records of indexen in een tabel.

Als we het hebben over de voordelen van PostgreSQL, dan is het natuurlijk de betrouwbaarheid van transacties en replicaties, de mogelijkheid van overerving en gemakkelijke uitbreidbaarheid. PostgreSQL ondersteunt verschillende uitbreidingen en smaken van programmeertalen zoals PL/Perl, PL/Python en PL/Java. Het is ook mogelijk om C-compatibele modules te laden.

Veel mensen wijzen erop dat dit DBMS, in tegenstelling tot MySQL, goede en gedetailleerde documentatie heeft, die op bijna alle vragen antwoord geeft.

Het feit dat PostgreSQL periodiek wordt vergeleken met zo'n krachtig datamanagementsysteem als Oracle geeft aan dat het een grootschaliger databasemanagementsysteem is dan MySQL.

Dit alles stelt ons in staat om van PostgreSQL te spreken als een van de meest geavanceerde DBMS van dit moment.


SQLite

Op dit moment is het een van de meest compacte DBMS; het is ook insluitbaar en relationeel. Met SQLite kunt u alle gegevens in één bestand opslaan en onderscheidt het zich door zijn kleine formaat door benijdenswaardige prestaties. SQLite verschilt aanzienlijk van MySQL en PostgreSQL in zijn structuur: de engine en de interface van deze DBMS bevinden zich in dezelfde bibliotheek - en dit is wat u in staat stelt om alle queries zeer snel uit te voeren. Andere DBMS'en (MySQL, PostgreSQL, Oracle, enz.) gebruiken een client-serverparadigma wanneer communicatie plaatsvindt via een netwerkprotocol.

Een van de tekortkomingen is het ontbreken van een gebruikerssysteem en de mogelijkheid om de productiviteit te verhogen.

SQLite kan worden aanbevolen voor gebruik in projecten waar u de applicatie snel moet kunnen porten en waar schaalbaarheid niet nodig is.


Orakel

Dit DBMS is van het object-relationele type. De naam komt van de naam van het bedrijf dat dit systeem heeft ontwikkeld, Oracle. Samen met SQL gebruikt het DBMS een procedurele extensie genaamd PL / SQL, evenals de Java-taal.

Oracle is een systeem dat al meer dan twaalf jaar stabiel is, dus het is de keuze van grote bedrijven waarvoor betrouwbaarheid van disaster recovery, een gestroomlijnde back-upprocedure, schaalbaarheid en andere waardevolle functies belangrijk zijn. Bovendien biedt dit DBMS een uitstekende beveiliging en effectieve gegevensbescherming.

In tegenstelling tot andere DBMS'en zijn de kosten voor het kopen en gebruiken van Oracle vrij hoog, en dit vormt vaak een belangrijk obstakel voor het gebruik ervan in kleine bedrijven. Waarschijnlijk is dit ook de reden dat Oracle slechts op de 6e plaats staat in de 2016 DBMS-rating in Rusland.



MongoDB

Dit DBMS onderscheidt zich doordat het is ontworpen om hiërarchische gegevensstructuren op te slaan en daarom wordt het documentgericht genoemd (het is een documentopslag zonder het gebruik van tabellen of schema's). MongoDB is open source.

Met behulp van een identifier kunt u snelle bewerkingen op een object uitvoeren; dit DBMS presteert ook goed in complexe interacties. Allereerst hebben we het over prestaties - in sommige gevallen zal een applicatie die is geschreven in MongoDB sneller werken dan dezelfde applicatie die SQL gebruikt, omdat MongoDB behoort tot de NoSQL DBMS-klasse en gebruikt in plaats van SQL een objectquery-taal, die veel lichter is dan SQL.

Deze taal heeft echter zijn eigen beperkingen en daarom moet MongoDB worden gebruikt in gevallen waarin er geen behoefte is aan complexe en niet-triviale selecties.

In plaats van een conclusie

De keuze van een DBMS is een belangrijk punt bij het maken van uw resource. Ga uit van uw taken en mogelijkheden, probeer en experimenteer om precies de optie te vinden die het meest geschikt is.