Dossierarchieven - Kennishypermarkt. Bestandsarchieven

Bestandsarchiefservers in het Windows-besturingssysteem.
Tienduizenden internetservers zijn bestandsarchiefservers, die honderden miljoenen bestanden van verschillende typen opslaan (programma's, apparaatstuurprogramma's, grafische en geluidsbestanden, enz.). De aanwezigheid van dergelijke bestandsarchiefservers is erg handig voor gebruikers, omdat veel noodzakelijke bestanden rechtstreeks van internet kunnen worden "gedownload".


Met het bestandsarchief van Rapidshare.com kan iedereen elk bestand naar de server uploaden en een link ontvangen om later te downloaden.

Bestandsarchiefservers, evenals de mogelijkheid om het programma te "downloaden", worden door veel bedrijven ondersteund: softwareontwikkelaars en fabrikanten van computerhardwarecomponenten en randapparatuur. De software die op dergelijke servers wordt gehost, wordt vrijelijk verspreid of is shareware, en daarom overtreedt de gebruiker door dit of dat bestand niet de wet op het auteursrecht op software.

Beheerders voor het downloaden van bestanden.
In het Windows-besturingssysteem hebben veel bestandsarchiefservers (freeware.ru, www.freesoft.ru, www.download.ru, enz.) voor het gemak van gebruikers een webinterface waarmee u ermee kunt werken via browsers . Browsers zijn geïntegreerde systemen voor het werken met verschillende internetinformatiebronnen en bevatten daarom bestandsdownloadmanagers.

Het is echter handiger om met bestandsarchieven te werken om gespecialiseerde bestandsdownloadmanagers te gebruiken waarmee u door kunt gaan met het downloaden van een bestand nadat de verbinding met de server is verbroken. Bestandsdownloadmanagers bieden de gebruiker gedetailleerde informatie in numerieke en grafische vorm over het bestandsdownloadproces (bestandsvolume, volume van het gedownloade deel, inclusief als percentage, downloadsnelheid, verstreken en resterende downloadtijd, enz.).

Sommige bestandsdownloadmanagers bereiken een hogere downloadsnelheid door het bestand in delen te splitsen en alle delen tegelijkertijd te downloaden. In de FlashGet-bestandsdownloadmanager wordt het proces van het downloaden van elk deel van een bestand bijvoorbeeld in grafische vorm weergegeven onder aan het toepassingsvenster.

Adres van het bestand op de bestandsarchiefserver.
Toegang tot bestanden op bestandsarchiefservers is zowel via HTTP als via het speciale FTP-bestandsoverdrachtprotocol (File Transfer Protocol) mogelijk. Met het FTP-protocol kunt u niet alleen bestanden downloaden van externe bestandsarchiefservers naar een lokale computer, maar omgekeerd ook bestanden overbrengen van een lokale computer naar een externe server.

Het bestandsadres bevat de manier waarop het bestand wordt geopend en de naam van de internetserver waarop het bestand zich bevindt.


Als het FTP-bestandsoverdrachtprotocol wordt gebruikt als methode om toegang te krijgen tot het bestand file.exe dat is opgeslagen op de ftp.eict.ru-server, wordt het bestandsadres als volgt geschreven:
ftp://eict.ru/bestand.exe

Programmaopslagplaatsen in het Linux-besturingssysteem.
In het Linux-besturingssysteem worden de componenten van het systeem zelf en de applicatie opgeslagen in de vorm van “pakketten” (rpm-extensie), die elke gebruiker kan downloaden en installeren in zijn eigen versie van het systeem. Dat wil zeggen dat elke gebruiker zijn eigen Linux-besturingssysteem en zijn applicaties samenstelt op basis van zijn behoeften en voorkeuren, met behulp van een reeks pakketten in repository's.

Momenteel, nu de populariteit van het World Wide Web vrij hoog is, staat het volume van het verkeer dat via het FTP-protocol via het internet wordt verzonden, toch op de eerste plaats, iets hoger dan het volume van het verkeer via het HTTP-protocol. In dit licht is het organiseren van bestandsarchieven binnen het raamwerk van TCP/IP-technologie een uiterst dringende taak.

Archieven worden gebruikt om verschillende problemen op te lossen, maar de meest populaire op internet zijn vrij toegankelijke archieven of archieven die toegankelijk zijn met behulp van een anonieme gebruikers-ID. Deze archieven kunnen dus worden gebruikt als:

  • verzamelingen vrije software;
  • verzamelingen programma's voor bètatesten;
  • verzamelingen normatieve en regelgevende documenten;
  • enzovoort.

Een FTP-archief kan ook worden gebruikt als archief van commerciële software die in een bedrijf wordt gebruikt, alleen mag een dergelijk archief in dit geval geen anonieme toegang toestaan ​​tot de bronnen die erin zijn opgeslagen.

Vaak wordt de optie van geautoriseerde FTP-toegang ook gebruikt voor berichtenuitwisseling, d.w.z. als communicatiemiddel. Dit gebeurt meestal wanneer het e-mailsysteem om de een of andere reden niet werkt.

Momenteel kan het hele systeem van interactie tussen FTP-uitwisselingscomponenten worden weergegeven in de vorm van een diagram in figuur 4.1.

Dit diagram toont twee belangrijke technologische punten: ten eerste kan toegang tot het archief niet alleen worden uitgevoerd vanuit een gespecialiseerd clientprogramma, maar ook vanuit een universele browser, bijvoorbeeld Netscape Communicator of Microsoft Internet Explorer, en ten tweede om informatie te zoeken in FTP -in archieven kunt u het programma Archie gebruiken.

Rijst. 4.1. Interactiediagram van FTP-uitwisselingscomponenten

Het moet duidelijk zijn dat Archie en FTP totaal verschillende technologieën zijn. In de meeste gevallen hebben gebruikers toegang tot de Archie-server vanuit de Archie-client, die zich op dezelfde machine bevindt als de server, d.w.z. De gebruiker logt eerst via Telnet in als Archie-gebruiker en gebruikt vervolgens een clientprogramma (meestal gelanceerd als shell) om toegang te krijgen tot de Archie-server.

FTP (bestandsoverdrachtprotocol)

FTP (File Transfer Protocol) is een van de oudste protocollen op internet en maakt deel uit van de standaarden ervan. Gegevensuitwisseling bij FTP vindt plaats via een TCP-kanaal. De uitwisseling is gebouwd met behulp van client-servertechnologie. Figuur 4.2 toont het protocolmodel.

Rijst. 4.2. Protocolmodel

Bij FTP wordt de verbinding tot stand gebracht door de protocolinterpreter van de gebruiker. De centrale wordt bestuurd via een besturingskanaal in de TELNET-protocolstandaard. FTP-opdrachten worden gegenereerd door de protocolinterpreter van de gebruiker en naar de server verzonden. De antwoorden van de server worden ook via het besturingskanaal naar de gebruiker verzonden. Over het algemeen heeft de gebruiker de mogelijkheid om contact te leggen met de protocoltolk van de server en op andere manieren dan de tolk van de gebruiker.

FTP-opdrachten definiëren de parameters van het gegevensoverdrachtkanaal en het overdrachtsproces zelf. Ze bepalen ook de aard van het werken met externe en lokale bestandssystemen.

De controlesessie initialiseert de datalink. Bij het organiseren van een datatransmissiekanaal is de volgorde van acties anders, anders dan bij het organiseren van een besturingskanaal. In dit geval initieert de server de gegevensuitwisseling in overeenstemming met de parameters die zijn overeengekomen in de beheersessie.

Het datakanaal wordt tot stand gebracht voor dezelfde host als het besturingskanaal waardoor het datakanaal kan worden gebruikt voor zowel het ontvangen als het verzenden van gegevens.

Het is mogelijk dat gegevens naar een derde machine worden overgebracht. In dit geval organiseert de gebruiker een controlekanaal met twee servers en organiseert daartussen een direct datakanaal. Besturingsopdrachten gaan via de gebruiker en gegevens rechtstreeks tussen servers (Figuur 4.3).

Het besturingskanaal moet open zijn bij het overbrengen van gegevens tussen machines. Als deze gesloten is, stopt de gegevensoverdracht.

Rijst. 4.3. Verbinding maken met twee verschillende servers en gegevens daartussen overbrengen

. Communicatiemodi

Het protocol legt grote nadruk op verschillende manieren om gegevens uit te wisselen tussen machines met verschillende architecturen. Er is inderdaad van alles op internet, van personal computers en Macs tot supercomputers. Ze hebben allemaal verschillende woordlengtes en veel verschillende volgordes van bits in een woord. Bovendien werken verschillende bestandssystemen met verschillende gegevensorganisatie, wat tot uitdrukking komt in de concept van toegangsmethode.

Vanuit FTP-oogpunt kan de uitwisseling over het algemeen streamen of blokkeren, met of zonder codering in tussenliggende formaten, tekst of binair. Bij de tekstuitwisseling worden alle gegevens omgezet naar ASCII en in deze vorm over het netwerk verzonden. De enige uitzondering zijn IBM-mainframegegevens, die standaard naar EBCDIC worden verzonden als beide communicerende machines IBM zijn. Binaire gegevens worden verzonden als een reeks bits of ondergaan bepaalde transformaties tijdens de besturingssessie. Bij streaminggegevensoverdracht wordt doorgaans één gegevensbestand in één sessie overgedragen, en bij de blokmethode kunnen meerdere bestanden in één sessie worden overgedragen.

Nadat we het uitwisselingsprotocol in algemene termen hebben beschreven, kunnen we overgaan tot een beschrijving van de uitwisselingsmiddelen met behulp van het FTP-protocol. Er zijn zowel servers als clients voor vrijwel elk platform en elke besturingsomgeving. Het volgende beschrijft de standaardserver en client van Unix-achtige systemen.

Software voor toegang tot FTP-archieven

Om met FTP-archieven te werken heeft u de volgende software nodig: server, client en zoekprogramma. De server biedt overal op het netwerk toegang tot archiefbronnen, de client biedt gebruikers toegang tot elk archief op het netwerk en de zoekmachine biedt navigatie door het hele netwerk van archieven.

Deze componenten voor het delen van FTP variëren qua vorm en functionaliteit tussen besturingssystemen, maar er blijven enkele algemene principes bestaan, en opdrachtregelinterfaceprogramma's blijven grotendeels hetzelfde in alle besturingssystemen.

Protocolserver - ftpd-programma

Het ftpd-commando is bedoeld om verzoeken om informatie-uitwisseling via het FTP-protocol te verwerken. De server start meestal wanneer de computer opstart. De syntaxis voor het starten van de server is als volgt:

Ftpd [-d] [-1] [-t time-out]

  • d - foutopsporingsoptie;
  • 1 - automatische gebruikersidentificatieoptie;
  • t is de tijd van passief wachten op gebruikersopdrachten.

Elke server heeft zijn eigen beschrijving van opdrachten, die u kunt verkrijgen met behulp van de helpopdracht. Automatische gebruikersidentificatie wordt uitgevoerd met behulp van het bestand /etc/passwd. Het gebruikerswachtwoord mag niet leeg zijn.

Er is een speciaal bestand dat verboden gebruikers bevat, d.w.z. degenen voor wie service via het FTP-protocol verboden is. U kunt het archief betreden met een anonieme of ftp-gebruikers-ID. In dit geval neemt de server maatregelen om de toegang tot computerbronnen voor deze gebruiker te beperken. Normaal gesproken wordt voor dergelijke gebruikers een speciale ftp-map gemaakt, waarin de mappen bin, enz. en Pub zich bevinden. De bin-map bevat de opdrachten die mogen worden gebruikt, en de pub-map bevat de daadwerkelijke bestanden zelf. De map etc is niet zichtbaar voor de gebruiker en bevat.

Programma voor het delen van bestanden - ftp

FTP is een gebruikersinterface voor het uitwisselen van bestanden met behulp van het gelijknamige protocol. Het programma brengt een besturingskanaal tot stand met een externe server en wacht op gebruikersopdrachten. De externe server-ID wordt opgegeven als programmaargument of in de open interface-opdracht.

Als de ftp-opdracht op een gebruiker wordt uitgevoerd en op gebruikersopdrachten wacht, wordt de prompt "ftp>" op het scherm weergegeven.

Commandosyntaxis:

Ftp [-v][-d][-i][-n]

  • v - onderdrukt serverreacties en gegevensoverdrachtstatistieken;
  • n - bestuurt de gebruikersidentificatiemodus. Als deze schakeloptie is opgegeven, wordt eerst het .netrc-bestand gecontroleerd;
  • i - schakelt bevestigingen van bestandsoverdracht uit bij het bulksgewijs kopiëren van bestanden;
  • d - schakelt de foutopsporingsmodus in;
  • g - schakelt de transparantie van naamoverdracht uit.

In het kader van deze cursus is het niet mogelijk om alle ftp-commando's op te sommen, dus zullen we ons alleen concentreren op de meest noodzakelijke.

Het eerste dergelijke commando is commando openen. Met deze opdracht wordt een sessie met de externe server geopend:

Ftp>open polyn.net.kiae.su

Na het geven van een dergelijk commando volgen. U kunt ook een gebruiker registreren via gebruikersopdracht :

Ftp>gebruiker anoniem

In dit voorbeeld heeft de gebruiker geen speciale toegangsrechten tot de externe server en is daarom als anoniem geregistreerd. In dit geval dient u uw postadres in te vullen als reactie op het identificatieverzoek. Meestal is het voldoende om iets in te voeren dat lijkt op een postadres om toegang te krijgen tot archiefbronnen, maar er zijn ook nauwgezette servers die de aanwezigheid van een dergelijk adres controleren, dus het is beter om niemand te misleiden en eerlijk te registreren.

De volgende belangrijkste opdrachten zijn cd-opdrachten En ls (richt). Het doel van deze opdrachten is vrij transparant en begrijpelijk voor alle gebruikers: navigeren door de bestandssysteemboom en het bekijken van de inhoud van mappen. Hier raden we aan om de opdracht ls met extra parameters te gebruiken bij het bladeren door mappen:

Ftp>ls-FC

In dit geval kan de gebruiker een rapport met meerdere kolommen ontvangen waarin de bestandstypen worden aangegeven. Niet alle servers werken echter met deze combinatie.

Omdat er bij het overdrachts- en ontvangstproces twee machines betrokken zijn, is naast navigatie in het externe bestandssysteem ook navigatie in het lokale bestandssysteem nodig. Hiervoor wordt het lcd-commando (local cd) gebruikt. Bovendien kan de gebruiker elk lokaal shell-commando geven als hij het voorafgaat met het teken "!"

Ftp>!pwd

Met deze opdracht wordt de naam van de huidige map op de lokale computer weergegeven.

En tot slot zijn de belangrijkste ploegen ontvangst/transmissie van gegevens krijgen , neerzetten , mget , mput En bak. De get- en put-opdrachten kunnen één bestand accepteren of overbrengen:

Ftp>haal README.TXT

De mget, mput-opdrachten zijn ontworpen om een ​​reeks bestanden te ontvangen/verzenden:

Ftp> mget *.gz

Uit het voorbeeld blijkt dat in het laatste geval het “*”-masker wordt gebruikt. Bij het overbrengen van groepen bestanden wordt doorgaans voor elk bestand om bevestiging gevraagd. Om dit te voorkomen, moet u vóór het ontvangen/verzenden een probleem oplossen snelle opdracht. Deze laatste schakelt de modus van het bevestigingsverzoek om en wanneer dit commando opnieuw wordt gebruikt, wordt de status van het bevestigingsverzoek hersteld. Een ander nuttig commando is hash-opdracht :

FTP> hash #

Het "#"-symbool kan door een ander symbool worden vervangen. Bij het werken met langzame lijnen of bij het overbrengen van grote bestanden heeft de gebruiker, na het inschakelen van de hash-modus, de mogelijkheid om de voortgang van de gegevensoverdracht te zien (het teken "#" wordt weergegeven na de overdracht van elk blok). Het laatste waar u op moet letten, is het bin-commando. Na het geven van deze opdracht worden gegevens standaard overgedragen in de binaire gegevensoverdrachtmodus. Dit laatste is uiterst belangrijk, omdat Bij de overdracht naar ASCII kunnen programma's en gearchiveerde gegevens niet worden overgedragen. Het is vaak handig om de bin-modus in te schakelen voor tekengegevens met een willekeurige regellengte, zoals postscript-bestanden (*.ps), omdat in ASCII-modus is er een limiet voor de regellengte (meestal 254 tekens).

Om ftp af te sluiten, moet u uitvoeren opdracht afsluiten .

Zoeken in FTP-archieven - Archie-programma

Momenteel wordt FTP-toegang geboden via een verscheidenheid aan multiprotocol-interfaces (bijvoorbeeld Mozaïek of Netscape) of grafische FTP-shells zoals ftptool voor X-Window. Ze zijn allemaal veel handiger en gemakkelijker te gebruiken, maar ze verbruiken ook veel meer hulpbronnen.

Het is merkwaardig dat er zelfs een FTP-server is voor MS-DOS (NCSA Telbin-pakket), om nog maar te zwijgen van multitasking-omgevingen. Het vinden van de juiste FTP-server op internet is echter een complexe en tijdrovende taak. Om het te verlichten is er een speciale remedie: Archie. Archie is ontwikkeld aan de McGill University in Canada. Het is de taak van Archie om FTP-archieven te scannen om te zien of deze de vereiste bestanden bevatten. Je kunt met Archie samenwerken via een telnetsessie, via een lokale client of via e-mail. Om via telnet te werken, moet u een telnet-sessie openen en bij het inloggen het woord “archie” invoeren:

Telnet archie.mcgill.ca login: archie...... archie>

Nadat de prompt "archie>" verschijnt, dient u te informeren naar de mogelijkheden van de server door de opdracht "help" in te voeren.

Wanneer u via een lokale client werkt, voert u eenvoudigweg het volgende in:

Archie gnuplot.tar.gz

en als reactie ontvangen ze een lijst met archieven die het bestand “gnuplot.tar.gz” bevatten. Er moet rekening mee worden gehouden dat verschillende wijzigingen van clients (vooral grafische) qua syntaxis aanzienlijk van elkaar kunnen verschillen.

Archief is een bestand dat een of meer andere bestanden bevat, evenals metagegevens. Archieven worden gebruikt om een ​​willekeurig aantal bestanden te combineren in één enkel containerbestand met het oog op gemakkelijke opslag en overdracht van informatie of eenvoudigweg om gegevens te comprimeren. Om archieven te maken en ermee te werken, worden archiveringsprogramma's gebruikt.

De archieven kunnen de directorystructuur behouden en service-informatie bevatten voor het opsporen en corrigeren van fouten, opmerkingen en andere informatie. Afhankelijk van het archiefformaat kunnen de gegevens daarin worden gecodeerd met een wachtwoord.

Sollicitatie

Archieven zijn vooral handig als manier om bestandssysteemgegevens en metagegevens in één enkel bestand te verpakken voor opslag op een computer of voor verzending via kanalen die alleen bestands-voor-bestand-overdracht ondersteunen, zoals het verzenden van een mapstructuur via e-mail.

Naast archiveringsdoeleinden worden archieven vaak gebruikt om softwarepakketten te distribueren; in dit geval wordt het archief vaak een distributiepakket genoemd en kunnen er aanvullende voorwaarden met betrekking tot de inhoud op van toepassing zijn (er moet bijvoorbeeld een manifestbestand zijn). Voorbeelden van distributiearchieven: deb voor Debian, JAR voor Java, APK voor Android.

Functionele kenmerken

Afhankelijk van het type ondersteunen archieven het samenvoegen van bestanden tot één, datacompressie, encryptie, multi-volume (een archief uit verschillende delen), checksums om de integriteit van de archiefinhoud te verifiëren, zelfuitpakkend, zelfinstallatie, informatie over de bron volume en media, informatie over de directorystructuur, notities en opmerkingen, evenals andere metadata. Het archiefbestandsformaat wordt bepaald door de bestandsextensie en/of bestandskop. Voor het maken van archieven worden archiveringsprogramma's, software voor het schrijven van optische schijven en programma's voor het werken met schijfimages gebruikt.

Archiefformaten

Archiefformaat is een archiefbestandsformaat. Er zijn veel archiefformaten, maar slechts enkele daarvan hebben brede acceptatie en steun gekregen van softwareleveranciers en gebruikersgemeenschappen. De meest populaire in de Windows-omgeving zijn dus ZIP, RAR, 7z en in Mac OS - het SIT-formaat.

Archieftypen

  • Alleen archiveren formaten voegen alleen bestanden samen tot één (bijvoorbeeld: tar).
  • Alleen compressief formaten voeren alleen bestandscompressie uit (voorbeelden: gzip, bzip2).
  • Multifunctioneel Met formaten kunt u bestanden samenvoegen tot één bestand, ze comprimeren, coderen, informatie creëren voor het opsporen en corrigeren van fouten, archieven ontwerpen als zelfuitpakkend om inhoud te extraheren zonder de deelname van aanvullende software (bijvoorbeeld: RAR, ZIP,).
  • Distributief formaten worden gebruikt om software-installatiepakketten te maken, die ook zelfinstallerende bestanden kunnen zijn (bijvoorbeeld: JAR, APK, IPA).
  • Formaten schijfafbeeldingen gebruikt om schijfkopieën te maken die worden gebruikt als informatieopslagvolumes (voorbeelden: ISO, NRG).

Subtypen van archieven

Zelfuitpakkende archieven

Zelfuitpakkende archieven worden vaak ook SFX-archieven genoemd (van het Engelse SelF-eXtracting - self-extracting). In tegenstelling tot een gewoon archief heeft een zelfuitpakkend archief een uitvoerbaar bestandsformaat (in Windows is het een bestand met de extensie .EXE), om gegevens te extraheren waaruit (en vaak om een ​​inhoudsopgave te testen en weer te geven) geen apart programma - alles wordt gedaan met behulp van het SFX-archief. Met andere woorden, u verpakt de informatie eenvoudigweg in een SFX-archief, en de ontvanger voor wie het bedoeld is hoeft dit SFX-archief alleen maar te starten (in een vergelijkbaar besturingssysteem) om de uitgepakte informatie te ontvangen. Opmerking. In werkelijkheid zijn SFX-archieven gewone archieven waaraan een kleine uitvoerbare decompressormodule is gekoppeld, dus indien nodig (bijvoorbeeld uit angst dat deze uitvoerbare module mogelijk is geïnfecteerd met een virus), kunt u een geschikt extern archiveringsprogramma gebruiken om mee te werken het SFX-archief zonder het SFX-bestand zelf uit te voeren.

Archieven met meerdere volumes

Archieven met meerdere volumes zijn archieven die uit verschillende delen bestaan. Ze worden ondersteund in een aantal populaire archiefformaten: RAR, ZIP, 7z, enz. Om een ​​archief met meerdere volumes te maken, hoeft u bij het inpakken van bestanden eenvoudigweg de grootte te selecteren van de delen waarin het resulterende archief zal worden verdeeld. Deze functie is vooral handig bij het werken met grote bestanden (bijvoorbeeld videoschijfafbeeldingen), omdat u hiermee zelfs grote en slecht gecomprimeerde bestanden op kleinere media kunt opslaan. Sommige archiveringsprogramma's (bijvoorbeeld RAR) hebben de functie om automatisch de grootte van elk volume te bepalen, afhankelijk van de vrije ruimte op de huidige media die voor archivering wordt gebruikt, waardoor u zo efficiënt mogelijk gebruik kunt maken van archieven met meerdere volumes, bijvoorbeeld voor overbrengen van computer naar computer op verschillende flashdrives van verschillende groottes.

Doorlopende archieven

Continue (Engels - solide) archivering is een vorm van archivering waarbij alle bestanden die aan het archief worden toegevoegd, door de archiver worden beschouwd als één continue gegevensstroom. Dankzij deze aanpak is het mogelijk om een ​​aanzienlijke verhoging van de compressieverhouding te bereiken, vooral wanneer veel bestanden van hetzelfde type worden ingepakt die relatief klein zijn (met de grootte van het “glijdende woordenboek” van het archiveringshulpmiddel). Naast het voor de hand liggende voordeel (krachtigere compressie) hebben continue archieven ook hun nadelen. Omdat de gegevens in een continu archief één continue stroom vormen, moet u, voordat u een bestand kunt extraheren, eerst alle bestanden in het archief uitpakken. voor dit bestand, dus het uitpakken van bestanden aan het einde van het archief gaat langzamer. Ook worden bewerkingen om de inhoud van het archief te wijzigen (bestanden toevoegen en verwijderen) langzamer uitgevoerd dan in een regulier (niet-solide) archief. Als het archief om de een of andere reden beschadigd raakt, gaan bovendien alleen de bestanden mee voor plaatsen van schade, en alle informatie na deze plek zal verloren gaan. Met andere woorden: continue archieven zijn goed voor het verpakken en opslaan van gegevens die zelden hoeven te worden gewijzigd.

Metagegevens

Een archief bevat vrijwel altijd metadata. Deze omvatten:

  • Bestandsnamen (behalve voor sommige compressieprogramma's voor één bestand, bijvoorbeeld gzip, waarbij de bestandsnaam de naam is van het archief zonder extensie)
  • Identificatiegegevens van eigenaren, groepen, etc. bestanden en hun rechten
  • Bestandsgroottes
  • Datums van wijziging, creatie en laatste toegang tot bestanden
  • Bestandscontrolesommen om het correcte uitpakken te verifiëren
  • Archiefgrootte en controlesommen
  • Redundante gegevens om gegevens te herstellen wanneer deze beschadigd zijn
  • Digitale handtekening van de archiefmaker

MINISTERIE VAN ONDERWIJS EN WETENSCHAP VAN DE RUSSISCHE FEDERATIE

GEMEENTELIJKE ONDERWIJSINSTELLING PETRYAKSI SECUNDAIRE SCHOOL

ABSTRACT

"Bestandsarchief"

Uitgevoerd: leerling van het 10e leerjaar

Ilina E.E.

Docent: Ainetdinova H.A

Petrjaksy

Protocollen voor bestandsoverdracht 4

Communicatiemodi 6

7 gespecialiseerde bestandsdownloadmanagers

FTP-clients 8

Offline browsers 9

Referenties 11

Invoering

Archief is een bestand dat een of meer andere bestanden bevat, samen met meta-informatie. Vaak gebruikt om informatie te comprimeren. Het is het resultaat van het werk van het archiveringsprogramma.

Soorten archieven:

    Zelfuitpakkende archieven

    Archieven met meerdere volumes

    Doorlopende archieven

Archieven kunnen de directorystructuur behouden, beschikken over foutdetectie- en correctietools (bijvoorbeeld controlesommen), bevatten commentaar en versleutelen ook gegevens met een wachtwoord.

Er zijn archieven ontworpen in de vorm van programma's. Ze zijn zelfuitpakkend, wat betekent dat u geen compatibel archiveringsprogramma op uw computer hoeft te hebben geïnstalleerd om ze uit te pakken.

Tienduizenden internetservers zijn bestandsarchiefservers en ze slaan honderden miljoenen bestanden van verschillende typen op (programma's, apparaatstuurprogramma's, grafische bestanden en geluidsbestanden, enzovoort). De aanwezigheid van dergelijke bestandsarchiefservers is erg handig voor gebruikers, omdat veel van de benodigde bestanden rechtstreeks van internet kunnen worden "gedownload".

Bestandsservers worden door veel bedrijven ondersteund: softwareontwikkelaars en fabrikanten van computerhardwarecomponenten en randapparatuur. De software die op dergelijke servers wordt gehost, is freeware of shareware en daarom overtreedt de gebruiker door een bepaald bestand niet te "downloaden" de wet op het auteursrecht op software.

Protocollen voor bestandsoverdracht

File Transfer Protocol is een protocol dat is ontworpen om de overdracht en ontvangst van bestanden te garanderen tussen servers en clients die werken op netwerken die het TCP/IP-protocol ondersteunen. Het File Transfer Protocol ondersteunt een reeks opdrachten die bidirectionele bestandsoverdracht tussen computers implementeren.

Toegang tot bestanden op bestandsarchiefservers is mogelijk via zowel het HTTP (Hyper Text Transfer Protocol) als het speciale FTP (File Transfer Protocol) bestandsoverdrachtprotocol.

FTP (File Transfer Protocol) is een protocol voor bestandsoverdracht dat is ontworpen voor het overbrengen van bestanden via computernetwerken. Hiermee kunt u verbinding maken met FTP-servers, de inhoud ervan bekijken en bestanden downloaden van de server of omgekeerd - naar de server. FTP verscheen in 1971, lang vóór HTTP, en is een van de ‘volwassen’ netwerkprotocollen.

Begin jaren negentig was FTP verantwoordelijk voor ongeveer de helft van al het internetverkeer.

Om bestanden over te dragen, maakt het FTP-protocol gebruik van het TCP-transportprotocol (Transmission Control Protocol). In tegenstelling tot veel andere protocollen worden opdrachten en gegevens hier via verschillende poorten verzonden: poort 20 wordt gebruikt voor gegevensoverdracht, poort 21 wordt gebruikt voor opdrachtoverdracht

Als de gegevensoverdracht wordt onderbroken, biedt FTP een manier om deze te hervatten, wat handig kan zijn bij het werken met grote bestanden. FTP-servers worden gebruikt als archief van commerciële software die in een bedrijf wordt gebruikt. In dit geval heeft deze server gesloten of beperkte toegang tot de opgeslagen bronnen.

Om met FTP-archieven te werken heeft u de volgende software nodig: server, client en zoekprogramma. De server biedt overal op het netwerk toegang tot archiefbronnen, de client biedt gebruikers toegang tot elk archief op het netwerk en de zoekmachine biedt navigatie door het hele netwerk van archieven.

Als u bijvoorbeeld het bestand cute4232.exe wilt downloaden van de bestandsarchiefserver ftp.cuteftp.com van GlobalScape, moet u de URL van het bestand opgeven. Wanneer u een bestands-URL opgeeft, wordt het FTP-protocol als volgt geschreven: ftp:// .

Als gevolg hiervan heeft de Universal Resource Locator de volgende vorm:

ftp://ftp.cuteftp.com/pub/cuteftp/cute4232.exe en bestaat uit drie delen:

ftp:// - toegangsprotocol,

ftp.cuteftp.com - domeinnaam van de bestandsarchiefserver,

/pub/cuteftp/cute4232.exe - bestandspad en bestandsnaam.

Het HTTP-protocol is een hypertekstoverdrachtsprotocol dat is ontworpen voor de overdracht van hyperteksten. Hypertekst is tekst die speciale elementen bevat die, wanneer ze worden geopend, direct overgaan naar een andere tekst. Deze elementen worden hyperlinks genoemd. Momenteel is HTTP het populairste internetprotocol, omdat Biedt eenvoudige en efficiënte webnavigatie. Daarom wordt het segment van het internet dat dit protocol gebruikt het World Wide Web of kortweg WWW genoemd.

Opgemerkt moet worden dat er ook het HTTP-S-protocol (HTTP Secure) bestaat - een netwerkprotocol voor veilige overdracht van hypertekst.

De meest bekende protocollen die op internet worden gebruikt:

POP (Post Office Protocol) is een standaardprotocol voor e-mailcommunicatie. POP-servers verwerken inkomende e-mail en het POP-protocol is ontworpen om e-mailverzoeken van client-mailprogramma's af te handelen.

SMTP (Simple Mail Transfer Protocol) is een protocol dat een reeks regels voor e-mailoverdracht definieert. De SMTP-server retourneert een ontvangstbevestiging of een foutmelding, of vraagt ​​om aanvullende informatie.

TELNET is een protocol voor externe toegang. Met TELNET kan een abonnee op elke computer op internet werken alsof deze de zijne is, dat wil zeggen programma's starten, bedieningsmodi wijzigen, enzovoort. In de praktijk worden de mogelijkheden beperkt door het toegangsniveau dat is ingesteld door de beheerder van de externe machine.

Communicatiemodi

Het protocol legt grote nadruk op verschillende manieren om gegevens uit te wisselen tussen machines met verschillende architecturen. Er is inderdaad van alles op internet, van personal computers en Macs tot supercomputers. Ze hebben allemaal verschillende woordlengtes en veel verschillende volgordes van bits in een woord. Bovendien werken verschillende bestandssystemen met verschillende gegevensorganisatie, wat tot uitdrukking komt in de concept van toegangsmethode.

Over het algemeen kan de uitwisseling vanuit FTP-oogpunt in lijn of blok , met of zonder codering in tussenformaten, tekst of binair.

Bij tekst Tijdens de uitwisseling worden alle gegevens omgezet naar ASCII en in deze vorm over het netwerk verzonden. De enige uitzondering zijn IBM-mainframegegevens, die standaard naar EBCDIC worden verzonden als beide communicerende machines IBM zijn.

Binair gegevens worden verzonden als een reeks bits of ondergaan bepaalde transformaties tijdens een besturingssessie.

Bij in lijn Bij het overbrengen van gegevens wordt één gegevensbestand in één sessie overgedragen, en wanneer blok Met deze methode kunt u meerdere bestanden in één sessie overbrengen.

Nadat we het uitwisselingsprotocol in algemene termen hebben beschreven, kunnen we overgaan tot een beschrijving van de uitwisselingsmiddelen met behulp van het FTP-protocol. Er zijn zowel servers als clients voor vrijwel elk platform en elke besturingsomgeving. Het volgende beschrijft de standaardserver en client van Unix-achtige systemen.

Gespecialiseerde bestandsdownloadmanagers

Voor het gemak van gebruikers hebben veel bestandsarchiefservers (freeware.ru, www.freesoft.ru, www.download.ru, enz.) een webinterface waarmee u ermee kunt werken via browsers. Browsers zijn geïntegreerde systemen voor het werken met verschillende internetinformatiebronnen en omvatten daarom beheerders voor het downloaden van bestanden.

Het is echter handiger om met bestandsarchieven te werken met behulp van gespecialiseerde bestandsdownloadmanagers (bijvoorbeeld FlashGet, GoIZilla, ReGet, enz.), waarmee u door kunt gaan met het downloaden van een bestand nadat de verbinding met de server is verbroken. Bestandsdownloadmanagers bieden de gebruiker gedetailleerde informatie in numerieke en grafische vorm over het bestandsdownloadproces (bestandsvolume, volume van het gedownloade deel, inclusief als percentage, downloadsnelheid, verstreken en resterende downloadtijd, enz.)

In essentie is het downloaden van een bestand van internet het kopiëren van de ene computer naar de andere. Alleen de computer waarvan het bestand wordt gekopieerd, bevindt zich vrij ver van de computer die het bestand ontvangt. Over het algemeen verschilt dit kopiëren niet van elk ander kopiëren (bijvoorbeeld van een cd naar een harde schijf). Bij het downloaden van een bestand van internet zijn er slechts een paar significante verschillen: de snelheid van dergelijk kopiëren is laag en de onderbreking ervan houdt in dat het hele proces vanaf het allereerste begin wordt herhaald. Toegegeven, dit geldt alleen voor downloaden via een browser. Dit feit leidde ooit tot de opkomst van gespecialiseerde programma's: downloadmanagers.

Gespecialiseerde bestandsdownloadmanagers (GolZilla, ReGet, enz.) hebben veel grotere mogelijkheden vergeleken met bestandsdownloadmanagers die in browsers zijn geïntegreerd. Ze bieden u met name de mogelijkheid om door te gaan met het downloaden van een bestand nadat de verbinding met de server of de internetverbinding is verbroken, bieden toegang tot bestanden via zowel FTP- als HTTP-protocollen, enz.

Filezilla is een van de handigste en effectiefste bestandsdownloadmanagers en biedt:

Een in de browser geselecteerd bestand downloaden;

Zoek naar het bestand dat is geselecteerd om te downloaden met behulp van bestandsarchiefservers, enz.

FTP-clients

FTP-servers zijn servers waarmee bestanden kunnen worden uitgewisseld via het FTP-protocol. FTP-servers kunnen, afhankelijk van hun functionele doel, zowel bestandsarchiefservers zijn als webservers die websites hosten. Van bestandsarchiefservers worden bestanden gedownload (Downloaden) naar de lokale computer, en omgekeerd worden bestanden overgebracht (Uploaden) van de lokale computer naar webservers tijdens het publiceren van websites. Bestandsuitwisseling (downloaden en overbrengen) met bestandsarchiefservers en webservers wordt uitgevoerd met behulp van gespecialiseerde programma's - FTP-clients (de FTP-client is bijvoorbeeld onderdeel van de Total Commander-bestandsbeheerder).

Specifieke voorbeelden van het gebruik van een FTP-client kunnen zijn:

    het publiceren van websitepagina's op een internetserver door een webontwikkelaar;

    het downloaden van muziek, programma's en andere gegevensbestanden door een gewone internetgebruiker.

Dit voorbeeld wordt door veel gebruikers vaak niet eens herkend als het gebruik van een FTP-client en -protocol, aangezien veel openbare servers geen aanvullende gegevens vragen om gebruikers te authenticeren, en internetbrowsers (ook FTP-clients) bestanden downloaden zonder aanvullende vragen.

Toegang tot bestandsarchiefservers om bestanden naar uw lokale computer te downloaden is meestal anoniem en vereist geen gebruikersnaam en wachtwoord. Voor toegang tot webservers om bestanden over te dragen naar een externe server tijdens het publicatieproces van de website is daarentegen gebruikersauthenticatie vereist, dat wil zeggen het invoeren van een gebruikersnaam en wachtwoord.

De FTP-client bevat een Site Manager, waarmee u een lijst kunt maken met servers waarmee u wilt gaan werken. Presenteert de mappen van lokale en externe computers in een gebruiksvriendelijke vorm, zorgt ervoor dat het bestand blijft downloaden nadat de verbinding is verbroken, enz. Tijdens het bestandsoverdrachtproces wordt de nodige informatie weergegeven: het percentage van het overgedragen bestandsvolume, overdrachtsnelheid, resterende tijd, etc.

Offline browsers

Sommige browsers ondersteunen, naast de online modus, wanneer de browser pagina's van een webserver probeert op te halen, de offline modus, waarin u opgeslagen kopieën van eerder bezochte pagina's kunt bekijken. De offlinemodus is handig als er om de een of andere reden geen internetverbinding is. Pagina's worden impliciet opgeslagen in de cache van de browser wanneer een webserver wordt bezocht, of de browser is specifiek geconfigureerd om lokale kopieën van bepaalde sites op te slaan en te onderhouden. Kopieën worden bijgewerkt wanneer de verbinding wordt hersteld of volgens een schema. Een voorbeeld van een veelgebruikte browser die deze functionaliteit ondersteunt is Internet Explorer. Er zijn browsers die speciaal zijn ontworpen om voornamelijk in de offlinemodus te werken, waarbij lokale kopieën van webpagina's en sites worden gemaakt. Ze worden offline browsers genoemd.

Alle moderne offline browsers ondersteunen uiteraard multi-threaded downloaden en hervatten na een verbindingsverlies en kunnen zichzelf vermommen als internetbrowser (dit is nodig bij het downloaden van informatie van sites waar de toegang tot offline browsers is geblokkeerd). Daarom zorgt elk van de overwogen oplossingen voor het snel en betrouwbaar downloaden van websites met een eenvoudige structuur. Bij HTTPS-sites is dat lastiger, omdat niet alle programma’s het HTTPS-protocol ondersteunen. Hetzelfde geldt voor sites waarvoor inloggen vereist is: de meeste offline browsers bieden ondersteuning voor inloggen op basisniveau, terwijl sites complexere authenticatieschema's kunnen implementeren (zoals op formulieren gebaseerde authenticatie).

Een andere nuance is het niveau van programmaondersteuning voor moderne webtechnologieën, dat aanzienlijk varieert in verschillende offline browsers. In de praktijk betekent dit dat sites met een eenvoudige structuur zonder problemen met welke oplossing dan ook kunnen worden gedownload.



Bibliografie

    Informatica en ICT. Basisniveau: leerboek voor graad 10 / N.D. Ugrinovich - 7e ed. Kennislaboratorium, 2011.-212 p. : ziek.

    Wikipedia – geconsolideerde encyclopedie [Elektronische hulpbron] // http://ru.wikipedia.org.

    Schoolboeken - online encyclopedie. Toegangsmodus: http://txtbooks.ru., gratis. - Kap. vanaf het scherm.

    PPt4Web - presentatiehosting. Toegangsmodus: http://ppt4web.ru/, gratis. - Kap. vanaf het scherm.

    Wiki-leerboek ter voorbereiding op het Unified State Exam - online encyclopedie. Toegangsmodus: http://indexletopisi.org., gratis. - Kap. vanaf het scherm.

    Netwerkinformatietechnologieën - hosting van presentaties. Toegangsmodus: http://5klass.net, gratis. - Kap. vanaf het scherm.

Bestandsarchiefservers. Honderdduizenden internetservers zijn bestandsarchiefservers, waarop honderden miljoenen bestanden worden opgeslagen. Bestandsservers worden ondersteund door veel softwarebedrijven en fabrikanten van computerhardwarecomponenten en randapparatuur. De software die op dergelijke servers wordt gehost, wordt vrijelijk verspreid (freeware) of shareware, en daarom overtreedt de gebruiker door het downloaden van een bepaald bestand de wet op het auteursrecht op software niet.

Onlangs zijn muziekarchiefservers die albums en muziekcomposities van populaire artiesten in MP3-formaat opslaan wijdverbreid geworden.

Protocollen voor bestandsoverdracht. Toegang tot bestanden op bestandsarchiefservers is zowel via HTTP als via het speciale FTP-bestandsoverdrachtprotocol (File Transfer Protocol) mogelijk. Met het FTP-protocol kunt u niet alleen bestanden downloaden (Downloaden) van externe bestandsarchiefservers naar een lokale computer, maar omgekeerd ook bestanden overbrengen (Uploaden) van bijvoorbeeld een lokale computer naar een externe webserver. van het publiceren van een website.

Als u bijvoorbeeld het bestand file.exe, opgeslagen in de map pub, wilt downloaden van de bestandsarchiefserver ftp.server.com, moet u de URL van dit bestand opgeven. Wanneer u een bestands-URL opgeeft, wordt het FTP-protocol als volgt geschreven: ftp://.

Als resultaat hiervan heeft de Universal Resource Locator de vorm: ftp://ftp.server.com/pub/file.exe en bestaat uit drie delen:

ftp:// - toegangsprotocol;

ftp.server.com - domeinnaam van de bestandsarchiefserver;

/pub/file.exe - bestandspad en bestandsnaam.

Bestanden uploaden via een browser. Voor het gemak van gebruikers hebben veel bestandsarchiefservers (freeware.ru, www.freesoft.ru, enz.) een webinterface waarmee u ermee kunt werken via browsers.

Browsers zijn geïntegreerde systemen voor het werken met verschillende internetinformatiebronnen en bevatten daarom bestandsdownloadmanagers.

Nadat u de link naar het bestand hebt geactiveerd in het geopende venster, moet u de map op de lokale computer opgeven waarin het bestand moet worden opgeslagen. Het downloaden van het bestand begint, waarvan het proces wordt weergegeven op het informatiepaneel (overdrachtssnelheid, grootte van het gedownloade bestand en het resterende deel van het bestand, enz.).

Gespecialiseerde bestandsdownloadmanagers. Het is echter handiger om gespecialiseerde bestandsdownloadmanagers (bijvoorbeeld ctmeuiGet) te gebruiken om met bestandsarchieven te werken. Met dergelijke managers kunt u de downloadsnelheid verhogen door bestanden in delen op te splitsen en alle delen tegelijkertijd te downloaden. Bovendien bieden ze u de mogelijkheid om door te gaan met het downloaden van een bestand nadat de verbinding met de server is verbroken, bevatten ze een tool waarmee u naar een bestand kunt zoeken op andere bestandsarchiefservers, kunt u bestanden archiveren terwijl ze worden gedownload, enz.

De gebruiker krijgt gedetailleerde informatie in numerieke en grafische vorm over het proces van het downloaden van een bestand (huidige en gemiddelde downloadsnelheid, voltooiingspercentage van de download, geschatte downloadtijd, enz.).

Gespecialiseerde bestandsdownloadmanagers zijn geïntegreerd in browsers en wanneer u een link naar een bestand in het browservenster activeert, beginnen ze met het downloaden ervan met behulp van de downloadmanager.

FTP-clients. FTP-servers zijn servers waarmee bestanden kunnen worden uitgewisseld via het FTP-protocol. FTP-servers kunnen, afhankelijk van hun functionele doel, zowel bestandsarchiefservers zijn als webservers die websites hosten. Van bestandsarchiefservers worden bestanden gedownload (Downloaden) naar de lokale computer; integendeel, bestanden worden overgedragen (Uploaden) van de lokale computer naar webservers tijdens het publiceren van websites. Bestandsuitwisseling (downloaden en overbrengen) met bestandsarchiefservers en webservers wordt uitgevoerd met behulp van gespecialiseerde programma's - FTP-clients (de FTP-client maakt bijvoorbeeld deel uit van de Total Commander-bestandsbeheerder).

Toegang tot bestandsarchiefservers om bestanden naar uw lokale computer te downloaden is meestal anoniem en vereist geen gebruikersnaam en wachtwoord. Aan de andere kant vereist toegang tot webservers met als doel het overbrengen van bestanden naar een externe server tijdens het publiceren van een website gebruikersidentificatie, d.w.z. uw gebruikersnaam en wachtwoord invoeren.

FTP-client omvat Locatiemanager, zodat u een lijst kunt maken met servers waarmee u van plan bent te werken. Presenteert de mappen van de lokale en externe computer in een gebruiksvriendelijke vorm, zorgt ervoor dat het bestand blijft downloaden nadat de verbinding is verbroken, enz. Tijdens het bestandsoverdrachtproces wordt de benodigde informatie weergegeven: het percentage van het overgedragen bestandsvolume , de overdrachtsnelheid, de resterende tijd, enz.

Offline browsers. Om websites snel te laden voor verder ontspannen kijken in de offline modus, worden speciale programma's gebruikt: offline browsers.

Met offline browsers (bijvoorbeeld Offline Explorer) kunt u volledige websites of afzonderlijke delen van een site naar uw lokale computer downloaden. De gebruiker kan de vereiste “diepte” instellen voor het laden van een website (het aantal submappen), het downloaden van multimediabestanden die aan pagina’s zijn gekoppeld, het downloaden van webpagina’s van andere webservers via hyperlinks, enz. Het is mogelijk om door te gaan met het laden van een site nadat de verbinding is verbroken en eerder gedownloade sites bij te werken.

Programmaopslagplaatsen voor het Linux-besturingssysteem. In het Linux-besturingssysteem worden de componenten van het systeem zelf en de applicatie opgeslagen in de vorm van “pakketten” (rpm-extensie), die elke gebruiker kan downloaden en installeren in zijn eigen versie van het systeem. Kortom, elke gebruiker bouwt zijn eigen Linux-besturingssysteem en zijn applicaties op basis van zijn behoeften en voorkeuren, met behulp van een reeks pakketten in repositories.

Controle vragen

  • 1. Welke bestanden worden doorgaans opgeslagen op bestandsarchiefservers?
  • 2. Uit welke delen bestaat het adres van een bestand op een bestandsarchiefserver?
  • 3. Wat is het voordeel van het downloaden van bestanden met behulp van gespecialiseerde downloadmanagers ten opzichte van het downloaden van bestanden met browsers?
  • 4. Vergelijk downloadmanagers en FTP-clients. Wat is hun verschil?
  • 5. In welke gevallen is het raadzaam om offline browsers te gebruiken?

Taken voor onafhankelijke voltooiing

8.3. Korte antwoordtaak. Noteer het adres van het programma.exe-bestand dat is opgeslagen op een computer die is geregistreerd in het eerste niveau domein RU, tweede niveau domein scholen en die een eigen FTP-naam heeft.