Lezing "analoge en discrete methoden voor het weergeven van beeld en geluid." Wat is een discreet beeld? en wat is hardwareresolutie

Beeldbemonstering.

Beschouw een continu beeld - een functie van twee ruimtelijke variabelen X 1 en X 2 F(X 1 , X 2) op een beperkt rechthoekig gebied (Figuur 3.1).

Figuur 3.1 – Overgang van continu naar discreet beeld

Laten we het concept van bemonsteringsstap Δ 1 introduceren met betrekking tot de ruimtelijke variabele X 1 en Δ 2 per variabele X 2. Je kunt je dat bijvoorbeeld op punten voorstellen verre vriend van elkaar op een afstand Δ 1 langs de as X 1 Er zijn puntvideosensoren. Als dergelijke videosensoren over het gehele rechthoekige gebied worden geïnstalleerd, wordt het beeld gedefinieerd op een tweedimensionaal rooster

Om de notatie in te korten, duiden we aan

Functie F(N 1 , N 2) is een functie van twee discrete variabelen en wordt een tweedimensionale reeks genoemd. Dat wil zeggen dat het bemonsteren van een afbeelding op basis van ruimtelijke variabelen deze vertaalt in een tabel met monsterwaarden. De afmeting van de tabel (aantal rijen en kolommen) wordt bepaald door de geometrische afmetingen van het oorspronkelijke rechthoekige gebied en de keuze van de bemonsteringsstap volgens de formule

Waar vierkante haakjes[…] staan voor het gehele deel van een getal.

Als het definitiedomein van een doorlopend beeld een vierkant is L 1 = L 2 = L, en de bemonsteringsstap wordt zo gekozen dat deze langs de assen hetzelfde is X 1 en X 2 (Δ 1 = Δ 2 = Δ), dus

en de tafelafmeting is N 2 .

Een element van de tabel dat wordt verkregen door een afbeelding te bemonsteren, wordt ' pixel" of " aftellen". Denk eens aan een pixel F(N 1 , N 2). Dit getal neemt continue waarden aan. Computergeheugen kan alleen discrete getallen opslaan. Daarom moet een continue waarde in het geheugen worden vastgelegd F onderworpen moet worden analoog-naar-digitaal conversie met stap D F(zie figuur 3.2).

Figuur 3.2 – Continue kwantisering van hoeveelheden

Operatie analoog-naar-digitaal conversie(discretisatie van een continue hoeveelheid per niveau) wordt vaak genoemd kwantisering. Het aantal kwantiseringsniveaus, op voorwaarde dat de waarden van de helderheidsfunctie in het interval _____ _ ____ ___ liggen, is gelijk aan

Bij praktische beeldverwerkingsproblemen is de hoeveelheid Q varieert sterk van Q= 2 (“binaire” of “zwart-wit” afbeeldingen) tot Q= 210 of meer (bijna continue helderheidswaarden). Meest frequent geselecteerd Q= 28, waarbij een beeldpixel wordt gecodeerd met één byte aan digitale gegevens. Uit al het bovenstaande concluderen we dat de pixels die in het geheugen van de computer zijn opgeslagen het resultaat zijn van het bemonsteren van het originele continue beeld op basis van argumenten (coördinaten?) en niveaus. (Waar en hoeveel, en alles is discreet) Het is duidelijk dat de bemonsteringsstappen Δ 1 , A2 moet klein genoeg worden gekozen zodat de bemonsteringsfout verwaarloosbaar is en de digitale representatie essentiële beeldinformatie behoudt.

Er moet echter aan worden herinnerd dat kleinere stap bemonstering en kwantisering, hoe meer beeldgegevens er in het geheugen van de computer moeten worden vastgelegd. Beschouw ter illustratie van deze uitspraak een afbeelding op een dia van 50x50 mm, die met behulp van een digitale meter in het geheugen wordt ingevoerd optische dichtheid(microdensitometer). Als bij het invoeren de lineaire resolutie van de microdensitometer (bemonsteringsstap voor ruimtelijke variabelen) 100 micron bedraagt, dan is de tweedimensionale array pixelafmeting N 2 = 500×500 = 25∙10 4. Als de stap wordt teruggebracht tot 25 micron, zullen de afmetingen van de array zestien keer toenemen en oplopen tot N 2 = 2000×2000 = 4∙10 6. Door kwantisering op 256 niveaus te gebruiken, dat wil zeggen door de gevonden pixel voor byte te coderen, ontdekken we dat in het eerste geval 0,25 megabyte geheugen nodig is voor opname, en in het tweede geval 4 megabytes.

Een persoon kan informatie waarnemen en opslaan in de vorm van beelden (visueel, geluid, tactiel, smaak en reuk). Visuele beelden kunnen worden opgeslagen in de vorm van afbeeldingen (tekeningen, foto's, enz.), en geluidsbeelden kunnen worden opgenomen op platen, magneetbanden, laserschijven enzovoort.

Informatie, inclusief afbeeldingen en audio, kan in analoge of discrete vorm worden gepresenteerd. Bij analoge weergave neemt een fysieke grootheid een oneindig aantal waarden aan, en de waarden veranderen voortdurend. Bij een discrete representatie neemt een fysieke grootheid een eindige reeks waarden aan, en verandert de waarde ervan abrupt.

Een voorbeeld van een analoge weergave van grafische informatie is bijvoorbeeld een schilderij waarvan de kleur voortdurend verandert, en een discrete weergave is een afbeelding die is afgedrukt met een inkjetprinter en bestaat uit afzonderlijke stippen verschillende kleuren. Voorbeeld van analoge opslag audio-informatie is vinylplaat(het audiospoor verandert voortdurend van vorm) en discreet – een audio-compact disc (waarvan het audiospoor gebieden met verschillende reflectiviteit bevat).

De conversie van grafische en audio-informatie van analoge naar discrete vorm wordt uitgevoerd door middel van sampling, dat wil zeggen door een continu grafisch beeld en een continu (analoog) audiosignaal te verdelen in individuele elementen. Het bemonsteringsproces omvat codering, dat wil zeggen het toekennen van een specifieke waarde aan elk element in de vorm van een code.

Bemonstering is de transformatie van continue beelden en geluid naar een reeks discrete waarden in de vorm van codes.

Beeldcodering

Creëer en bewaar grafische objecten op een computer zijn er twee manieren: hoe rooster of hoe vector afbeelding. Elk type afbeelding gebruikt zijn eigen coderingsmethode.

Bitmap-codering

Een rasterafbeelding is een verzameling punten (pixels) van verschillende kleuren. Een pixel is het kleinste gebied van een afbeelding waarvan de kleur onafhankelijk kan worden ingesteld.

Tijdens het coderingsproces wordt een afbeelding ruimtelijk gediscretiseerd. Ruimtelijke bemonstering van een afbeelding kan worden vergeleken met het construeren van een afbeelding uit een mozaïek (een groot aantal kleine, veelkleurige brilletjes). De afbeelding wordt opgedeeld in afzonderlijke kleine fragmenten (punten) en aan elk fragment wordt een kleurwaarde toegewezen, dat wil zeggen een kleurcode (rood, groen, blauw, enzovoort).

Voor een zwart-witafbeelding is het informatievolume van één punt gelijk aan één bit (zwart of wit - 1 of 0).

Voor vier kleuren – 2 bits.

Voor 8 kleuren heb je 3 bits nodig.

Voor 16 kleuren – 4 bits.

Voor 256 kleuren – 8 bits (1 byte).

De beeldkwaliteit is afhankelijk van het aantal dots (dan kleiner formaat punten en dus hoe groter hun aantal, hoe beter de kwaliteit) en het aantal gebruikte kleuren (hoe meer kleuren, hoe beter de afbeelding is gecodeerd).

Om kleur als numerieke code weer te geven, worden twee inverse kleurmodellen gebruikt: RGB of CMYK. Het RGB-model wordt gebruikt in tv's, monitoren, projectoren, scanners, digitale camera's... De hoofdkleuren in dit model zijn: rood (rood), groen (groen), blauw (blauw). Het CMYK-kleurmodel wordt gebruikt bij het afdrukken bij het maken van afbeeldingen die bedoeld zijn om op papier te worden afgedrukt.

Kleurenafbeeldingen kunnen verschillende kleurdiepten hebben, die worden bepaald door het aantal bits dat wordt gebruikt om de kleur van een punt te coderen.

Als we de kleur van één pixel in een afbeelding coderen met drie bits (één bit voor elke RGB-kleur), krijgen we alle acht verschillende kleuren.

			Kleur


			Paars

Om informatie over de kleur van elk punt van een kleurenbeeld in het RGB-model op te slaan, worden in de praktijk gewoonlijk 3 bytes (dat wil zeggen 24 bits) toegewezen - 1 byte (dat wil zeggen 8 bits) voor de kleurwaarde van elke component . Elke RGB-component kan dus een waarde aannemen in het bereik van 0 tot 255 (2 8 = 256 waarden in totaal), en elk beeldpunt kan met een dergelijk coderingssysteem worden gekleurd in een van de 16.777.216 kleuren. Deze reeks kleuren wordt gewoonlijk True Color genoemd, omdat het menselijk oog nog steeds geen grotere verscheidenheid kan onderscheiden.

Om een beeld op het beeldscherm te kunnen vormen, moet informatie over elke stip (kleurcode van de stip) worden opgeslagen in het videogeheugen van de computer. Laten we de benodigde hoeveelheid videogeheugen voor een van berekenen grafische modi. Op moderne computers is de schermresolutie meestal 1280 x 1024 pixels. Die. totaal 1280 * 1024 = 1310720 punten. Bij een kleurdiepte van 32 bits per pixel bedraagt de benodigde hoeveelheid videogeheugen: 32 * 1310720 = 41943040 bits = 5242880 bytes = 5120 KB = 5 MB.

Rasterafbeeldingen zijn zeer gevoelig voor schaling (vergroting of verkleining). Bij het verkleinen van een rasterafbeelding worden meerdere aangrenzende punten omgezet in één, waardoor de zichtbaarheid verloren gaat kleine onderdelen afbeeldingen. Wanneer u de afbeelding vergroot, wordt de grootte van elke stip groter en verschijnt er een stapeffect dat met het blote oog zichtbaar is.

U kunt een doorlopend beeld vervangen door een afzonderlijk beeld op verschillende manieren. U kunt bijvoorbeeld elk systeem van orthogonale functies kiezen en, nadat u de coëfficiënten van beeldrepresentatie met dit systeem (op basis van deze basis) hebt berekend, de afbeelding ermee vervangen. De verscheidenheid aan ondergronden maakt het mogelijk om verschillende discrete representaties van een doorlopend beeld te vormen. De meest gebruikte methode is echter periodieke bemonstering, in het bijzonder, zoals hierboven vermeld, bemonstering met een rechthoekig raster. Deze discretisatiemethode kan worden beschouwd als een van de opties voor het gebruik van een orthogonale basis die verschoven functies als elementen gebruikt. Vervolgens zullen we, voornamelijk als volgt, in detail de belangrijkste kenmerken van rechthoekige bemonstering bekijken.

Laat het een continu beeld zijn, en laat het de overeenkomstige discrete zijn, verkregen uit het continue beeld door rechthoekige bemonstering. Dit betekent dat de relatie tussen hen wordt bepaald door de uitdrukking:

waar zijn respectievelijk de verticale en horizontale stappen of bemonsteringsintervallen. Fig. 1.1 illustreert de locatie van monsters op het vlak met rechthoekige bemonstering.

De belangrijkste vraag die zich voordoet bij het vervangen van een continu beeld door een discreet beeld is het bepalen van de omstandigheden waaronder een dergelijke vervanging voltooid is, d.w.z. gaat niet gepaard met een verlies van informatie in het continue signaal. Er zijn geen verliezen als je hebt discreet signaal, kunt u continu herstellen. Vanuit wiskundig oogpunt is het dus de vraag om te reconstrueren continu signaal in tweedimensionale ruimtes tussen knooppunten waarvan de waarden bekend zijn, of, met andere woorden, in de implementatie van tweedimensionale interpolatie. Deze vraag kan worden beantwoord door de spectrale eigenschappen van continue en discrete beelden te analyseren.

Het tweedimensionale continue frequentiespectrum van een continu signaal wordt bepaald door een tweedimensionale directe Fourier-transformatie:

wat overeenkomt met de tweedimensionale inverse voortdurende transformatie Fourier:

De laatste relatie geldt voor alle waarden, ook voor de knooppunten van een rechthoekig rooster . Daarom kan voor de signaalwaarden op de knooppunten, rekening houdend met (1.1), relatie (1.3) worden geschreven als:

Laten we kortheidshalve dit aanduiden met een rechthoekige doorsnede in het tweedimensionale frequentiedomein. De berekening van de integraal in (1.4) over het gehele frequentiedomein kan worden vervangen door integratie over individuele gebieden en de resultaten samenvattend:

Door variabelen volgens de regel te vervangen, bereiken we onafhankelijkheid van het integratiedomein van de cijfers en:

Hier wordt rekening mee gehouden voor alle gehele waarden en . Deze uitdrukking komt qua vorm zeer dicht bij de inverse Fourier-transformatie. Het enige verschil is de onjuiste vorm van de exponentiële factor. Om het te geven vereiste soort Laten we genormaliseerde frequenties introduceren en in overeenstemming hiermee de variabelen wijzigen. Als resultaat krijgen we:

Nu heeft uitdrukking (1.5) de vorm van een inverse Fourier-transformatie, dus de functie onder het integraalteken is

(1.6)

is een tweedimensionaal spectrum van een discreet beeld. Op het vlak van niet-gestandaardiseerde frequenties heeft uitdrukking (1.6) de vorm:

(1.7)

Uit (1.7) volgt dat het tweedimensionale spectrum van een discreet beeld rechthoekig periodiek is met perioden en respectievelijk langs de frequentie-assen en. Het spectrum van een discreet beeld wordt gevormd als resultaat van de optelling van een oneindig aantal spectra van een continu beeld, die van elkaar verschillen in frequentieverschuivingen en . Figuur 1.2 toont kwalitatief de relatie tussen de tweedimensionale spectra van continue (Fig. 1.2.a) en discrete (Fig. 1.2.b) beelden.



Rijst. 1.2. Frequentiespectra van continue en discrete beelden

Het sommatieresultaat zelf hangt in belangrijke mate af van de waarden van deze frequentieverschuivingen, of, met andere woorden, van de keuze van de bemonsteringsintervallen. Laten we aannemen dat het spectrum van een continu beeld niet nul is in een tweedimensionaal gebied in de buurt van de frequentie nul, dat wil zeggen dat het wordt beschreven door een tweedimensionale eindige functie. Als de bemonsteringsintervallen zo worden gekozen voor , dan zal de overlap van individuele takken bij het vormen van de som (1,7) niet optreden. Binnen elke rechthoekige sectie zal dus slechts één term van nul verschillen. In het bijzonder wanneer we:

bij , . (1,8)

Binnen het frequentiedomein vallen de spectra van continue en discrete beelden dus samen tot een constante factor. In dit geval bevat het spectrum van het discrete beeld dit frequentiegebied volledige informatie over het spectrum van een continu beeld. We benadrukken dat dit toeval alleen plaatsvindt onder gespecificeerde omstandigheden, bepaald door een succesvolle keuze van bemonsteringsintervallen. Merk op dat de vervulling van deze voorwaarden, volgens (1.8), wordt bereikt bij voldoende kleine waarden van bemonsteringsintervallen, die aan de vereisten moeten voldoen:

waarin de grensfrequenties van het tweedimensionale spectrum liggen.

Relatie (1.8) bepaalt de methode voor het verkrijgen van een continu beeld uit een discreet beeld. Om dit te doen, volstaat het om een tweedimensionale filtering van een discreet beeld uit te voeren met behulp van een laagdoorlaatfilter frequentierespons

Het spectrum van het beeld aan de uitgang bevat alleen componenten die niet nul zijn in het frequentiedomein en is volgens (1.8) gelijk aan het spectrum van een continu beeld. Dit betekent dat het uitvoerbeeld een ideaal filter is lage frequenties valt samen met.

De ideale interpolatiereconstructie van een continu beeld wordt dus uitgevoerd met behulp van een tweedimensionaal filter met een rechthoekige frequentierespons (1.10). Het is niet moeilijk om expliciet een algoritme op te schrijven voor het reconstrueren van een doorlopend beeld. De tweedimensionale impulsresponsie van het reconstructiefilter, die eenvoudig kan worden verkregen met behulp van de inverse Fourier-transformatie uit (1.10), heeft de vorm:

Het filterproduct kan worden bepaald met behulp van een tweedimensionale convolutie van het invoerbeeld en een gegeven impulsresponsie. Het invoerbeeld weergeven als een tweedimensionale reeks -functies

na het uitvoeren van de convolutie vinden we:

De resulterende relatie geeft een werkwijze aan voor nauwkeurige interpolatiereconstructie van een continu beeld uit een bekende reeks van zijn tweedimensionale monsters. Volgens deze uitdrukking moeten voor nauwkeurige restauratie interpolatiefuncties worden gebruikt tweedimensionale functies vriendelijk . Relatie (1.11) is een tweedimensionale versie van de stelling van Kotelnikov-Nyquist.

Laten we nogmaals benadrukken dat deze resultaten geldig zijn als het tweedimensionale spectrum van het signaal eindig is en de bemonsteringsintervallen voldoende klein zijn. De eerlijkheid van de getrokken conclusies wordt geschonden als aan ten minste één van deze voorwaarden niet wordt voldaan. Echte beelden hebben zelden spectra met uitgesproken afsnijfrequenties. Een van de redenen die tot het onbeperkte spectrum leiden, is de beperkte beeldgrootte. Hierdoor verschijnt bij het optellen van (1.7) de actie van termen uit aangrenzende spectrale zones in elk van de zones. In dit geval wordt een nauwkeurige restauratie van een continu beeld volkomen onmogelijk. Met name het gebruik van een filter met een rechthoekige frequentierespons leidt niet tot nauwkeurige reconstructie.

Een kenmerk van optimaal beeldherstel in de intervallen tussen monsters is het gebruik van alle monsters van een afzonderlijk beeld, zoals voorgeschreven door procedure (1.11). Dit is niet altijd handig; het is vaak nodig om een signaal in een lokaal gebied te reconstrueren, op basis van een klein aantal beschikbare discrete waarden. In deze gevallen is het raadzaam om quasi-optimaal herstel te gebruiken met behulp van verschillende interpolatiefuncties. Dit soort problemen doet zich bijvoorbeeld voor bij het oplossen van het probleem van het koppelen van twee afbeeldingen, wanneer, als gevolg van de geometrische ontstemming van deze afbeeldingen, de beschikbare monsters van een van hen kunnen overeenkomen met enkele punten die zich in de ruimtes tussen de knooppunten van de beelden bevinden. ander. De oplossing voor dit probleem wordt in de volgende secties van deze handleiding gedetailleerder besproken.





Rijst. 1.3. De invloed van het bemonsteringsinterval op beeldreconstructie "Vingerafdruk"

Rijst. Figuur 1.3 illustreert het effect van bemonsteringsintervallen op beeldherstel. Het originele beeld, dat een vingerafdruk is, wordt getoond in Fig. 1.3, a, en een van de secties van het genormaliseerde spectrum staat in Fig. 1.3, b. Dit beeld is discreet en de waarde wordt gebruikt als de afsnijfrequentie. Zoals volgt uit afb. 1.3, b is de waarde van het spectrum bij deze frequentie verwaarloosbaar, wat een hoogwaardige reconstructie garandeert. In feite, waargenomen in Fig. 1.3.a De afbeelding is het resultaat van het herstellen van een continu beeld, en de rol van een herstelfilter wordt vervuld door een visualisatieapparaat - een monitor of printer. In die zin is het beeld in Fig. 1.3.a kan als continu worden beschouwd.

Rijst. 1.3, c, d laten de gevolgen zien van een onjuiste keuze van bemonsteringsintervallen. Bij het verkrijgen ervan werd het "continue" beeld "bemonsterd" in figuur 1. 1.3.a door het aantal uit te dunnen. Rijst. 1.3,c komt overeen met een toename van de bemonsteringsstap voor elke coördinaat met drie, en Fig. 1,3, g - vier keer. Dit zou acceptabel zijn als de waarden van de afsnijfrequenties hetzelfde aantal keren lager zouden zijn. In feite, zoals blijkt uit Fig. 1.3, b, er is sprake van een overtreding van eisen (1.9), vooral ernstig wanneer de monsters vier keer worden uitgedund. Daarom zijn de afbeeldingen die zijn hersteld met behulp van algoritme (1.11) niet alleen onscherp, maar vervormen ze ook de textuur van de afdruk aanzienlijk.





Rijst. 1.4. De invloed van het bemonsteringsinterval op de reconstructie van het “Portret”-beeld

In afb. 1.4 toont een vergelijkbare reeks resultaten verkregen voor een afbeelding van het type “portret”. De gevolgen van een sterkere uitdunning (vier keer in figuur 1.4.c en zes keer in figuur 1.4.d) komen vooral tot uiting in verlies van helderheid. Subjectief gezien lijkt het kwaliteitsverlies minder groot dan in Fig. 1.3. Dit wordt verklaard door de aanzienlijk kleinere spectrale breedte dan die van een vingerafdrukbeeld. De bemonstering van het originele beeld komt overeen met de afsnijfrequentie. Zoals blijkt uit Fig. 1.4.b is deze waarde veel hoger dan de werkelijke waarde. Daarom is de toename van het bemonsteringsinterval, geïllustreerd in Fig. 1.3, c, d leidt, hoewel het het beeld verslechtert, nog steeds niet tot zulke destructieve gevolgen als in het vorige voorbeeld.

In het vorige hoofdstuk bestudeerden we lineaire ruimtelijk invariante systemen in een continu tweedimensionaal domein. In de praktijk hebben we te maken met beelden die dat wel hebben beperkte maten en worden tegelijkertijd gemeten in een discrete reeks punten. Daarom moeten de tot nu toe ontwikkelde methoden worden aangepast, uitgebreid en aangepast, zodat ze op een dergelijk gebied kunnen worden toegepast. Er komen ook een aantal nieuwe punten naar voren die een zorgvuldige afweging vereisen.

De bemonsteringsstelling vertelt ons onder welke omstandigheden een continu beeld nauwkeurig kan worden gereconstrueerd op basis van een discrete reeks waarden. We zullen ook leren wat er gebeurt als niet aan de voorwaarden voor toepassing ervan wordt voldaan. Dit alles heeft directe invloed op de ontwikkeling van visuele systemen.

Methoden die een overstap naar het frequentiedomein vereisen, zijn gedeeltelijk populair geworden dankzij snelle rekenalgoritmen discrete transformatie Fourier. Er moet echter voorzichtigheid worden betracht, aangezien deze methoden de aanwezigheid vereisen van periodiek signaal. Wij bespreken hoe aan deze eis kan worden voldaan en wat de gevolgen zijn van het overtreden ervan.

7.1. Limiet afbeeldingsgrootte

In de praktijk hebben afbeeldingen altijd eindige afmetingen. Beschouw een rechthoekig beeld met breedte en hoogte H. Het is nu niet nodig om integralen in de Fourier-transformatie over oneindige grenzen te nemen:

Het is interessant dat we niet alle frequenties hoeven te kennen om de functie te herstellen. Wetende dat dit een harde beperking betekent. Met andere woorden: een functie die slechts in een beperkt gebied van het beeldvlak niet nul is, bevat veel minder informatie dan een functie die deze eigenschap niet heeft.

Om dit te zien, stelt u zich voor dat het schermvlak bedekt is met kopieën gegeven beeld. Met andere woorden, we breiden ons beeld uit tot een functie die periodiek is in beide richtingen

Hier is het grootste gehele getal dat x niet overschrijdt. De Fourier-transformatie van zo'n vermenigvuldigd beeld heeft de vorm

Door te gebruiken op een passende manier geselecteerde convergentiefactoren in Ex. 7.1 Het is bewezen dat

Vandaar,

van waaruit we zien dat het overal gelijk is aan nul, behalve voor een discrete reeks frequenties. Om het te vinden, is het dus voldoende dat we het op deze punten weten. De functie wordt echter verkregen door simpelweg het gedeelte af te snijden waarvoor . Om het te herstellen, is het daarom voldoende dat we alleen voor iedereen weten. Dit is een telbare reeks getallen.

Merk op dat de transformatie van een periodieke functie discreet blijkt te zijn. De inverse transformatie kan immers als een reeks worden weergegeven

Thema 9. Digitale representatie van beelden (2 uur).
Veel takken van technologie die verband houden met het ontvangen, verwerken, opslaan en verzenden van informatie zijn momenteel grotendeels gericht op de ontwikkeling van systemen waarin informatie de vorm heeft van afbeeldingen. Een beeld, dat kan worden beschouwd als een tweedimensionaal signaal, is een veel ruimere informatiedrager dan een conventioneel eendimensionaal (temporeel) signaal. Tegelijkertijd vereist het oplossen van wetenschappelijke en technische problemen bij het werken met visuele gegevens bijzondere inspanning, vertrouwend op kennis van specifieke methoden, aangezien de traditionele ideologie van eendimensionale signalen en systemen in deze gevallen van weinig nut is. Dit komt vooral tot uiting in de creatie van nieuwe soorten informatiesystemen die problemen oplossen die nog niet zijn opgelost in wetenschap en technologie, en die nu worden opgelost door het gebruik van visuele informatie.

In dit opzicht verschijnen er disciplines gericht op het bestuderen van de principes van beeldverwerking in universitaire programma's, waar prioriteit aan wordt gegeven digitale methoden, aantrekkelijk vanwege zijn flexibiliteit. Het gebrek aan educatieve literatuur is een groot obstakel deze studie, wat de auteurs ertoe aanzette de handleiding te schrijven. Opgemerkt moet worden dat de beperkte ruimte ons niet in staat stelde veel te bestrijken belangrijke aspecten problemen met digitale beeldverwerking. De auteurs van de handleiding, die bij BSUIR een cursus digitale beeldverwerking gaven, gingen uit van hun ideeën over het belang van bepaalde secties en vertrouwden ook op jarenlange onderzoeks- en onderwijservaring.

^ 9.1. Afbeeldingstypen

Een digitaal beeld is een rechthoekige tabel met punten, of beeldelementen, die zich in een ruimte bevinden T lijnen en N kolommen. Uitdrukking T X N genaamd oplossing afbeeldingen (hoewel deze term soms wordt gebruikt om te verwijzen naar het aantal pixels per lengte-eenheid van de afbeelding). De beeldpunten worden genoemd pixels(behalve wanneer het beeld per fax of video wordt verzonden; in deze gevallen wordt het punt gebeld zingen). Voor het comprimeren van grafische afbeeldingen is het handig om de volgende typen afbeeldingen te onderscheiden:

1. Twee niveaus(of monochromatisch) beeld. In dit geval kunnen alle pixels slechts twee waarden hebben, die gewoonlijk zwart (binaire één of de hoofdkleur) en wit (binaire nul of achtergrondkleur) worden genoemd. Elke pixel in zo'n afbeelding wordt weergegeven door één bit, dus het is het eenvoudigste type afbeelding.

2. Halftoon afbeelding. Elke pixel van zo’n afbeelding kan waarden hebben van 0 tot
, ter aanduiding van een van 2 N gradaties van grijze (of andere) kleur. Nummer N meestal vergelijkbaar met de grootte van een byte, dat wil zeggen, het is 4, 8, 12, 16, 24 of een ander veelvoud van 4 of 8. De reeks meest significante bits van alle pixels vormt het meest significante bitvlak of -laag van het beeld. Er bestaat dus een halftoonafbeelding met een schaal van niveaus N beetje lagen.

3. ^ Kleurenafbeelding. Er zijn verschillende methoden om de kleur in te stellen, maar bij elk ervan zijn drie parameters betrokken. Daarom bestaat een kleurenpixel uit drie delen. Normaal gesproken bestaat een kleurenpixel uit drie bytes. Typisch kleur modellen zijn RGB, HLS en CMYK.

4. Afbeelding van op een aanhoudende toon. Dit type afbeelding kan veel vergelijkbare kleuren (of halftonen) hebben. Wanneer aangrenzende pixels slechts één verschil vertonen, is het voor het oog bijna onmogelijk om hun kleuren te onderscheiden. Als gevolg hiervan kunnen dergelijke afbeeldingen gebieden bevatten waarin de kleur voor het oog voortdurend lijkt te veranderen. In dit geval wordt de pixel ook weergegeven een groot aantal(in het geval van halftoon) of drie componenten (in het geval van een kleurenafbeelding). Beelden met continue toon zijn natuurlijk of natuurlijk (in tegenstelling tot door de mens gemaakt, kunstmatig); Ze worden meestal verkregen door te fotograferen met een digitale camera of door foto's of tekeningen te scannen.

5. Discrete toon afbeelding (ook wel synthetisch genoemd). Meestal wordt dit beeld kunstmatig verkregen. Het kan slechts een paar kleuren of veel kleuren hebben, maar het is vrij van de ruis en onvolkomenheden van een natuurlijk beeld. Voorbeelden van dergelijke afbeeldingen zijn onder meer foto's van door de mens gemaakte objecten, machines of mechanismen, pagina's met tekst, kaarten, tekeningen of afbeeldingen op een computerscherm. (Niet elk kunstmatig beeld zal noodzakelijkerwijs een discrete toon hebben. Een computergegenereerd beeld dat er natuurlijk uit moet zien, zal ondanks zijn kunstmatige oorsprong doorlopende tonen hebben.) Kunstmatige objecten, tekst en getekende lijnen hebben een vorm en goed gedefinieerde grenzen. Ze contrasteren sterk met de rest van het beeld (achtergrond). Aangrenzende pixels van een discreet toonbeeld zijn vaak enkelvoudig of variëren sterk in waarde. Dergelijke afbeeldingen worden slecht gecomprimeerd met behulp van lossy-methoden, omdat de vervorming van slechts een paar pixels van een letter deze onleesbaar maakt, waardoor de gebruikelijke stijl wordt omgezet in een volledig niet te onderscheiden stijl. Beeldcompressiemethoden met continue toon kunnen niet goed omgaan met de scherpe randen van de afbeeldingen met discrete tonen waarvoor ze ontworpen zouden moeten worden. speciale methoden compressie. Houd er rekening mee dat afbeeldingen met discrete tonen doorgaans veel redundantie bevatten. Veel van de fragmenten worden vele malen herhaald verschillende plaatsen afbeeldingen.

6. Afbeeldingen, zoals tekenfilms. Dit zijn kleurenafbeeldingen die grote vlakken van dezelfde kleur bevatten. In dit geval kunnen de aangrenzende gebieden sterk in kleur variëren. Deze eigenschap kan worden gebruikt om een betere compressie te bereiken.

Intuïtief wordt het duidelijk dat elk type afbeelding een zekere mate van redundantie heeft, maar ze zijn allemaal op verschillende manieren redundant. Daarom is het moeilijk om één enkele methode te creëren die elk type afbeelding even goed comprimeert. Er zijn afzonderlijke methoden voor het comprimeren van afbeeldingen op twee niveaus: afbeeldingen met continue tonen en afbeeldingen met discrete tonen. Er zijn ook methoden die proberen het beeld te scheiden in delen met continue tonen en delen met discrete tonen en deze afzonderlijk te comprimeren.
^ 9.2. Continue beeldbemonstering

Zeer zelden worden afbeeldingen verkregen in informatiesystemen, hebben digitale vorm. Daarom is de conversie naar dit type een verplichte handeling als het de bedoeling is dat digitale verwerking, verzending en opslag worden gebruikt. Net als bij eendimensionale signalen, deze transformatie omvat twee procedures. De eerste bestaat uit het vervangen van een doorlopend frame door een discreet frame en wordt meestal genoemd bemonstering, en de tweede vervangt een continue reeks helderheidswaarden door een reeks gekwantiseerde waarden en wordt aangeroepen kwantisering. Bij digitale weergave wordt elk van de gekwantiseerde helderheidswaarden toegewezen binair getal, waarmee u afbeeldingen in een computer kunt invoeren.

Het tweedimensionale karakter van het beeld bevat vergeleken met conventionele signalen extra functies Optimaliseren van digitale presentatie om de hoeveelheid ontvangen digitale gegevens te verminderen. In dit verband is de vraag van beste locatie kwantiseringsniveaus, evenals het gebruik van verschillende rasters, zijn andere aspecten van deze taak. Er moet echter worden gezegd dat in de overgrote meerderheid van de gevallen in de praktijk gebruik wordt gemaakt van bemonstering op basis van het gebruik van een rechthoekig raster en uniforme kwantisering van de helderheid. Dit komt door het gemak waarmee de relevante bewerkingen kunnen worden uitgevoerd en de relatief kleine voordelen van het gebruik van optimale transformaties. Bij gebruik van een rechthoekig raster in de uiteindelijke vorm digitaal beeld meestal een matrix waarvan de rijen en kolommen overeenkomen met de rijen en kolommen van de afbeelding.

Het vervangen van een doorlopend beeld door een discreet beeld kan op verschillende manieren gebeuren. U kunt bijvoorbeeld elk systeem van orthogonale functies kiezen en, nadat u de coëfficiënten van beeldrepresentatie met dit systeem (op basis van deze basis) hebt berekend, de afbeelding ermee vervangen. De verscheidenheid aan ondergronden maakt het mogelijk om verschillende discrete representaties van een doorlopend beeld te vormen. De meest gebruikte methode is echter periodieke bemonstering, in het bijzonder, zoals hierboven vermeld, bemonstering met een rechthoekig raster. Deze discretisatiemethode kan worden beschouwd als een van de opties voor het gebruik van een orthogonale basis die verschoven functies als elementen gebruikt. Vervolgens zullen we, voornamelijk als volgt, in detail de belangrijkste kenmerken van rechthoekige bemonstering bekijken.

Waar zijn respectievelijk de verticale en horizontale stappen of bemonsteringsintervallen. Rijst. Figuur 9.1 illustreert de locatie van monsters op het vlak met rechthoekige bemonstering.

De belangrijkste vraag die zich voordoet bij het vervangen van een continu beeld door een discreet beeld is het bepalen van de omstandigheden waaronder een dergelijke vervanging voltooid is, d.w.z. gaat niet gepaard met een verlies van informatie in het continue signaal. Er zijn geen verliezen als het, met een discreet signaal, mogelijk is om een continu signaal te herstellen. Vanuit wiskundig oogpunt is de vraag daarom om een continu signaal te reconstrueren in tweedimensionale ruimtes tussen knooppunten waarvan de waarden bekend zijn, of, met andere woorden, om tweedimensionale interpolatie uit te voeren. Deze vraag kan worden beantwoord door de spectrale eigenschappen van continue en discrete beelden te analyseren.

Tweedimensionaal continu frequentiespectrum continu signaal wordt bepaald door een tweedimensionale directe Fourier-transformatie:

Dat komt overeen met de tweedimensionale inverse continue Fourier-transformatie:

De laatste relatie geldt voor alle waarden, ook voor de knooppunten van een rechthoekig rooster . Daarom kan relatie (9.3) voor de signaalwaarden op de knooppunten, rekening houdend met (9.1), worden geschreven als:

Laten we kortheidshalve dit aanduiden met een rechthoekige doorsnede in het tweedimensionale frequentiedomein

De berekening van de integraal in (1.4) over het gehele frequentiedomein kan worden vervangen door integratie over afzonderlijke secties en optelling van de resultaten:

Door variabelen volgens de regel te vervangen, bereiken we onafhankelijkheid van het integratiedomein van de cijfers en:

Hier wordt rekening mee gehouden voor alle gehele waarden en . Deze uitdrukking zijn vorm ligt zeer dicht bij de inverse Fourier-transformatie. Het enige verschil is de onjuiste vorm van de exponentiële factor. Om het de gewenste vorm te geven, introduceren we genormaliseerde frequenties en voeren we in overeenstemming hiermee een verandering van variabelen uit. Als resultaat krijgen we:

(9.5)

Nu heeft uitdrukking (5) de vorm van een inverse Fourier-transformatie, dus de functie onder het integraalteken is

(9.6)

Is een tweedimensionaal spectrum van een discreet beeld. Op het vlak van niet-gestandaardiseerde frequenties heeft uitdrukking (9.6) de vorm:

(9.7)

Uit (9.7) volgt dat het tweedimensionale spectrum van een discreet beeld rechthoekig periodiek is met perioden en respectievelijk langs de frequentie-assen en. Het spectrum van een discreet beeld wordt gevormd als resultaat van de optelling van een oneindig aantal spectra van een continu beeld, die van elkaar verschillen in frequentieverschuivingen en . Figuur 9.2 toont kwalitatief de relatie tussen de tweedimensionale spectra van continue (Fig. 9.2.a) en discrete (Fig. 9.2.b) beelden.


A)	B)
Rijst. 9.2. Frequentiespectra van continue en discrete beelden

Het sommatieresultaat zelf hangt in belangrijke mate af van de waarden van deze frequentieverschuivingen, of, met andere woorden, van de keuze van de bemonsteringsintervallen. Laten we aannemen dat het spectrum van een continu beeld niet nul is in een tweedimensionaal gebied in de buurt van de frequentie nul, dat wil zeggen dat het wordt beschreven door een tweedimensionale eindige functie. Als de bemonsteringsintervallen zo worden gekozen bij , , dan zal de overlap van individuele takken bij het vormen van de som (9.7) niet optreden. Binnen elke rechthoekige sectie zal dus slechts één term van nul verschillen. In het bijzonder wanneer wij hebben:

bij
, . (9.8)

Binnen het frequentiedomein vallen de spectra van continue en discrete beelden dus samen tot een constante factor. In dit geval bevat het spectrum van een discreet beeld in dit frequentiegebied volledige informatie over het spectrum van een continu beeld. We benadrukken dat dit toeval alleen plaatsvindt onder gespecificeerde omstandigheden, bepaald door een succesvolle keuze van bemonsteringsintervallen. Merk op dat de vervulling van deze voorwaarden, volgens (9.8), wordt bereikt bij voldoende kleine waarden van bemonsteringsintervallen, die aan de vereisten moeten voldoen:

, , (9.9)

Waarin bevinden zich de grensfrequenties van het tweedimensionale spectrum.

Relatie (9.8) bepaalt de methode voor het verkrijgen van een continu beeld uit een discreet beeld. Om dit te doen, volstaat het om tweedimensionale filtering van een discreet beeld uit te voeren met behulp van een laagdoorlaatfilter met een frequentierespons

Het spectrum van het beeld aan de uitgang bevat alleen componenten die niet nul zijn in het frequentiedomein en is volgens (9.8) gelijk aan het spectrum van een continu beeld. Dit betekent dat het uitvoerbeeld van een ideaal laagdoorlaatfilter hetzelfde is als .

De ideale interpolatiereconstructie van een continu beeld wordt dus uitgevoerd met behulp van een tweedimensionaal filter met een rechthoekige frequentierespons (9.10). Het is niet moeilijk om expliciet een algoritme op te schrijven voor het reconstrueren van een doorlopend beeld. De tweedimensionale impulsresponsie van het reconstructiefilter, die eenvoudig kan worden verkregen met behulp van de inverse Fourier-transformatie uit (9.10), heeft de vorm:

Het filterproduct kan worden bepaald met behulp van een tweedimensionale convolutie van het invoerbeeld en het gegeven impuls reactie. Het invoerbeeld weergeven als een tweedimensionale reeks -functies

Na het uitvoeren van de convolutie vinden we:

(9.11)

De resulterende relatie geeft een werkwijze aan voor nauwkeurige interpolatiereconstructie van een continu beeld uit een bekende reeks van zijn tweedimensionale monsters. Volgens deze uitdrukking moeten voor een nauwkeurige reconstructie tweedimensionale functies van het formulier worden gebruikt als interpolatiefuncties. Relatie (9.11) is een tweedimensionale versie van de stelling van Kotelnikov-Nyquist.

Laten we nogmaals benadrukken dat deze resultaten geldig zijn als het tweedimensionale spectrum van het signaal eindig is en de bemonsteringsintervallen voldoende klein zijn. De eerlijkheid van de getrokken conclusies wordt geschonden als aan ten minste één van deze voorwaarden niet wordt voldaan. Echte beelden hebben zelden spectra met uitgesproken afsnijfrequenties. Een van de redenen die tot het onbeperkte spectrum leiden, is de beperkte beeldgrootte. Hierdoor verschijnt bij het optellen van (9.7) de actie van termen uit aangrenzende spectrale zones in elk van de zones. In dit geval wordt een nauwkeurige restauratie van een continu beeld volkomen onmogelijk. Met name het gebruik van een filter met een rechthoekige frequentierespons leidt niet tot nauwkeurige reconstructie.

Een kenmerk van optimaal beeldherstel in de intervallen tussen monsters is het gebruik van alle monsters van een afzonderlijk beeld, zoals voorgeschreven door procedure (9.11). Dit is niet altijd handig; het is vaak nodig om een signaal in een lokaal gebied te reconstrueren, op basis van een klein aantal beschikbare discrete waarden. In deze gevallen is het raadzaam om quasi-optimaal herstel te gebruiken met behulp van verschillende interpolatiefuncties. Dit soort problemen doet zich bijvoorbeeld voor bij het oplossen van het probleem van het koppelen van twee afbeeldingen, wanneer, als gevolg van de geometrische ontstemming van deze afbeeldingen, de beschikbare monsters van een van hen kunnen overeenkomen met enkele punten die zich in de ruimtes tussen de knooppunten van de beelden bevinden. ander. De oplossing voor dit probleem wordt in de volgende secties van deze handleiding gedetailleerder besproken.


A)	B)

V)	G)
Rijst. 9.3. De invloed van het bemonsteringsinterval op de reconstructie van het “Vingerafdruk”-beeld

Rijst. Figuur 9.3 illustreert het effect van bemonsteringsintervallen op beeldreconstructie. Het originele beeld, dat een vingerafdruk is, wordt getoond in Fig. 9.3.a, en een van de secties van het genormaliseerde spectrum staat in Fig. 9.3.b. Dit beeld is discreet en de waarde wordt gebruikt als de afsnijfrequentie

. Zoals volgt uit afb. 9.3.b is de waarde van het spectrum bij deze frequentie verwaarloosbaar, wat een hoogwaardige reconstructie garandeert. In feite, waargenomen in Fig. 9.3.a De afbeelding is het resultaat van het herstellen van een continu beeld, en de rol van een herstelfilter wordt vervuld door een visualisatieapparaat - een monitor of een printer. In die zin is het beeld in Fig. 9.3.a kan als continu worden beschouwd.

Rijst. 9.3.c, d tonen de gevolgen van een onjuiste keuze van bemonsteringsintervallen. Bij het verkrijgen ervan werd het "continue" beeld "bemonsterd" in figuur 1. 9.3.a door de meetwaarden uit te dunnen. Rijst. 3.c komt overeen met een toename van de bemonsteringsstap voor elke coördinaat met drie, en Fig. 9.3.g - vier keer. Dit zou acceptabel zijn als de waarden van de afsnijfrequenties hetzelfde aantal keren lager zouden zijn. In werkelijkheid vindt, zoals blijkt uit figuur 9.3.b, een overtreding van eisen (9.9) plaats, vooral ernstig wanneer de monsters vier keer worden uitgedund. Daarom zijn de afbeeldingen die zijn hersteld met behulp van algoritme (9.11) niet alleen onscherp, maar vervormen ze ook de textuur van de afdruk aanzienlijk.


A)	B)

V)	G)
Rijst. 9.4. De invloed van het bemonsteringsinterval op de reconstructie van het “Portret”-beeld

In afb. 9.4 toont een vergelijkbare reeks resultaten verkregen voor een “portret”-type afbeelding. De gevolgen van een sterkere uitdunning (vier keer in figuur 9.4.c en zes keer in figuur 9.4.d) komen vooral tot uiting in verlies aan helderheid. Subjectief gezien lijkt het kwaliteitsverlies minder groot dan in Fig. 9.3. Dit wordt verklaard door de aanzienlijk kleinere spectrale breedte dan die van een vingerafdrukbeeld. Het bemonsteren van het originele beeld komt overeen met de afsnijfrequentie

. Zoals blijkt uit Fig. 9.4.b is deze waarde veel hoger dan de werkelijke waarde. Daarom is de toename van het bemonsteringsinterval, geïllustreerd in Fig. 3.c,d leidt, hoewel het het beeld verslechtert, nog steeds niet tot zulke destructieve gevolgen als in het vorige voorbeeld.
^ 9.3. Beeldkwantisering

Bij digitale beeldverwerking wordt het continue dynamische bereik van helderheidswaarden verdeeld in een aantal discrete niveaus. Deze procedure wordt kwantisering genoemd. Een kwantiseerder transformeert een continue variabele in een discrete variabele die een eindige reeks waarden aanneemt. Deze waarden worden kwantiseringsniveaus genoemd. IN algemeen geval de transformatie wordt uitgedrukt door een stapfunctie (Fig. 9.5). Als de helderheid van het beeldvoorbeeld tot het interval behoort (d.w.z. wanneer ), dan wordt het originele monster vervangen door het kwantiseringsniveau, waarbij - kwantiseringsdrempels. Er wordt aangenomen dat het dynamische bereik van helderheidswaarden beperkt is en gelijk is aan .

Rijst. 9.5.Functie die kwantisering beschrijft
De taak van het construeren van een kwantiseerder is het bepalen van de waarden van drempels en niveaus. De eenvoudigste manier De oplossing voor dit probleem is om het dynamische bereik in gelijke intervallen te verdelen. Deze oplossing is echter niet de beste. Als de helderheidswaarden van de meeste beeldmonsters bijvoorbeeld in het “donkere” gebied zijn gegroepeerd en het aantal niveaus beperkt is, is het raadzaam om ongelijkmatig te kwantiseren. In het “donkere” gebied moet u vaker kwantiseren, en in het “lichte” gebied minder vaak. Dit zal de kwantiseringsfout verminderen.

Het probleem van het construeren van een kwantiseerder kan dus worden geformuleerd als het probleem van het vinden optimale waarden en , die voldoet aan een bepaald optimalisatiecriterium. Voor een vast aantal niveaus wordt de kwantiseerder doorgaans geoptimaliseerd volgens het criterium van de minimale gemiddelde kwadratische fout

, (9.12)

Ervan uitgaande dat de helderheid dat is willekeurige variabele met een bekende waarschijnlijkheidsdichtheid.

De wortelgemiddelde kwadratische kwantiseringsfout (9.12) is gelijk aan

. (9.13)

Door te differentiëren (9.13) met betrekking tot de variabelen en de afgeleiden gelijk te stellen aan nul, verkrijgen we de niet-lineaire vergelijkingen

Opgemerkt moet worden dat de extreme drempels worden bepaald door het dynamische helderheidsbereik. Vergelijkingen (9.14) kunnen eenvoudig tot de vorm worden herleid

Uit (9.15) volgt dat de drempels zich in het midden tussen twee aangrenzende niveaus en moeten bevinden. De oplossing voor deze vergelijkingen kan iteratief worden gevonden. De optimale kwantiseerder die aan criterium (9.12) voldoet, wordt een Lloyd-Max-kwantiseerder genoemd, en de gemiddelde kwadratische fout voor een dergelijke kwantiseerder is

(9.16)

Bij uniforme verdeling Niet-lineaire helderheidsvergelijkingen (9.15) kunnen in het formulier worden weergegeven

En de gemiddelde kwadratische fout is gelijk aan
.

In digitale beeldverwerkingssystemen streven ze ernaar het aantal kwantiseringsniveaus en drempels te verminderen, omdat de lengte van het binaire codewoord waarmee gekwantiseerde monsters in de computer worden weergegeven, hangt af van hun aantal. Bij een relatief klein aantal niveaus verschijnen er echter valse contouren in het gekwantiseerde beeld. Ze ontstaan door stap verandering helderheid van het gekwantiseerde beeld (Fig. 9.6) en zijn vooral merkbaar in vlakke gebieden van de verandering.

Valse contouren verslechteren de visuele kwaliteit van het beeld aanzienlijk, omdat Het menselijk zicht is bijzonder gevoelig voor contouren. Bij het uniform kwantiseren van typische afbeeldingen zijn minimaal 64 niveaus vereist. In afb. 9.7.a en 9.7.b tonen de resultaten van uniforme kwantisering van het "Portret"-beeld in respectievelijk 256 en 14 kwantiseringsniveaus.

Rijst. 9.6. Over het mechanisme van het optreden van valse contouren

Valse contouren zijn zichtbaar in donkere delen van het beeld. Het gebruik van een Lloyd-Max-kwantiseerder maakt het mogelijk om hun niveau aanzienlijk te verlagen (Fig. 9.8, waar het aantal kwantiseringsniveaus ook 14 is). In afb. Figuur 9.9 toont een histogram van de helderheid van het “Portret”-beeld op 256 kwantiseringsniveaus en markeert de drempels op . Uit de figuur volgt dat die gebieden van het dynamische bereik waarin de helderheidswaarden van de samples zijn gegroepeerd vaker worden gekwantiseerd.

Om ongelijkmatige kwantisering te voorkomen, die niet kan worden uitgevoerd met behulp van een standaard ADC, worden niet-lineaire transformaties gebruikt (Fig. 9.10). Het monster van het originele beeld wordt onderworpen aan een niet-lineaire transformatie, zodat de waarscvan de getransformeerde monsters uniform is, d.w.z. egalisatieprocedure wordt uitgevoerd. Vervolgens worden de monsters met een uniforme stap gekwantiseerd en ondergaan ze een inverse niet-lineaire transformatie.

Afb.9.10. Kwantisering met voorlopige niet-lineaire transformatie
Om valse contouren te vernietigen, stelde Roberts voor om ruis met een uniforme waarscaan de helderheidsmonsters toe te voegen vóór uniforme kwantisering. Toegevoegde ruis duwt sommige beeldvoorbeelden naar een hoger niveau en andere naar een lager niveau. Zo worden valse contouren vernietigd. De variantie van de toegevoegde ruis moet klein zijn om niet te leiden tot vervormingen die als “sneeuw” in het beeld worden ervaren, en tegelijkertijd voldoende zijn om valse contouren te vernietigen. Normaal gesproken wordt over het interval uniform verdeelde ruis gebruikt . De resultaten van uniforme kwantisering in 14 en 8 niveaus van het "Portret"-beeld met voorafgaande toevoeging van ruis worden getoond in Fig. 9.11.a en 9.11.b. Bij 8 kwantiseringsniveaus wordt de toegevoegde ruis te opvallend, maar worden valse contouren vrijwel volledig vernietigd.

Bij het afdrukken wordt een andere kwantiseringsmethode gebruikt. Dit is een methode voor het genereren van binaire rasterafbeeldingen (2-niveaus) uit halftoonafbeeldingen. Bij het afdrukken (bijvoorbeeld kranten of tijdschriften) wordt de afbeelding gevormd uit witte en zwarte stippen. Om dit te doen, wordt het volledige originele beeld op basis van ruimtelijke coördinaten verdeeld in identieke vierkante blokken. Normaal gesproken bevat een blok elementen. Aan ieder blokmonster wordt een getal toegevoegd met de bijbehorende coördinaten uit de stoorsignaalmatrix, waarvan de afmetingen gelijk zijn aan de afmetingen van het blok. Als stoorsignaalmatrix worden bijvoorbeeld de volgende getallen gebruikt:

Deze handeling wordt voor alle blokken herhaald. Het resulterende beeld wordt in twee niveaus gekwantiseerd. In afb. Figuur 9.12.a toont een halftoonbeeld “Portret” met een toegevoegd stoorsignaal. In afb. Figuren 9.12.b,c tonen de resultaten van binaire kwantisering van het "Portret"-beeld met een toegevoegd stoorsignaal (Fig. 9.13.b) en zonder (Fig. 9.13.c).


B)	V)
Afb. 9.12. Rasterisatie van afbeeldingen

Binair rasterafbeelding biedt een aanzienlijk betere visuele ervaring dan een conventioneel binair beeld. De overdracht van de helderheidsschaal tijdens rastering wordt bereikt door de geometrische afmetingen te wijzigen witte vlek, waargenomen tegen een zwarte achtergrond. Als “lichte” metingen in een blok worden gegroepeerd, zijn de geometrische afmetingen van de witte vlek maximaal en gelijk aan de grootte van het blok. Naarmate de helderheid afneemt, nemen ook de geometrische afmetingen af. Het menselijk oog voert lokale middeling uit, waardoor de illusie ontstaat dat u een halftoonbeeld ziet. De rasterprocedure is vooral effectief bij het afdrukken van afbeeldingen met hoge resolutie, wanneer een enkele vlek nauwelijks zichtbaar is voor het oog.

^ 9.4 Beeldvoorbereiding

Dissectie is een hele klasse van element-voor-element beeldtransformaties. De kenmerken van de in de praktijk gebruikte voorbereidingsprocedures worden weergegeven in figuur 9.13. Laten we stilstaan bij de beschrijving van enkele van hen.

Transformatie met een drempelkarakteristiek (Fig. 9.13.a) verandert een halftoonbeeld dat alle helderheidsniveaus bevat in een binair beeld, punten

Welke helderheid hebben of . Deze bewerking, ook wel binarisatie of binaire kwantisering genoemd, kan nuttig zijn wanneer de contouren van objecten in het beeld belangrijk zijn voor de waarnemer.

En de details in objecten of op de achtergrond zijn niet van belang. Het grootste probleem bij het uitvoeren van een dergelijke verwerking is het bepalen van de drempelwaarde, in vergelijking waarmee de helderheid van het originele beeld ons in staat stelt de waarde van het uitvoerbeeld op elk van zijn punten te bepalen. Het meest gerechtvaardigd voor de wiskundige beschrijving van het beeld is het gebruik van de waarschijnlijkheidstheorie, willekeurige processen en willekeurige velden. In dit geval is het bepalen van de optimale binaire kwantiseringsdrempel een statistisch probleem. Aan de statistische benadering van beeldverwerking wordt in de volgende paragrafen veel aandacht besteed, onder meer bij het oplossen van het probleem van het verdelen van beeldpunten in twee klassen van zogenaamde binaire segmentatie. Hier beperken we ons tot het bespreken van een specifiek, maar praktisch belangrijk geval. Soms heb je tijdens de verwerking te maken met afbeeldingen die als halftoon zijn opgeslagen, maar qua inhoud weinig verschillen van binaire afbeeldingen.


A)	B)	V)

G)	D)	e)

En)	H)	En)

	Naar)

Rijst. 9.13 Voorbeelden van transformaties gebruikt tijdens de voorbereiding

Rijst. 9.14. Op weg naar de keuze van de binaire kwantiseringsdrempel

Deze omvatten tekst, lijntekeningen, tekeningen en een vingerafdrukafbeelding, waarvan een voorbeeld wordt getoond in figuur 9.15.a. De waarschijnlijkheidsdichtheid die de helderheidsverdeling van een dergelijk beeld beschrijft, kan twee goed gescheiden pieken bevatten. Intuïtief zou de binaire kwantiseringsdrempel in het midden van de opening tussen deze pieken moeten worden gekozen, zoals weergegeven in figuur 9.14. Vervanging van de originele halftoonafbeelding binair medicijn lost twee hoofdproblemen op. Ten eerste wordt een grotere helderheid bereikt in de visuele waarneming dan die van het originele beeld. Ten tweede wordt de opslagruimte voor het opslaan van de afbeelding aanzienlijk verminderd, aangezien een binair beeld slechts 1 bit geheugen nodig heeft om elk punt van een binair beeld vast te leggen, terwijl een halftoonbeeld 8 bits nodig heeft om hetzelfde probleem in de meest gebruikte representatie op te lossen. formaat. Een voorbeeld van binarisatie van vingerafdrukbeelden wordt getoond in figuur 9.15.b.

De betekenis van andere transformaties gepresenteerd in Fig. 9.13 is niet moeilijk te begrijpen als we hun kenmerken in ogenschouw nemen. Transformeer bijvoorbeeld Fig. 9.13.b voert een furieus deel van de afbeelding uit, waarbij de delen ervan worden benadrukt waar de helderheid overeenkomt met het geselecteerde interval. In dit geval worden de overige gebieden volledig "gedoofd" (hebben een helderheid die overeenkomt met het zwartniveau). Door het geselecteerde interval langs de helderheidsschaal te verplaatsen en de breedte ervan te wijzigen, kunt u de inhoud van de afbeelding in detail bekijken.


Afb.9.15. Voorbeeld van binarisatie van afbeeldingen

Met de transformatie getoond in Fig. 9.13.g kunt u ook de details van het waargenomen beeld vergroten in het geselecteerde helderheidsbereik, maar in tegenstelling tot het vorige gebruikt het uitvoerbeeld hier het volledige dynamische bereik. In wezen is deze transformatie een lineair contrast waarop wordt toegepast geselecteerde bereik afbeelding invoeren. Net als in de vorige versie vormen gebieden die niet binnen dit bereik vallen na voorbereiding een zwarte achtergrond.

Soms wordt de helderheid van het beeld vergroot door gebruik te maken van een transformatie zoals zaagtandcontrast. In dit geval worden verschillende helderheidsbereiken tegelijkertijd onderworpen aan lokaal helderheidscontrast. Houd er echter rekening mee dat deze transformatie, net als sommige andere, gepaard kan gaan met het verschijnen van valse contouren op het resulterende preparaat.

Op dezelfde manier kunt u kwalitatief rekening houden met de resterende voorbereidingsprocedures die worden weergegeven in figuur 9.13.

In afb. Figuur 9.16 toont de resultaten van een experiment waarbij transformaties zoals drempelverwerking (Figuur 9.16.b) en zaagtandcontrast (Figuur 9.16.c) werden toegepast op een luchtfoto van een stuk grond (Figuur 9.16.a). De eerste leidt tot het identificeren van de grenzen van individuele gebieden, waardoor een algemeen geïntegreerd beeld van de waargenomen scène ontstaat. De tweede maakt het daarentegen mogelijk om kleine details in alle delen van het beeld waar te nemen. Een combinatie van deze twee mogelijkheden kan nuttig zijn voor de waarnemer.


A)	B)

V)
Rijst. 9.16. Voorbeelden van beeldvoorbereiding

Concluderend merken we op dat voorbereiding vaak wordt gebruikt automatische systemen verwerking visuele informatie, aangezien het in dit geval bereide preparaat alle informatie kan bevatten die nodig is voor de daaropvolgende (secundaire) verwerking. Als het bij observatie vanuit de ruimte bijvoorbeeld nodig is om automatisch een object in een beeld te detecteren dat een bekende configuratie heeft, dan kan een binaire voorbereiding die deze configuratie overbrengt hiervoor voldoende zijn.