Grafische presentatie van statistische gegevens. Grafische weergave van statistische informatie

Voor een heldere en compacte presentatie statistische informatie gebruik statistische tabellen en grafieken (inclusief grafieken, cartogrammen en kaartdiagrammen).

Resultaten van samenvatting en groepering van materialen statistische observatie worden in de regel gepresenteerd in de vorm van tabellen.

Een tabel is de meest rationele, visuele en compacte vorm van presentatie van statistisch materiaal.

Een statistische tabel is een tabel die een samenvattend numeriek kenmerk van de bestudeerde populatie bevat volgens een of meer essentiële kenmerken, onderling verbonden door de logica van economische analyse.

De belangrijkste elementen van de statistische tabel getoond in Fig. 5.1, maak de lay-out:

Rijst. 5.1. Statistische tabel

Bij het bouwen van een tafel numerieke informatie gelegen op het snijpunt van lijnen en grafieken. Extern is de tabel dus een verzameling kolommen en rijen die de tabel vormen

skelet De grootte van de tabel wordt bepaald door het product van het aantal rijen en het aantal kolommen.

De statistische tabel bevat drie soorten kopjes: algemeen, boven en zijkant. De algemene koptekst weerspiegelt de inhoud van de gehele tabel, bevindt zich boven de lay-out in het midden en is de buitenste koptekst. De bovenste koppen (predikaatkoppen) karakteriseren de inhoud van de kolommen, en de zijkoppen (onderwerpkoppen) karakteriseren de inhoud van de regels. Het zijn interne headers.

Het skelet van de tafel, gevuld met kopjes, vormt de indeling. Als u getallen op het snijpunt van grafieken en lijnen schrijft, krijgt u een volledige statistische tabel. Digitaal materiaal kan worden gepresenteerd in absolute, relatieve (prijsindexcijfers voor voedingsmiddelen) en gemiddelde waarden. Indien nodig kunnen de tabellen vergezeld gaan van een toelichting ter toelichting van de rubrieken, de methodologie voor de berekening van bepaalde indicatoren, informatiebronnen, enz.

In termen van logische inhoud is de tabel een “statistische zin”, waarvan de belangrijkste elementen het onderwerp en het predikaat zijn.

Het onderwerp van de statistische tabel bevat een lijst met indicatoren, gekenmerkt door cijfers. Dit kunnen een of meer aggregaten zijn, individuele eenheden van aggregaten (bedrijven, verenigingen) in de volgorde van hun lijst of gegroepeerd op basis van bepaalde kenmerken (individuele territoriale eenheden, tijdsperioden in chronologische tabellen, enz.). Meestal wordt het onderwerp van de tabel aan de linkerkant vermeld, in de namen van de rijen.

Het predikaat van een statistische tabel wordt gevormd door een systeem van indicatoren die het studieobject karakteriseren, dat wil zeggen het onderwerp van de tabel. Het predikaat vormt de bovenste kopjes en vormt de inhoud van de grafiek met een logisch opeenvolgende rangschikking van indicatoren van links naar rechts.

Afhankelijk van de keuze van de onderzoeker kan de plaatsing van het onderwerp en het predikaat worden omgedraaid. Afhankelijk van de structuur van het onderwerp en de groepering van eenheden daarin, worden eenvoudige en complexe statistische tabellen onderscheiden, en deze laatste zijn op hun beurt onderverdeeld in groepen en combinaties.

In een eenvoudige tabel geeft het onderwerp een eenvoudige lijst van alle objecten of territoriale eenheden van de bevolking. Eenvoudige tabellen kunnen monografisch en lijstvormig zijn. Monografieën karakteriseren niet de hele reeks eenheden van het boek dat wordt bestudeerd, maar slechts één groep ervan, geïdentificeerd volgens een bepaald, vooraf geformuleerd criterium. Eenvoudige lijsttabellen zijn dus tabellen waarvan het onderwerp een lijst bevat van eenheden van de populatie die wordt bestudeerd.

Het onderwerp van een eenvoudige tabel kan worden gevormd volgens de volgende principes: specifiek, territoriaal (bevolking in de GOS-landen); tijdelijk, enz. Eenvoudige tabellen maken het niet mogelijk om de sociaal-economische typen van de onderzochte verschijnselen, hun structuur, en ook de relaties en onderlinge afhankelijkheden tussen de kenmerken die deze kenmerken, te identificeren. Deze problemen worden vollediger opgelost met behulp van complexe tabellen: groeps- en vooral combinatietabellen.

Groepstabellen zijn statistische tabellen waarvan het onderwerp een groepering van bevolkingseenheden bevat volgens één kwantitatief of attribuutkenmerk. Het predikaat in groepstabellen bestaat uit indicatoren die nodig zijn om het onderwerp te karakteriseren.

Het eenvoudigste type groepstabellen zijn attribuut- en variatiedistributiereeksen. Een groepstabel kan complexer zijn als het predikaat niet alleen het aantal eenheden in elke groep bevat, maar ook een aantal andere belangrijke indicatoren die de groepen van het onderwerp kwantitatief en kwalitatief karakteriseren. Dergelijke tabellen worden vaak gebruikt om algemene indicatoren per groep te vergelijken, waardoor bepaalde praktische conclusies kunnen worden getrokken. Groepstabellen maken het mogelijk sociaal-economische soorten verschijnselen en hun structuur te identificeren en te karakteriseren, afhankelijk van slechts één kenmerk.

Combinatietabellen zijn statistische tabellen waarvan het onderwerp een groepering van bevolkingseenheden tegelijkertijd bevat volgens twee of meer kenmerken: elke groep, opgebouwd volgens één kenmerk, wordt verdeeld in subgroepen volgens een ander kenmerk, enz.

Combinatietabellen maken het mogelijk om typische groepen te karakteriseren die worden geïdentificeerd door verschillende kenmerken en de relatie daartussen. De volgorde waarin bevolkingseenheden op basis van kenmerken in homogene groepen worden verdeeld, wordt bepaald door het belang van een van hen in hun combinatie, of door de volgorde waarin ze worden bestudeerd.

Bij de complexe ontwikkeling van een predikaat wordt het kenmerk dat het predikaat vormt, in subgroepen verdeeld. Dit resulteert in een completer en gedetailleerde kenmerken voorwerp. In dit geval kan elke groep ondernemingen of elk afzonderlijk worden gekarakteriseerd verschillende combinatie kenmerken die het predikaat vormen.

Statistieken moeten zo worden gepresenteerd dat ze kunnen worden gebruikt. Er zijn drie hoofdvormen voor het presenteren van statistische gegevens:

1) tekstueel – opname van gegevens in de tekst;

2) tabellarisch – presentatie van gegevens in tabellen;

3) grafisch – weergave van gegevens in de vorm van grafieken.

Tekstformulier gebruikt als er een kleine hoeveelheid digitale gegevens is.

Tabelvorm wordt het vaakst gebruikt omdat het een effectievere vorm is om statistische gegevens te presenteren. in tegenstelling tot wiskunde tabellen, die volgens de beginvoorwaarden iemand in staat stellen een of ander resultaat te verkrijgen, vertellen statistische tabellen de taal van getallen over de objecten die worden bestudeerd.

Statistische tabel is een systeem van rijen en kolommen waarin een bepaalde volgorde en communicatie wordt statistische informatie over sociaal-economische verschijnselen gepresenteerd.

Tabel 2. Buitenlandse handel van de Russische Federatie voor de periode 2000 – 2006, miljard dollar.

Inhoudsopgave 2000 2001 2002 2003 2004 2005 2006
Omzet buitenlandse handel 149,9 155,6 168,3 280,6 368,9 468,4
Exporteren 101,9 107,3 135,9 183,2 243,6 304,5
Importeren 44,9 53,8 76,1 97,4 125,3 163,9
Handelsbalans 60,1 48,1 46,3 59,9 85,8 118,3 140,7
inbegrepen:
met landen ver in het buitenland
exporteren 90,8 86,6 90,9 114,6 210,1 261,1
importeren 31,4 40,7 48,8 77,5 103,5 138,6
handelsbalans 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Bijvoorbeeld in tabel. 2 presenteert informatie over de buitenlandse handel van Rusland, die niet effectief zou zijn om in tekstvorm uit te drukken.

Onderscheiden onderwerp En predikaat statistische tabel. Het onderwerp geeft het object aan dat wordt gekarakteriseerd: eenheden van de populatie, of groepen eenheden, of de populatie als geheel. Het predikaat geeft kenmerken van het onderwerp weer, meestal in numerieke vorm. Vereist titel tabel, die aangeeft tot welke categorie en tot welk tijdstip de tabelgegevens behoren.

Afhankelijk van de aard van het onderwerp zijn statistische tabellen onderverdeeld in eenvoudig, groep En combinatorisch. In het onderwerp van een eenvoudige tabel wordt het studieobject niet in groepen verdeeld, maar wordt een lijst van alle eenheden van de populatie gegeven, of wordt de populatie als geheel aangegeven (bijvoorbeeld tabel 11). In het onderwerp van de groepstabel wordt het studieobject verdeeld in groepen op basis van één kenmerk, en het predikaat geeft het aantal eenheden in de groepen aan (absoluut of percentage) en samenvattende indicatoren voor de groepen (bijvoorbeeld tabel 4) . In het onderwerp van de combinatietabel wordt de bevolking in groepen verdeeld, niet op basis van één, maar op basis van verschillende kenmerken (bijvoorbeeld tabel 2).

Bij het samenstellen van tabellen moet u zich door het volgende laten leiden algemene regels.

1. Het onderwerp van de tabel bevindt zich in het linker (minder vaak - bovenste) deel en het predikaat - in het rechter (minder vaak - onderste).

2. Kolomkoppen bevatten de namen van indicatoren en hun meeteenheden.

3. De laatste rij completeert de tabel en bevindt zich aan het einde, maar soms is dit de eerste: in dit geval wordt de vermelding "inclusief" in de tweede rij geplaatst en bevatten de daaropvolgende rijen de componenten van de laatste rij.

4. Numerieke gegevens worden binnen elke kolom met dezelfde mate van nauwkeurigheid geregistreerd, waarbij de cijfers van getallen onder de cijfers worden geplaatst en het gehele deel wordt gescheiden door een decimaalteken.

5. De tabel mag niet bevatten lege cellen: als de gegevens nul zijn, wordt een “–” teken (streepje) geplaatst; als de gegevens niet bekend zijn, wordt de vermelding "geen informatie" geplaatst of wordt het teken "..." (weglatingsteken) geplaatst. Als de indicatorwaarde niet nul is, maar de eerste aanzienlijk cijfer verschijnt na de geaccepteerde nauwkeurigheidsgraad, dan wordt een registratie van 0,0 gemaakt (als er bijvoorbeeld een nauwkeurigheidsgraad van 0,1 is aangenomen).

Soms worden statistische tabellen aangevuld met grafieken als het doel is een bepaald kenmerk van de gegevens te benadrukken en deze te vergelijken. Grafische vorm is de meest effectieve vorm om gegevens te presenteren vanuit het perspectief van hun perceptie. Met behulp van grafieken wordt visualisatie van de kenmerken van de structuur, dynamiek, onderlinge relaties van verschijnselen en hun vergelijking bereikt.

Statistische grafieken– dit zijn conventionele afbeeldingen van numerieke grootheden en hun relaties met behulp van lijnen, geometrische vormen, tekeningen of geografische kaarten. De grafische vorm vergemakkelijkt de overweging van statistische gegevens, maakt ze visueel, expressief en zichtbaar. Grafieken hebben echter bepaalde beperkingen: ten eerste kan een grafiek niet zoveel gegevens bevatten als een tabel; Bovendien toont de grafiek altijd afgeronde gegevens - niet exact, maar bij benadering. De grafiek wordt dus alleen gebruikt voor weergave algemene situatie, geen details. Het laatste nadeel is de bewerkelijkheid van het plotten. Het kan worden overwonnen door te gebruiken persoonlijke computer(bijvoorbeeld "Diagram Wizard" uit het pakket Microsoft Office Excel).

Volgens de methode voor het construeren van afbeeldingen zijn ze onderverdeeld in diagrammen, cartogrammen En kaartdiagrammen.

De meest voorkomende manier grafisch beeld gegevens zijn diagrammen, die in de volgende typen voorkomen: lineair, radiaal, puntig, vlak, volumetrisch, figuurlijk. Het type diagrammen hangt af van het type gegevens dat wordt gepresenteerd en de constructietaak. In ieder geval moet de grafiek vergezeld gaan van een titel - boven of onder het grafiekveld. De titel geeft aan welke indicator wordt getoond, voor welk gebied en voor welk tijdstip.

Lineaire grafieken worden gebruikt om kwantitatieve variabelen weer te geven: kenmerken van variaties in hun waarden, dynamiek, relaties tussen variabelen. Gegevensvariatie wordt geanalyseerd met behulp van distributie veelhoek, cumuleert(de “kleiner dan”-curve) en ogiven(de ‘meer dan’-curve). De distributiepolygoon wordt besproken in onderwerp 4 (bijv. Fig. 5). Om cumulaties te construeren, worden de waarden van de variërende karakteristieken uitgezet langs de abscis-as, en de geaccumuleerde totalen van frequenties of frequenties (vanaf f 1 tot ∑ F). Om een ​​ogief te construeren, worden de geaccumuleerde totalen van frequenties op de ordinaat-as geplaatst. omgekeerde volgorde(van ∑ F voor f 1). Cumulatief en volgens tabel. 4. afgebeeld in afb. 1.

Rijst. 1. Cumuleert en ogiva van de distributie van goederen volgens douanewaarde

Het gebruik van lijngrafieken bij de analyse van dynamiek wordt besproken in onderwerp 5 (bijv. figuur 13), en het gebruik ervan voor het analyseren van relaties wordt besproken in onderwerp 6 (bijv. figuur 21). Onderwerp 6 behandelt ook het gebruik van spreidingsdiagrammen (bijvoorbeeld Figuur 20).

Lijngrafieken zijn onderverdeeld in eendimensionaal, gebruikt om gegevens over een enkele variabele weer te geven, en tweedimensionaal– op twee variabelen. Een voorbeeld van een eendimensionale lineaire grafiek is een distributiepolygoon, en een tweedimensionale is een regressielijn (bijvoorbeeld figuur 21).

Soms wanneer grote veranderingen indicatoren worden op logaritmische schaal gebruikt. Als de indicatorwaarden bijvoorbeeld variëren van 1 tot 1000, kan dit problemen opleveren bij het construeren van een grafiek. In dergelijke gevallen gaan we verder met logaritmen van de indicatorwaarden, die niet zo veel zullen verschillen: LG 1 = 0, LG 1000 = 3.

Te midden van vlak Afhankelijk van de gebruiksfrequentie worden staafdiagrammen (histogrammen) onderscheiden, waarbij de indicator wordt gepresenteerd in de vorm van een kolom, waarvan de hoogte overeenkomt met de waarde van de indicator (bijvoorbeeld figuur 4).

De evenredigheid van het gebied van een bepaalde geometrische figuur met de waarde van de indicator ligt ten grondslag aan andere soorten vlakke diagrammen: driehoekig, vierkant, rechthoekig. U kunt ook een vergelijking van de gebieden van een cirkel gebruiken - in dit geval wordt de straal van de cirkel gespecificeerd.

Strokendiagram presenteert indicatoren in de vorm van horizontaal langwerpige rechthoeken, maar verschilt verder niet van een staafdiagram.

Van de vlakke diagrammen wordt het vaak gebruikt cirkeldiagram, dat wordt gebruikt om de structuur van de bestudeerde populatie te illustreren. De hele set wordt als 100% genomen, de totale oppervlakte van de cirkel komt ermee overeen, de gebieden van de sectoren komen overeen met delen van de set. Laten we een sectordiagram maken van de structuur van de buitenlandse handel van de Russische Federatie in 2006 volgens de gegevens in de tabel. 2 (zie afb. 2). Bij het gebruik van computerprogramma's worden cirkeldiagrammen in driedimensionale vorm geconstrueerd, dat wil zeggen niet in twee, maar in drie vlakken (zie figuur 3).

Rijst. 2. Eenvoudig cirkeldiagram Afb. 3. 3D-cirkeldiagram

Voorgestelde (beeld)diagrammen verbeteren de helderheid van het beeld, omdat ze een tekening van de afgebeelde indicator bevatten, waarvan de grootte overeenkomt met de grootte van de indicator.

Bij het construeren van een grafiek is alles even belangrijk: goede keuze grafische afbeeldingen, verhoudingen, naleving van de regels van grafisch ontwerp. Deze kwesties worden in meer detail behandeld in en.

Cartogrammen en kaartdiagrammen worden gebruikt om de geografische kenmerken van de bestudeerde verschijnselen weer te geven. Ze tonen de locatie van het fenomeen dat wordt bestudeerd, de intensiteit ervan in een bepaald gebied - in een republiek, regio, economisch of administratief district, enz. De constructie van cartogrammen en cartodiagrammen wordt bijvoorbeeld besproken in de gespecialiseerde literatuur.

UE FPB MITSO

Afdeling Logistiek

SURS nr. 1

in de discipline Statistiek over het onderwerp: “Methoden en vormen voor het presenteren van statistische informatie”

Uitgevoerd

2e jaars student

Faculteit MEOiM d/o

groepen 916

Verina E.A.

Gecontroleerd door de docent

Bondar S.V.

Minsk, 2010

Interpretatie van de grafische methode om statistische gegevens als special weer te geven teken systeem- kunstmatige gebarentaal - wordt geassocieerd met de ontwikkeling van de semiotiek, de wetenschap van tekens en tekensystemen.

Een statistische grafiek is een tekening waarin statistische aggregaten, gekenmerkt door bepaalde indicatoren, worden beschreven met behulp van conventionele geometrische afbeeldingen of tekens. De presentatie van tabelgegevens in de vorm van een grafiek maakt een sterkere indruk dan cijfers, stelt u in staat de resultaten van statistische observaties beter te begrijpen, ze correct te interpreteren, vergemakkelijkt het begrip van statistisch materiaal aanzienlijk, maakt het visueel en toegankelijk. Dit betekent echter niet dat de grafieken louter illustratief zijn. Ze bieden nieuwe kennis over het onderzoeksonderwerp, omdat ze een methode zijn om de oorspronkelijke informatie samen te vatten.

Bij het construeren van een grafisch beeld moeten een aantal eisen in acht worden genomen. Allereerst moet de grafiek behoorlijk visueel zijn, aangezien het hele punt van een grafische weergave als analysemethode is om statistische indicatoren duidelijk weer te geven. Bovendien moet het schema expressief, begrijpelijk en begrijpelijk zijn.

De grafiek bestaat uit een grafische afbeelding en hulpelementen. Een grafische afbeelding is een reeks lijnen, vormen en punten die statistische gegevens weergeven. Diametrische tekens, tekeningen of afbeeldingen die in statistische grafieken worden gebruikt, zijn divers. Dit zijn punten, rechte lijnsegmenten, tekens in de vorm van figuren verschillende vormen, arcering of kleuring (cirkels, vierkanten, rechthoeken, enz.). Deze tekens worden gebruikt om statistische waarden te vergelijken die de absolute en relatieve omvang van de vergeleken populaties weergeven. De vergelijking op de grafiek wordt gemaakt op basis van enkele metingen: het gebied of de lengte van een van de zijden van de figuur, de locatie van de punten, hun dichtheid, de dichtheid van de schaduw, de intensiteit of kleur van de kleur.

Ondersteunende elementen omvatten algemene titel, symbolen, coördinatenassen, schalen met schalen en een numeriek raster.

Verbale uitleg (uitleg van de grafiek) van geometrische afbeeldingen die in de grafiek zijn geplaatst, verschillend in configuratie, arcering of kleur, stellen u in staat mentaal over te gaan van geometrische afbeeldingen naar de verschijnselen en processen die in de grafiek worden weergegeven.

Statistische grafieken gebruiken meestal een systeem van rechthoekige coördinaten, maar er zijn ook grafieken die zijn gebaseerd op het principe van poolcoördinaten (cirkelvormige grafieken).

Wanneer een grafiek in rechthoekige coördinaten is geconstrueerd, worden de kenmerken van de statistische kenmerken van de afgebeelde verschijnselen of processen in een bepaalde volgorde op de horizontale abscis-as en de verticale ordinaat-as geplaatst, en worden de geometrische tekens waaruit de grafiek zelf bestaat geplaatst. in het grafiekveld. Het grafiekveld is de ruimte waarin de geometrische tekens die de grafiek vormen zich bevinden.

Kenmerken op de coördinaatassen kunnen kwalitatief en kwantitatief zijn.

Een van de belangrijke taken van een statistische grafiek is de samenstelling ervan: selectie van statistisch materiaal, keuze van beeldmethode, d.w.z. grafiekformaat. De grootte van de grafiek moet overeenkomen met het doel ervan.

De titel (titel) van de grafiek definieert het probleem dat met behulp van de grafiek wordt opgelost en geeft een beschrijving van de plaats en tijd waarop de grafiek betrekking heeft.

De inscripties langs de schalen geven aan in welke eenheden de kenmerken worden gemeten. De getallen voor de waarden van elke parameter worden op de grensmarkeringen van de schaalschalen geplaatst.

Een schaalschaal is een lijn (meestal recht op een statistische grafiek) met schaalmarkeringen met hun numerieke aanduidingen. Het is beter om deze aanduidingen alleen te maken op markeringen die overeenkomen met ronde cijfers: in dit geval worden tussenliggende markeringen gelezen door te tellen vanaf het dichtstbijzijnde getal dat op de schaalverdeling wordt aangegeven. Volgens de schaalmarkeringen op het diagramveld worden de afmetingen van de afgebeelde verschijnselen of processen uitgezet. Schaalmarkeringen bevinden zich gelijkmatig (uniform, rekenkundige schaal) of ongelijkmatig (functionele schaal, logaritmische schaal) op de schaal.

Functionele schaal - een schaalschaal waarbij de numerieke waarden van de gemarkeerde punten de waarden van het argument uitdrukken, en de locatie van deze punten overeenkomt met de uniform verdeelde waarden van een bepaalde functie van hetzelfde argument. Van de functionele schalen wordt de logaritmische schaal voornamelijk gebruikt in statistische grafieken. Als er bovendien twee grootheden in aanmerking worden genomen, kan een dergelijke schaal op beide of slechts op één ervan worden toegepast (“semi-logaritmische” grafiek of schaal). De afstanden tussen de punten gemarkeerd langs de numerieke markeringen van de logaritmische schaal komen overeen met het verschil in de logaritmen van de overeenkomstige getallen en karakteriseren daarom de relaties tussen de getallen.

Classificatie van soorten grafieken.

Er zijn veel soorten grafische afbeeldingen. Hun classificatie is gebaseerd op een aantal kenmerken:

a) de methode voor het construeren van een grafisch beeld;

b) geometrische tekens die statistische indicatoren en relaties weergeven;

c) problemen opgelost met behulp van grafische afbeeldingen.

Statistische grafieken volgens de vorm van het grafische beeld:

1. Lineair: statistische curven.

2. Vlak: kolom, strook, vierkant, rond, sector, gekruld, punt, achtergrond.

3. Volumetrisch: distributieoppervlakken.

Statistische grafieken voor de constructiemethode en beeldtaken:

1. Diagrammen: vergelijkingsdiagrammen, dynamische diagrammen, structuurdiagrammen.

2. Statistische kaarten: cartogrammen, kaartdiagrammen.

Op basis van de constructiemethode worden statistische grafieken onderverdeeld in diagrammen en statistische kaarten. Diagrammen zijn de meest gebruikelijke methode voor grafische weergave. Dit zijn grafieken van kwantitatieve relaties. De typen en methoden van hun constructie zijn gevarieerd. Diagrammen worden gebruikt voor visuele vergelijking verschillende aspecten(ruimtelijke, temporele, enz.) waarden die onafhankelijk van elkaar zijn: territoria, bevolking, enz. In dit geval wordt de vergelijking van de bestudeerde populaties gemaakt op basis van een significant variërend kenmerk. Statistische kaarten - grafieken van kwantitatieve verdeling over een oppervlak. Volgens hun hoofddoel zijn ze nauw verwant aan diagrammen en zijn ze alleen specifiek in de zin dat ze conventionele afbeeldingen van statistische gegevens op een contourlijn weergeven. geografische kaart, d.w.z. ze tonen de ruimtelijke verdeling of ruimtelijke verdeling van statistische gegevens. Geometrische tekens zijn, zoals hierboven vermeld, punten, lijnen of vlakken, of geometrische lichamen. In overeenstemming hiermee wordt onderscheid gemaakt tussen punt-, lineaire, vlakke en ruimtelijke (volumetrische) grafieken.

Bij het construeren van spreidingsdiagrammen worden verzamelingen punten gebruikt als grafische afbeeldingen; bij het construeren van lineaire lijnen. Het basisprincipe van het construeren van alle vlakke diagrammen is dat statistische grootheden worden weergegeven in de vorm van geometrische figuren en op hun beurt worden verdeeld in staaf-, strook-, cirkel-, vierkant- en gekruld-diagrammen.

Statistische kaarten zijn grafisch onderverdeeld in cartogrammen en cartodiagrammen.

Afhankelijk van het takenpakket dat wordt opgelost, worden vergelijkingsdiagrammen, structuurdiagrammen en dynamische diagrammen onderscheiden.

De meest gebruikte grafieken voor het weergeven van variatiereeksen, dat wil zeggen relaties tussen attribuutwaarden en overeenkomstige frequenties of relatieve frequenties, zijn polygoon, histogram en cumulatief.

Veelhoek meestal gebruikt om discrete series weer te geven. Om een ​​polygoon in een rechthoekig coördinatensysteem te construeren, worden de waarden van het argument, d.w.z. opties, uitgezet op de abscis-as op een willekeurig gekozen schaal, en op de ordinaat-as, ook op een willekeurig gekozen schaal, de waarden van frequenties of relatieve frequenties. De schaal is zo gekozen dat de nodige duidelijkheid gewaarborgd is en de tekening het gewenste formaat heeft. Vervolgens worden in dit coördinatensysteem punten geconstrueerd, waarvan de coördinaten paren overeenkomstige getallen uit de variatiereeks zijn. De resulterende punten worden opeenvolgend verbonden door rechte lijnsegmenten. Het uiterst “linkse” punt is verbonden met een punt op de abscis-as, waarvan de abscis zich links van het betreffende punt bevindt, op dezelfde afstand als de abscis van het meest rechtse punt. Op dezelfde manier is het uiterst “rechtse” punt ook verbonden met het x-aspunt.

De onderwijsprestaties van studenten van een bepaalde klasse in de wiskunde worden gekenmerkt door de gegevens in de tabel.

Construeer een frequentiepolygoon.

:

Tekstformulier

Tabelvorm

Statistische tabel

Statistische grafieken zijn conventionele afbeeldingen van numerieke waarden en hun relaties met behulp van lijnen, geometrische vormen, tekeningen of geografische kaarten. De grafische vorm vergemakkelijkt de overweging van statistische gegevens, maakt ze visueel, expressief en zichtbaar. Grafieken hebben echter bepaalde beperkingen: ten eerste kan een grafiek niet zoveel gegevens bevatten als een tabel; Bovendien toont de grafiek altijd afgeronde gegevens - niet exact, maar bij benadering. De grafiek wordt dus alleen gebruikt om de algehele situatie weer te geven en niet om de details weer te geven. Het laatste nadeel is de bewerkelijkheid van het plotten. Dit kan worden verholpen door een personal computer te gebruiken (bijvoorbeeld de "Grafiekwizard" van Microsoft-pakket Office-Excel).

Bepaling van de empirische verdelingsfunctie.

Voorbeeld (empirische) distributiefunctie in de wiskundige statistiek is het een benadering van de theoretische verdelingsfunctie die is geconstrueerd door daaruit steekproeven te nemen.

Definitie

Laten we een steekproef zijn uit de verdeling van een willekeurige variabele gespecificeerd door de verdelingsfunctie. We zullen aannemen dat , waar , onafhankelijke willekeurige variabelen zijn die zijn gedefinieerd op een bepaalde ruimte van elementaire uitkomsten. Laten . Laten we een willekeurige variabele definiëren op de volgende manier:

waar is de gebeurtenisindicator en is de Heaviside-functie. De monsterverdelingsfunctie is dus op een bepaald punt gelijk aan de relatieve frequentie van monsterelementen die de waarde niet overschrijden. De willekeurige variabele wordt de steekproefverdelingsfunctie van de willekeurige variabele genoemd en is een benadering voor de functie. Er is een resultaat dat aantoont dat wanneer de functie uniform convergeert naar , en de mate van convergentie aangeeft.

staafdiagram

Een histogram wordt gebruikt om verdelingen grafisch weer te geven voortdurend wisselende eigenschappen en bestaat uit rechthoeken die aan elkaar grenzen, zoals weergegeven in Fig. 2.1. De basis van elke rechthoek is gelijk aan de breedte van het groeperingsinterval, en de hoogte ervan is zodanig vierkant rechthoek is evenredig met de frequentie (of frequentie) van vallen binnen een bepaald interval. Als de rij geen interval heeft, wordt de breedte van alle kolommen willekeurig gekozen, maar hetzelfde. De hoogten van de rechthoeken moeten dus evenredig zijn met de waarden

Waar n ik- frequentie i-de groeperingsinterval; Hoi- breedte i e groeperingsinterval.

In een histogramgrafiek wordt de basis van de rechthoeken uitgezet langs de x-as ( X), en de hoogte ligt langs de ordinaatas ( bij) rechthoekig coördinatensysteem.

In gevallen waarin de breedte van alle groeperingsintervallen echter hetzelfde is, zal het uiterlijk van het histogram niet veranderen als de waarden niet langs de ordinaat worden uitgezet p ik en de frequenties van de intervallen n ik.

Rijst. 2.1. Histogram van de verdeling van resultaten in het vorige voorbeeld (wanneer de breedte van sommige groeperingsintervallen niet gelijk is).

Om het principe van het construeren van een histogram niet te schenden (de oppervlakten van de rechthoeken zijn evenredig met de frequenties van de intervallen), kunnen in dit geval niet langer de frequenties langs de ordinaat worden uitgezet, maar de hoogten van de rechthoeken ( die evenredig moet zijn met de verhoudingen) moet worden uitgezet.

Frequentiepolygoon

Een andere veelgebruikte methode voor grafische weergave is een frequentiepolygoon.

De frequentiepolygoon wordt gevormd door een onderbroken lijn die de punten verbindt die overeenkomen met de mediaanwaarden van groeperingsintervallen en de frequenties van deze intervallen. De mediaanwaarden worden langs de as uitgezet X en frequenties – langs de as bij.

Uit een vergelijking van de twee beschouwde methoden voor grafische weergave van empirische verdelingen volgt dat om uit het geconstrueerde histogram een ​​frequentiepolygoon te verkrijgen, het noodzakelijk is om de middelpunten van de hoekpunten van de rechthoeken die het histogram vormen te verbinden met rechte segmenten. Een voorbeeld van een frequentiepolygoon wordt getoond in Fig. 2.2.

Rijst. 2.2. Frequentiepolygoon

Een frequentiepolygoon wordt gebruikt om verdelingen van zowel continue als discrete kenmerken weer te geven. In het geval van een continue verdeling is een frequentiepolygoon een meer geprefereerde methode voor grafische weergave dan een histogram als de grafiek van de empirische verdeling wordt beschreven door een vloeiende afhankelijkheid.

21.Hypothese(Oudgrieks ὑπόθεσις - veronderstelling; van ὑπό - hieronder, onder + θέσις - stelling) - veronderstelling of gok; een verklaring die bewijs vereist, in tegenstelling tot ataxiom

Postulaten waarvoor geen bewijs nodig is. Een hypothese wordt als wetenschappelijk beschouwd als deze voldoet aan het criterium van Popper, d.w.z. kan mogelijk worden geverifieerd door middel van kritische experimenten, en ook of het voldoet aan andere criteria die wetenschap van niet-wetenschap onderscheiden.

Statistische hypothese is een aanname over de eigenschappen van willekeurige variabelen of gebeurtenissen die we willen controleren met behulp van de beschikbare gegevens. Voorbeelden van statistische hypothesen in onderwijsonderzoek:

Hypothese 1. De prestatie van een klas hangt stochastisch (probabilistisch) af van het leerniveau van de leerlingen.

Hypothese 2. Assimilatie initiële cursus Wiskunde verschilt niet significant onder leerlingen die op 6- of 7-jarige leeftijd met hun opleiding zijn begonnen.

Hypothese 3. Probleemgestuurd onderwijs in de eerste klas is effectiever dan traditionele lesmethoden algemene ontwikkeling studenten.

Voorbeeld 1. Het productieproces van sommige medicijnen is behoorlijk complex. Afwijkingen van de technologie die op het eerste gezicht onbeduidend zijn, veroorzaken het verschijnen van zeer giftige bijproducten. De toxiciteit van deze onzuiverheid kan zo hoog zijn dat zelfs een hoeveelheid die niet zou worden gedetecteerd door conventionele chemische analyse schadelijk kan zijn voor de persoon die dit geneesmiddel gebruikt. Als gevolg hiervan wordt een nieuw geproduceerde batch, voordat deze voor de verkoop wordt vrijgegeven, onderworpen aan toxiciteitstesten met behulp van biologische methoden. Kleine doses van het medicijn worden toegediend aan een aantal proefdieren, zoals muizen, en de resultaten worden geregistreerd. Als het medicijn giftig is, sterven alle of bijna alle dieren. Anders is het aantal overlevenden hoog.

Geneesmiddelenonderzoek kan tot een van de volgende leiden mogelijke manieren acties: de partij vrijgeven voor verkoop (a 1), de partij terugsturen naar de leverancier voor wijziging of eventueel vernietiging (a 2).

De twee soorten fouten die verband houden met acties a 1 en a 2 zijn totaal verschillend, en het belang van het vermijden ervan is ook verschillend. Beschouw eerst het geval waarin actie 1 wordt toegepast, terwijl actie 2 de voorkeur heeft. Het medicijn is gevaarlijk voor de patiënt, terwijl het als veilig wordt erkend. Dit soort fouten kan de dood tot gevolg hebben bij patiënten die dit medicijn gebruiken. Dit is een fout van het eerste type, omdat het voor ons belangrijker is om deze te vermijden.

Beschouw het geval waarin actie een 2 wordt ondernomen, terwijl een 1 meer de voorkeur heeft. Dit betekent dat vanwege onnauwkeurigheden in het experiment een batch van een niet-giftig medicijn als gevaarlijk werd geclassificeerd. De gevolgen van een fout kunnen zich uiten in financieel verlies en hogere kosten van het medicijn. Het per ongeluk afwijzen van een volkomen veilig medicijn is echter uiteraard minder onwenselijk dan het incidentele overlijden van patiënten. Het afwijzen van een niet-giftige batch van een medicijn is een type II-fout.

Aanvaardbare waarschijnlijkheid van type I-fout(Rkr) kan gelijk zijn aan 5% of 1% (0,05 of 0,01).

22. Statistische hypothesetesten Het testen van statistische hypothesen is het proces waarbij wordt besloten of een statistische hypothese die wordt overwogen inconsistent is met een geobserveerde steekproef van gegevens.

Statistische toets of statistische toets- een strikte wiskundige regel volgens welke het wordt geaccepteerd of afgewezen statistische hypothese.

· 23.classificatie van hypothesen

· eenvoudig– er wordt één omstandigheid aangegeven, bij aan- of afwezigheid waarvan de wettelijke norm geldig is;

· complex– de aanwezigheid in de hypothese van twee of meer omstandigheden tegelijk, die samen de werking van de norm bepalen;

· alternatief– er zijn meerdere varianten van omstandigheden (alternatief) aangegeven waaronder de norm van toepassing kan zijn. In dit geval, wanneer een van deze situaties zich voordoet, is de norm geldig;

Parametrische hypothese noemde de hypothese over waarden van distributieparameters of over de vergelijkende omvang van de parameters van twee distributies. Een voorbeeld van een parametrische statistische hypothese is de hypothese over gelijkheid van wiskundige verwachtingen twee normale populaties.

Niet-parametrische hypothesen worden hypothesen over genoemd willekeurige distributievorm hoeveelheden.

Nul, De hoofd- of toetsbare hypothese is de aanvankelijk naar voren gebrachte hypothese, die wordt aangegeven H0.

Statistische hypothese vertegenwoordigt een aanname over de verdelingswet van een willekeurige variabele of over de parameters van deze wet, geformuleerd op basis van een steekproef. Voorbeelden van statistische hypothesen zijn de volgende: de populatie wordt verdeeld volgens een exponentiële wet; de wiskundige verwachtingen van twee exponentieel verdeelde steekproeven zijn gelijk aan elkaar. In de eerste werd een aanname gedaan over de vorm van de verdelingswet, en in de tweede over de parameters van de twee verdelingen. Hypotheses die niet zijn gebaseerd op aannames over een specifiek type distributierecht worden genoemd niet parametrisch, anders - parametrisch.

Een hypothese die stelt dat er geen verschil is tussen de kenmerken die worden vergeleken, en dat de waargenomen afwijkingen alleen worden verklaard door willekeurige fluctuaties in de steekproeven op basis waarvan de vergelijking wordt gemaakt, wordt genoemd nul(hoofd)hypothese en aanduiding N 0 . Samen met de hoofdhypothese overwegen we ook alternatief(concurrerende, tegenstrijdige) hypothese N 1. En als de nulhypothese wordt verworpen, zal de alternatieve hypothese optreden.

Er zijn eenvoudige en complexe hypothesen. Hypothese wordt genoemd eenvoudig, als het op unieke wijze de distributieparameter van een willekeurige variabele karakteriseert. Als  bijvoorbeeld een parameter is van de exponentiële verdeling, dan is de hypothese N 0 over gelijkheid  = 10 – eenvoudige hypothese. Complex Een hypothese genoemd die bestaat uit een eindige of oneindige reeks eenvoudige hypothesen. Complexe hypothese N 0 over ongelijkheid  > 10 bestaat uit een oneindig aantal eenvoudige hypothesen N 0 over gelijkheid  =b ik, Waar b ik– elk getal groter dan 10. Hypothese N 0 dat de wiskundige verwachting van een normale verdeling gelijk is aan twee met een onbekende variantie is ook complex. Een complexe hypothese is een aanname over de verdeling van een willekeurige variabele X volgens de normale wet, als specifieke waarden van de wiskundige verwachting en spreiding niet vastliggen.

Het testen van hypothesen is gebaseerd op de berekening van een willekeurige variabele - een criterium waarvan de exacte of geschatte verdeling bekend is. Laten we deze hoeveelheid aangeven met z, de waarde ervan is een functie van de voorbeeldelementen z=z(x 1 , x 2 , …, x n). De procedure voor het testen van hypothesen kent aan elke criteriumwaarde een van de twee beslissingen toe: de hypothese accepteren of verwerpen. De gehele monsterruimte en dienovereenkomstig de reeks criteriumwaarden is dus verdeeld in twee onsamenhangende subsets S 0 en S 1. Als de criteriumwaarde z valt in het gebied S 0, dan wordt de hypothese geaccepteerd, en indien in de regio S 1, – de hypothese wordt verworpen. Een stelletje S 0 wordt gebeld gebied van acceptatie van de hypothese of gebied aanvaardbare waarden , en het stel S 1 – gebied van hypothese-afwijzing of kritisch gebied. De keuze voor het ene gebied bepaalt op unieke wijze het andere gebied.

Aanvaarding of verwerping van de hypothese N 0 in een willekeurige steekproef komt met enige waarschijnlijkheid overeen met de waarheid en dienovereenkomstig zijn er twee soorten fouten mogelijk. Een fout van het eerste type treedt op met waarschijnlijkheid  wanneer een correcte hypothese wordt verworpen N 0 en de concurrerende hypothese wordt geaccepteerd N 1. Een fout van het tweede type treedt op met waarschijnlijkheid  wanneer een onjuiste hypothese wordt aanvaard N 0, terwijl de concurrerende hypothese waar is N 1 . Waarschijnlijkheid van vertrouwen is de kans dat je geen type I-fout maakt en de juiste hypothese accepteert N 0 . Waarschijnlijkheid van het verwerpen van een valse hypothese N 0 wordt gebeld criterium macht. Bij het testen van de hypothese zijn er dus vier mogelijke uitkomsten mogelijk, tabel. 3.1.

Tabel 3.1.

Beschouw bijvoorbeeld het geval waarin een onbevooroordeelde schatting van de parameter  wordt berekend op basis van een volumemonster N, en deze schatting heeft een distributiedichtheid F(), afb. 3.1.

Rijst. 3.1. Gebieden en afwijkingen van de hypothese

Laten we aannemen dat de werkelijke waarde van de geschatte parameter gelijk is T. Als we de hypothese beschouwen N 0 over gelijkheid  = T, hoe groot moet dan het verschil zijn tussen  en T om deze hypothese te verwerpen. Antwoord deze vraag kan in statistische zin worden gedaan door de waarschijnlijkheid te beschouwen van het bereiken van een bepaald verschil tussen  en T gebaseerd op de steekproefverdeling van parameter .

Het is redelijk om te geloven dezelfde waarden de waarschijnlijkheid dat parameter  de onder- en bovengrenzen van het interval overschrijdt. In veel gevallen stelt deze aanname ons in staat het betrouwbaarheidsinterval te minimaliseren, d.w.z. de kracht van het verificatiecriterium vergroten. De totale waarschijnlijkheid dat de parameter  het interval met grenzen  1– /2 en   /2 overschrijdt, is de waarde  . Deze waarde moet zo klein worden gekozen dat het onwaarschijnlijk is dat het interval wordt overschreden. Als de parameterschatting binnen een bepaald interval valt, dan is er in dit geval geen reden om te twijfelen aan de hypothese die wordt getest. Daarom is de gelijkheidshypothese  = T kan worden aanvaard. Maar als na ontvangst van de steekproef blijkt dat de schatting de vastgestelde grenzen overschrijdt, dan zijn er in dit geval serieuze redenen om de hypothese te verwerpen N 0 . Hieruit volgt dat de kans op het maken van een type I-fout gelijk is aan  (gelijk aan het significantieniveau van het criterium).

Als we bijvoorbeeld aannemen dat de werkelijke waarde van de parameter feitelijk gelijk is aan T+D, dan volgens de hypothese N 0 over gelijkheid  = T– de waarschijnlijkheid dat de parameterschatting  binnen het aanvaardingsgebied van de hypothese zal vallen, zal  zijn, Fig. 3.2.

Voor een gegeven steekproefomvang kan de kans op het begaan van een type I-fout worden verkleind door het significantieniveau  te verlagen. Dit vergroot echter de kans op een type II-fout  (de kracht van het criterium neemt af). Een soortgelijke redenering kan worden uitgevoerd voor het geval dat de werkelijke waarde van de parameter gelijk is TD.

De enige manier het verkleinen van beide kansen betekent het vergroten van de steekproefomvang (de distributiedichtheid van de parameterschatting wordt “smaller”). Bij het kiezen van een kritiek gebied laten we ons leiden door de regel van Neyman-Pearson: het kritieke gebied moet zo worden gekozen dat de waarschijnlijkheid  klein is als de hypothese waar is, en anders groot. De keuze voor een bepaalde waarde voor  is echter relatief willekeurig. Gangbare waarden variëren van 0,001 tot 0,2. Om handmatige berekeningen te vereenvoudigen, zijn tabellen met intervallen met grenzen  1– /2 en   /2 voor typische waarden van  en op verschillende manieren het construeren van een criterium.

Bij het kiezen van een significantieniveau moet rekening worden gehouden met de kracht van de test onder de alternatieve hypothese. Soms blijkt een hoge macht van het criterium belangrijker te zijn dan een laag significantieniveau, en wordt de waarde ervan relatief groot gekozen, bijvoorbeeld 0,2. Deze keuze is gerechtvaardigd als de gevolgen van fouten van het tweede type groter zijn dan die van het eerste type. Bijvoorbeeld als het wordt afgewezen juiste oplossing"Ga door met gebruikerservaring met huidige wachtwoorden", dan zal een fout van het eerste type leiden tot enige vertraging in de normale werking van het systeem in verband met het wijzigen van wachtwoorden. Als wordt besloten om wachtwoorden niet te wijzigen, ondanks het gevaar van ongeoorloofde toegang onbevoegde personen informatie, zal deze fout ernstiger gevolgen hebben.

Afhankelijk van de essentie van de hypothese die wordt getest en de gebruikte maatstaven voor de discrepantie tussen de beoordeling van het kenmerk en de theoretische waarde ervan, worden verschillende criteria gebruikt. De meest gebruikte criteria voor het testen van hypothesen over distributiewetten zijn de chikwadraattoetsen van Pearson, Kolmogorov, Mises en Wilcoxon, en de Fisher- en Student-toetsen voor parameterwaarden.

25. KRITISCHE REGIO- een zodanig deel van de steekproefruimte dat het voorkomen van een waargenomen waarde van een willekeurige variabele daarin, waarvan de verdeling verband houdt met de geteste hypothese, de verwerping van deze hypothese met zich meebrengt

Kritieke punten(grenzen) k kr zijn de punten die het kritieke gebied scheiden van het gebied waar de hypothese wordt aanvaard.
Er zijn eenzijdige (rechts- of linkszijdige) en tweezijdige kritische gebieden.

Willekeurige meetfouten worden gevormd onder invloed groot nummer factoren, dat het meetproces begeleidt. Elke specifieke situatie heeft zijn eigen mechanisme voor het genereren van fouten. Daarom is het logisch om aan te nemen dat elke situatie zijn eigen type foutverdeling moet hebben. In veel gevallen is het echter mogelijk om enkele aannames te doen over de vorm van de verdelingsfunctie, zelfs voordat er metingen zijn gedaan, zodat na metingen alleen nog het bepalen van de waarden van sommige parameters in de uitdrukking voor de functie overblijft. geschatte distributiefunctie.

Willekeurige fouten karakteriseren de onzekerheid van onze kennis over de werkelijke waarde van de gemeten grootheid, verkregen als resultaat van observaties. Volgens K. Shannon wordt de mate van onzekerheid van de beschreven situatie beschreven willekeurige variabele X is de entropie


wat een functie is van de differentiële distributiefunctie. Aangenomen kan worden dat elk meetproces zo is vormgegeven dat de onzekerheid van het waarnemingsresultaat het grootst is binnen bepaalde grenzen, bepaald door de toelaatbare foutwaarden. Daarom zouden de meest waarschijnlijke verdelingen die moeten zijn waarin de entropie een maximum bereikt.

Laten we, om het type van de meest waarschijnlijke verdelingen te identificeren, een aantal van de meest waarschijnlijke bekijken typische gevallen.

1. In de klasse van verdelingen van waarnemingsresultaten hebben ze een bepaalde spreidingszone tussen de waarden x = b En x = een breedte b-een=2a, laten we er een vinden die de entropie maximaliseert in aanwezigheid van beperkende voorwaarden:
, , ,
waar is de wiskundige verwachting van de observatieresultaten. De oplossing voor het probleem wordt gevonden met behulp van de Lagrange-vermenigvuldigingsmethode.

De gewenste verdelingsdichtheid van waarnemingsresultaten wordt beschreven door de uitdrukking

Laten we de numerieke kenmerken van een uniforme verdeling definiëren. De wiskundige verwachting van de willekeurige fout wordt gevonden met behulp van formule (10):

De variantie van een willekeurige, uniform verdeelde fout kan worden gevonden met behulp van formule (18):

Vanwege de symmetrie van de verdeling ten opzichte van de wiskundige verwachting, moet de asymmetriecoëfficiënt gelijk zijn aan nul:

Om kurtosis te bepalen, vinden we eerst het vierde moment van willekeurige fout:

Daarom

Concluderend vinden we dat de waarschijnlijkheid dat een willekeurige fout binnen een bepaald interval valt gelijk is aan het gearceerde gebied in figuur 7

2. In de klasse van verdelingen van waarnemingsresultaten met een bepaalde spreiding vinden we er een die de entropie maximaliseert als er beperkingen zijn:

, , , .

De oplossing voor dit probleem wordt ook gevonden met behulp van de Lagrange-multipliermethode. De gewenste verdelingsdichtheid van waarnemingsresultaten wordt beschreven door de uitdrukking

De verdeling beschreven door vergelijkingen (25) en (26) wordt genoemd normaal of Gaussische verdeling.

Figuur 8 toont de normale verdelingscurven van willekeurige fouten voor verschillende betekenissen standaardafwijking .

De figuur laat zien dat naarmate de standaardafwijking toeneemt, de verdeling steeds diffuser wordt, de kans op grote foutwaarden toeneemt en de kans op kleinere fouten afneemt, d.w.z. de spreiding van observatieresultaten neemt toe.

Laten we de waarschijnlijkheid berekenen dat een waarnemingsresultaat binnen een bepaald gespecificeerd interval valt:

Laten we de variabelen vervangen:

Dan krijgen we de volgende uitdrukking voor de gewenste waarschijnlijkheid:

Integralen staan ​​erin vierkante haakjes, worden niet uitgedrukt in elementaire functies Daarom worden ze berekend met behulp van de zogenaamde genormaliseerde normale verdeling met een differentiële functie

Gebruik van de functie Ф( z) wordt de waarschijnlijkheid gevonden als

(29)

Bij het gebruik van deze formule moet men de identiteit in gedachten houden

Rechtstreeks voortvloeiend uit de definitie van de functie Ф( z).

De brede verdeling van de normale verdeling van fouten in de meetpraktijk wordt verklaard door de centrale limietstelling van de waarschijnlijkheidstheorie, een van de meest opmerkelijke wiskundige stellingen, aan de ontwikkeling waaraan veel vooraanstaande wiskundigen deelnamen - Moivre, Laplace, Gauss, Tsjebysjev en Lyapunov. Centrale limietstelling stelt dat de verdeling van willekeurige fouten vrijwel normaal zal zijn wanneer de resultaten van observatie worden gevormd onder de invloed van een groot aantal onafhankelijk werkende factoren, die elk slechts een klein effect hebben vergeleken met het totale effect van alle andere.

3. Stel dat de resultaten van waarnemingen normaal verdeeld zijn, maar dat hun standaarddeviatie een willekeurige waarde is die van experiment tot experiment varieert. Deze aanname is voorzichtiger dan de aanname van invariantie over de gehele meettijd. In dit geval, op dezelfde manier redenerend als voorheen, is het gemakkelijk om te ontdekken dat de entropie een maximum bereikt als de waarnemingsresultaten een Laplace-verdeling hebben met dichtheid

(30)

waar is de wiskundige verwachting, is de standaardafwijking van de waarnemingsresultaten. De Laplace-verdeling moet worden gebruikt in gevallen waarin de nauwkeurigheidskenmerken van tevoren onbekend zijn of in de loop van de tijd onstabiel zijn.

De differentiële verdelingsfunctie van willekeurige fouten wordt verkregen door het vervangen van en in uitdrukking (30):

De asymmetrie van de verdeling is nul, aangezien de verdeling symmetrisch rond nul is, en de kurtosis volgens formule (22) is

Dus vergeleken met de normale verdeling ( Ex = 0) uniforme verdeling is platter ( Ex= -1,2), en de Laplace-verdeling heeft meer pieken ( Ex = 3).

Formulieren voor het presenteren van statistische gegevens.

Statistieken moeten zo worden gepresenteerd dat ze kunnen worden gebruikt. Er zijn 3 hoofdgerechten Presentatieformulieren voor statistische gegevens:

Tekst – opname van gegevens in tekst;

Tabellarisch – presentatie van gegevens in tabellen;

Grafisch – gegevens uitdrukken in de vorm van grafieken.

Tekstformulier gebruikt als er een kleine hoeveelheid digitale gegevens is.

Tabelvorm wordt het vaakst gebruikt omdat het een effectievere vorm is om statistische gegevens te presenteren. In tegenstelling tot wiskundige tabellen, die op basis van beginvoorwaarden het mogelijk maken een of ander resultaat te verkrijgen, vertellen statistische tabellen de taal van getallen over de objecten die worden bestudeerd.

Statistische tabel is een systeem van rijen en kolommen waarin statistische informatie over sociaal-economische verschijnselen in een bepaalde volgorde en samenhang wordt gepresenteerd.

Er wordt onderscheid gemaakt tussen het onderwerp en het predikaat van een statistische tabel. Het onderwerp geeft het object aan dat wordt gekarakteriseerd: eenheden van de populatie, of groepen eenheden, of de populatie als geheel. Het predikaat geeft kenmerken van het onderwerp weer, meestal in numerieke vorm. Er is een tabeltitel vereist, die aangeeft tot welke categorie en tot welk tijdstip de tabelgegevens behoren.

Afhankelijk van de aard van het onderwerp zijn statistische tabellen onderverdeeld in eenvoudig, groeps- en combinatorisch. In het onderwerp van een eenvoudige tabel wordt het studieobject niet in groepen verdeeld, maar wordt een lijst van alle eenheden van de populatie gegeven, of wordt de populatie als geheel aangegeven. In het onderwerp van de groepstabel wordt het studieobject verdeeld in groepen volgens één kenmerk, en het predikaat geeft het aantal eenheden in de groepen aan (absoluut of percentage) en samenvattende indicatoren voor de groepen. In het onderwerp van de combinatietabel is de bevolking verdeeld in groepen, niet op basis van één, maar op basis van verschillende kenmerken.

Bij het samenstellen van tabellen moet u zich laten leiden door de volgende algemene regels.

Het onderwerp van de tabel bevindt zich in het linker (minder vaak - bovenste) deel en het predikaat - in het rechter (minder vaak - onderste).

Kolomkoppen bevatten de namen van indicatoren en hun meeteenheden.

De samenvattingsregel completeert de tabel en bevindt zich aan het einde, maar soms is dit de eerste: in dit geval wordt de vermelding "inclusief" op de tweede regel geplaatst en bevatten de daaropvolgende regels de componenten van de samenvattingsregel.

Numerieke gegevens worden binnen elke kolom met dezelfde mate van nauwkeurigheid vastgelegd, waarbij de cijfers van de getallen onder de cijfers worden geplaatst en het gehele deel wordt gescheiden door een decimaalpunt.

Er mogen geen lege cellen in de tabel voorkomen: als de gegevens nul zijn, wordt een “–” teken (streepje) geplaatst; als de gegevens niet bekend zijn, wordt de vermelding "geen informatie" geplaatst of wordt het teken "..." (weglatingsteken) geplaatst. Als de waarde van de indicator niet nul is, maar het eerste significante cijfer verschijnt na de geaccepteerde nauwkeurigheidsgraad, wordt 0,0 ingevoerd (als er bijvoorbeeld een nauwkeurigheidsgraad van 0,1 is aangenomen).

Soms worden statistische tabellen aangevuld met grafieken als het doel is een bepaald kenmerk van de gegevens te benadrukken en deze te vergelijken. Grafische vorm is de meest effectieve vorm om gegevens te presenteren vanuit het perspectief van hun perceptie. Met behulp van grafieken wordt visualisatie van de kenmerken van de structuur, dynamiek, onderlinge relaties van verschijnselen en hun vergelijking bereikt.

GRAFISCHE REPRESENTATIE VAN STATISTISCHE GEGEVENS, een methode voor het visueel weergeven en samenvatten van gegevens over sociaal-economische verschijnselen door middel van geometrische afbeeldingen, tekeningen of schematische geografische kaarten en verklarende inscripties daarbij. Grafische weergave statistische gegevens geven duidelijk en duidelijk de relatie weer tussen verschijnselen en processen van het sociale leven, de belangrijkste trends in hun ontwikkeling, de mate van hun verspreiding in de ruimte; stelt je in staat om zowel het geheel van verschijnselen als een geheel als de afzonderlijke delen ervan te zien.

Voor de grafische weergave van statistische gegevens worden verschillende typen gebruikt. statistische grafieken. Elke grafiek bestaat uit een grafische afbeelding en hulpelementen. Deze omvatten: grafiekuitleg, ruimtelijke referentiepunten, schaalreferentiepunten, grafiekveld. Ondersteunende elementen zorgen ervoor dat de grafiek gemakkelijk te lezen, te begrijpen en te gebruiken is. Grafieken kunnen worden geclassificeerd op basis van een aantal kenmerken: afhankelijk van de vorm van het grafische beeld kunnen ze gestippeld, lineair, vlak, ruimtelijk en figuurlijk zijn. Volgens de constructiemethode zijn grafieken onderverdeeld in diagrammen en statistische kaarten.

De meest gebruikelijke methode voor grafische weergave is een diagram. Dit is een tekening waarin statistische gegevens worden gepresenteerd als geometrische figuren of borden, en het gebied waarop deze gegevens betrekking hebben, wordt alleen mondeling aangegeven. Als het diagram op een geografische kaart of op een plattegrond van het gebied waarop statistische gegevens betrekking hebben, wordt geplaatst, wordt de grafiek een kaartdiagram genoemd. Als statistische gegevens worden weergegeven door het overeenkomstige gebied op een geografische kaart of plattegrond te arceren of in te kleuren, wordt de grafiek een cartogram genoemd.

Om statistische gegevens met dezelfde naam te vergelijken, die verschillende objecten of territoria karakteriseren, kunnen worden gebruikt verschillende soorten diagrammen. De meest visuele zijn staafdiagrammen, waarin statistische gegevens worden weergegeven als verticaal langwerpige rechthoeken. Hun duidelijkheid wordt bereikt door de hoogten van de kolommen te vergelijken (Fig. 1).

Als de basislijn verticaal is en de balken horizontaal, wordt het diagram een ​​stripdiagram genoemd. Figuur 2 toont een vergelijkingsstaafdiagram dat het grondgebied van de wereld karakteriseert.

Diagrammen die bedoeld zijn voor popularisering worden soms geconstrueerd in de vorm van standaardfiguren - tekeningen die kenmerkend zijn voor de afgebeelde statistische gegevens, waardoor het diagram expressiever wordt en de aandacht erop wordt gevestigd. Dergelijke diagrammen worden figuurlijk of picturaal genoemd (Fig. 3).

Een grote groep representatieve grafieken bestaat uit structurele diagrammen. De methode voor het grafisch weergeven van de structuur van statistische gegevens is het samenstellen van structurele taart- of cirkeldiagrammen (Fig. 4).

Om de ontwikkeling van verschijnselen in de loop van de tijd weer te geven en te analyseren, worden dynamische diagrammen geconstrueerd: staaf-, strook-, vierkant, cirkelvormig, lineair, radiaal, enz. De keuze van het type diagram hangt af van de kenmerken van de brongegevens en het doel van de studie. Als er bijvoorbeeld een reeks dynamieken is met enigszins ongelijk verdeelde niveaus in de tijd (1913, 1940, 1950, 1980, 2000, 2005), gebruik dan staaf, vierkant of taartpunten. Ze zijn visueel indrukwekkend en worden goed onthouden, maar zijn niet geschikt voor het weergeven van een groot aantal niveaus. Als het aantal niveaus in een dynamiekreeks groot is, dan lijndiagrammen, die het ontwikkelingsproces reproduceren in de vorm van een doorlopende onderbroken lijn (Fig. 5).

Vaak op één lijn grafiek Er zijn verschillende curven gegeven die geven vergelijkende kenmerken dynamiek van verschillende indicatoren of dezelfde indicator in verschillende landen(Afb. 6).

Om de afhankelijkheid van de ene indicator ten opzichte van de andere weer te geven, wordt een relatiediagram gemaakt. Eén indicator wordt genomen als X en de andere als Y (dat wil zeggen een functie van X). Er wordt een rechthoekig coördinatensysteem met schalen voor indicatoren geconstrueerd en er wordt een grafiek in getekend (Fig. 7).

Ontwikkeling computer technologie en applicatiesoftware hebben het mogelijk gemaakt om geografische informatiesystemen (GIS) te creëren die kwalitatief representatief zijn nieuwe fase bij grafische presentatie van informatie. GIS zorgt voor de verzameling, opslag, verwerking, toegang, weergave en verspreiding van ruimtelijk gecoördineerde gegevens; omvatten een groot aantal grafische en thematische databases in combinatie met model- en berekeningsfuncties waarmee u informatie in ruimtelijke (cartografische) vorm kunt presenteren, op verschillende schalen meerlaags elektronische kaarten regio. Op basis van territoriale dekking zijn er mondiale, subcontinentale, staats-, regionale en lokale opvattingen GIS. De onderwerporiëntatie van GIS wordt bepaald door de taken die met behulp ervan worden opgelost, waaronder inventarisatie van hulpbronnen, analyse, beoordeling, monitoring, beheer en planning.

Letterlijk: Gerchuk Ya. Grafische methoden in de statistiek. M., 1968; Theorie van de statistiek / Bewerkt door R. A. Shmoilova. 4e druk. M., 2005. P. 150-83.