Tilastotietojen graafinen esitys. Tilastotietojen graafinen esitys

Tilastotietojen visuaaliseen ja kompaktiin esittämiseen käytetään tilastotaulukoita ja kaavioita (mukaan lukien kaaviot, kartogrammit ja kartogrammit).

Tilastollisen havaintomateriaalin yhteenvedon ja ryhmittelyn tulokset esitetään pääsääntöisesti taulukoiden muodossa.

Taulukko - rationaalisin, visuaalisin ja kompaktin tilastomateriaalin esitysmuoto.

Tilastotaulukko on taulukko, joka sisältää yhteenvedon tutkittavan perusjoukon numeerisen ominaispiirteen yhden tai useamman olennaisen ominaisuuden mukaisesti, yhdistettynä toisiinsa taloudellisen analyysin logiikan avulla.

Kuvassa esitetyn tilastotaulukon pääelementit. 5.1, luo sen asettelu:

Riisi. 5.1. Tilastotaulukko

Taulukkoa laadittaessa numeeriset tiedot sijaitsevat rivien ja kaavioiden leikkauskohdassa. Näin ollen ulkoisesti taulukko on kokoelma sarakkeita ja rivejä, jotka muodostavat sen.

luuranko. Taulukon koko määritetään kertomalla rivien määrä sarakkeiden lukumäärällä.

Tilastotaulukko sisältää kolmenlaisia ​​otsikoita: yleiset, ylä- ja sivuotsikot. Yleinen otsikko heijastaa koko taulukon sisältöä, sijaitsee sen asettelun yläpuolella keskellä ja on ulompi otsikko. Yläotsikot (predikaattiotsikot) kuvaavat sarakkeiden sisältöä ja sivuotsikot (subject headings) kuvaavat rivien sisältöä. Ne ovat sisäisiä otsikoita.

Pöydän luuranko, joka on täynnä otsikoita, muodostaa sen asettelun. Jos kirjoitamme kaavion ja viivojen leikkauspisteeseen numerot, saamme täydellisen tilastotaulukon. Digitaalinen aineisto voidaan esittää absoluuttisilla, suhteellisilla (elintarvikkeiden hintaindeksit) ja keskiarvoilla. Taulukoihin voidaan tarvittaessa liittää huomautus, jolla selvennetään otsikoita, joidenkin indikaattoreiden laskentamenetelmiä, tietolähteitä jne.

Loogisen sisällön mukaan taulukko on ”tilastolause”, jonka pääelementit ovat subjekti ja predikaatti.

Tilastotaulukon aihe sisältää luettelon indikaattoreista, joita kuvaavat numerot. Se voi olla yksi tai useampi aggregaatti, erilliset aggregaattiyksiköt (yritykset, yhdistykset) luettelon järjestyksessä tai ryhmitelty joidenkin kriteerien mukaan (erilliset alueyksiköt, aikajaksot kronologisissa taulukoissa jne.). Yleensä taulukon aihe ilmoitetaan vasemmalla puolella, rivien nimissä.

Tilastotaulukon predikaatti muodostaa indikaattorijärjestelmän, joka luonnehtii tutkimuksen kohdetta eli taulukon aihetta. Predikaatti muodostaa yläotsikot ja muodostaa graafin sisällön loogisesti järjestetyllä indikaattoreilla vasemmalta oikealle.

Kohteen ja predikaatin sijainti voi vaihtaa paikkaa tutkijan valinnasta riippuen. Aiheen rakenteesta ja yksiköiden ryhmittelystä riippuen siinä erotetaan yksinkertaiset ja monimutkaiset tilastotaulukot, joista jälkimmäiset puolestaan ​​jaetaan ryhmä- ja yhdistelmätaulukoiksi.

Yksinkertaisessa taulukossa aihe antaa yksinkertaisen luettelon kaikista väestön kohteista tai alueyksiköistä. Yksinkertaiset taulukot ovat monografisia ja luetteloituja. Monografiset eivät karakterisoi koko tutkitun volyymin yksikköjoukkoa, vaan vain yhtä mistä tahansa ryhmästä, joka on erotettu tietyn, ennalta muotoillun piirteen mukaan. Näin ollen yksinkertaisia ​​listataulukoita kutsutaan taulukoiksi, joiden aihe sisältää luettelon tutkitun perusjoukon yksiköistä.

Yksinkertaisen taulukon aihe voidaan muodostaa seuraavien periaatteiden mukaan: laji, alueellinen (IVY-maiden väestö); väliaikaiset jne. Yksinkertaisista taulukoista ei voida tunnistaa tutkittujen ilmiöiden sosioekonomisia tyyppejä, niiden rakennetta eikä niitä kuvaavien piirteiden keskinäisiä suhteita ja riippuvuuksia. Nämä tehtävät ratkaistaan ​​täydellisemmin monimutkaisten taulukoiden avulla: ryhmä- ja erityisesti yhdistelmätaulukot.

Ryhmätaulukoita kutsutaan tilastotaulukoiksi, joiden aihe sisältää populaation yksiköiden ryhmittelyn yhden kvantitatiivisen tai attribuutin mukaan. Ryhmätaulukoiden predikaatti koostuu indikaattoreista, jotka ovat välttämättömiä kohteen karakterisoimiseksi.

Yksinkertaisin ryhmätaulukkotyyppi on attribuutti- ja muunnelmajakauman sarjat. Ryhmätaulukko voi olla monimutkaisempi, jos predikaatti sisältää paitsi kunkin ryhmän yksiköiden lukumäärän, myös joukon muita tärkeitä indikaattoreita, jotka kuvaavat kohderyhmiä kvantitatiivisesti ja laadullisesti. Tällaisia ​​taulukoita käytetään usein vertailemaan yhteenvetoindikaattoreita eri ryhmien välillä, mikä mahdollistaa tiettyjen käytännön johtopäätösten tekemisen. Ryhmätaulukoiden avulla voidaan tunnistaa ja karakterisoida ilmiöiden sosioekonomiset tyypit, niiden rakenne, riippuen vain yhdestä ominaisuudesta.

Yhdistelmätaulukoita kutsutaan tilastotaulukoiksi, joiden aihe sisältää populaatioyksiköiden ryhmittelyn samanaikaisesti kahden tai useamman ominaisuuden mukaan: kukin ryhmästä, joka on rakennettu yhdelle pohjalle, on jaettu alaryhmiin jonkin muun ominaisuuden mukaan jne.

Yhdistelmätaulukoiden avulla voidaan karakterisoida useiden tunnusmerkkien perusteella tunnistettuja tyypillisiä ryhmiä ja niiden välistä suhdetta. Populaation yksiköiden jakaminen homogeenisiin ryhmiin ominaisuuksien mukaan määräytyy joko niiden yhden tärkeyden mukaan niiden yhdistelmässä tai sen mukaan, missä järjestyksessä niitä tutkitaan.

Predikaatin monimutkainen kehitys sisältää sen muodostavan attribuutin jakamisen alaryhmiin. Näin saadaan täydellisempi ja yksityiskohtaisempi kuvaus kohteesta. Tässä tapauksessa jokaiselle yritysryhmälle tai jokaiselle niistä yksittäin voidaan luonnehtia erilaisia ​​ominaisuuksia, jotka muodostavat predikaatin.

Tilastotiedot tulee esittää siten, että niitä voidaan käyttää. Tilastotietojen esittämisessä on kolme päämuotoa:

1) teksti - tiedon sisällyttäminen tekstiin;

2) taulukko - tietojen esittäminen taulukoissa;

3) graafinen - tiedon ilmaisu kaavioiden muodossa.

Tekstimuotoa käytetään, kun digitaalista dataa on vähän.

Taulukkomuotoa käytetään useimmiten, koska se on tehokkaampi tapa esittää tilastotietoja. Toisin kuin matemaattiset taulukot, jotka alkuehtojen mukaan mahdollistavat yhden tai toisen tuloksen saamisen, tilastotaulukot kertovat lukujen kielen tutkittavista objekteista.

Tilastotaulukko- tämä on rivi- ja sarakejärjestelmä, jossa tilastotietoa sosioekonomisista ilmiöistä esitetään tietyssä järjestyksessä ja yhteydessä.

Taulukko 2. Venäjän federaation ulkomaankauppa 2000 - 2006, miljardia dollaria

Indikaattori 2000 2001 2002 2003 2004 2005 2006
Ulkomaankaupan liikevaihto 149,9 155,6 168,3 280,6 368,9 468,4
Viedä 101,9 107,3 135,9 183,2 243,6 304,5
Tuonti 44,9 53,8 76,1 97,4 125,3 163,9
Kauppatase 60,1 48,1 46,3 59,9 85,8 118,3 140,7
mukaan lukien:
ulkomaiden kanssa
viedä 90,8 86,6 90,9 114,6 210,1 261,1
tuonti 31,4 40,7 48,8 77,5 103,5 138,6
kauppatase 59,3 45,9 42,1 53,6 75,5 106,6 122,5

Esimerkiksi taulukossa. 2 esittää Venäjän ulkomaankaupasta tietoa, jota olisi tehotonta ilmaista tekstimuodossa.

Erottaa aihe ja predikaatti tilastotaulukko. Kohde osoittaa luonnehditun kohteen - joko populaation yksiköt tai yksikköryhmät tai kokonaisuuden kokonaisuutena. Predikaatissa subjektin tunnus on annettu, yleensä numeerisessa muodossa. Pakollinen otsikko taulukko, joka kertoo mihin luokkaan ja mihin aikaan taulukon tiedot kuuluvat.

Tilastotaulukot on jaettu aiheen luonteen mukaan yksinkertainen, ryhmä ja yhdistelmä. Yksinkertaisen taulukon aiheessa tutkimuskohdetta ei jaeta ryhmiin, vaan joko annetaan luettelo kaikista perusjoukon yksiköistä tai ilmoitetaan populaatio kokonaisuutena (esim. taulukko 11). Ryhmätaulukon aiheessa tutkimuskohde on jaettu ryhmiin yhden attribuutin mukaan ja predikaatti ilmaisee ryhmien yksiköiden lukumäärän (absoluuttinen tai prosentteina) ja ryhmien yhteenvetoindikaattorit (esim. Taulukko 4). Yhdistelmätaulukon aiheessa populaatio on jaettu ryhmiin ei yhden, vaan usean kriteerin mukaan (esim. taulukko 2).

Pöytiä rakentaessasi sinun on noudatettava seuraavia asioita yleiset säännöt.

1. Taulukon aihe sijaitsee vasemmassa (harvemmin - yläosassa) ja predikaatti - oikealla (harvemmin - alemmalla).

2. Sarakeotsikoissa on indikaattoreiden ja niiden yksiköiden nimet.

3. Viimeinen rivi täydentää taulukon ja sijaitsee sen lopussa, mutta joskus se on ensimmäinen: tässä tapauksessa toinen rivi kirjoitetaan "mukaan lukien", ja seuraavat rivit sisältävät kokonaisrivin komponentit.

4. Numeeriset tiedot kirjoitetaan samalla tarkkuudella jokaiseen sarakkeeseen siten, että numeroiden numerot sijaitsevat numeroiden alla, ja kokonaislukuosa erotetaan murto-pilkusta.

5. Taulukossa ei saa olla tyhjiä soluja: jos data on nolla, laitetaan "–"-merkki (viiva); jos tietoja ei tunneta, tehdään merkintä "ei tietoja" tai merkitään "…" (ellipsi). Jos eksponenttiarvo ei ole nolla, vaan ensimmäinen merkitsevä numero ilmestyy hyväksytyn tarkkuusasteen jälkeen, kirjataan 0,0 (jos esimerkiksi tarkkuusaste 0,1 hyväksyttiin).

Joskus tilastotaulukoita täydennetään kaavioilla, kun tavoitteena on korostaa jotakin aineiston ominaisuutta, vertailla niitä. Graafinen muoto on tehokkain tiedon esitysmuoto niiden havainnoinnin kannalta. Graafeiden avulla saavutetaan rakenteen ominaisuuksien, dynamiikan, ilmiöiden suhteiden ja niiden vertailun näkyvyys.

Tilastolliset kaaviot- nämä ovat ehdollisia kuvia numeerisista arvoista ja niiden suhteista viivojen, geometristen muotojen, piirustusten tai maantieteellisten kaavioiden kautta. Graafinen muoto helpottaa tilastotietojen käsittelyä, tekee niistä visuaalisia, ilmeikkäitä ja näkyviä. Graafilla on kuitenkin tiettyjä rajoituksia: ensinnäkin kaavio ei voi sisältää niin paljon dataa kuin se mahtuu taulukkoon; lisäksi kaavio näyttää aina pyöristetyt tiedot - ei tarkkaa, mutta likimääräistä. Siten kaaviota käytetään vain yleisen tilanteen näyttämiseen, ei yksityiskohtiin. Viimeinen haittapuoli on piirtämisen monimutkaisuus. Se voidaan voittaa henkilökohtaisella tietokoneella (esimerkiksi "Ohjattu kaavio" paketista Microsoft Office Excel).

Grafiikan rakennusmenetelmän mukaan ne jaetaan kaavioita, kartogrammeja ja kaaviokaaviot.

Yleisin tapa tietojen graafiseen esittämiseen ovat kaaviot, joita on seuraavan tyyppisiä: lineaarinen, säteittäinen, sironta, tasomainen, tilavuus, kihara. Kaavioiden tyyppi riippuu esitetyn tiedon tyypistä ja rakennustehtävästä. Joka tapauksessa kaavion mukana on oltava otsikko - kaaviokentän ylä- tai alapuolella. Otsikko kertoo, mikä indikaattori näytetään, mille alueelle ja mihin aikaan.

Viivakaavioita käytetään kvantitatiivisten muuttujien esittämiseen: niiden arvojen vaihtelun ominaisuudet, dynamiikka, muuttujien väliset suhteet. Tietojen vaihtelua analysoidaan käyttämällä jakelualue, kumuloituu(pienempi kuin käyrä) ja kertoo(käyrä "suurempi kuin"). Jakaumapolygonia käsitellään aiheessa 4 (esim. kuva 5.). Kumulaatin muodostamiseksi muuttujan ominaisuuden arvot piirretään abskissaa pitkin ja taajuuksien tai taajuuksien kumulatiiviset summat (alkaen f1 kohtaan ∑ f). Ogiven rakentamiseksi kertyneet taajuuksien summat asetetaan y-akselille käänteisessä järjestyksessä (alkaen ∑ f ennen f1). Kumuloi ja anna taulukon mukaan. 4. kuvaa kuvassa. yksi.

Riisi. 1. Tavaroiden jakautumisen kumulaatiot ja tulokset tullausarvon mukaan

Viivakaavioiden käyttöä trendianalyysissä käsitellään aiheessa 5 (esim. kuva 13) ja niiden käyttöä linkkianalyysissä aiheessa 6 (esim. kuva 21). Aihe 6 kattaa myös sirontakaavioiden käytön (esim. kuva 20).

Viivakaaviot on jaettu alaryhmiin yksiulotteinen, jota käytetään edustamaan yhden muuttujan tietoja, ja kaksiulotteinen- kahdelle muuttujalle. Esimerkki yksiulotteisesta viivakaaviosta on jakauman monikulmio ja kaksiulotteinen on regressioviiva (esim. kuva 21).

Joskus indikaattorin suurilla muutoksilla käytetään logaritmista asteikkoa. Esimerkiksi, jos indikaattorin arvot vaihtelevat välillä 1 - 1000, tämä voi aiheuttaa vaikeuksia piirtämisessä. Tällaisissa tapauksissa he siirtyvät indikaattoriarvojen logaritmeihin, jotka eivät eroa niin paljon: lg 1 = 0, lg 1000 = 3.

Joukossa tasomainen Käyttötiheyden mukaan erotetaan pylväsdiagrammit (histogrammit), joissa osoitin esitetään pylväsnä, jonka korkeus vastaa indikaattorin arvoa (esim. kuva 4).

Tietyn geometrisen kuvion alueen suhteellisuus indikaattorin arvoon on muun tyyppisten tasokaavioiden taustalla: kolmion muotoinen, neliö-, suorakulmainen. Voit myös käyttää ympyrän alueiden vertailua - tässä tapauksessa ympyrän säde asetetaan.

nauhakaavio esittää indikaattorit vaakasuoraan venytettyjen suorakulmioiden muodossa ja on muuten sama kuin pylväskaavio.

Tasokaavioista sitä käytetään usein ympyrädiagrammi, jota käytetään havainnollistamaan tutkitun populaation rakennetta. Koko joukko otetaan 100 %:ksi, se vastaa ympyrän kokonaispinta-alaa, sektorien pinta-alat vastaavat joukon osia. Rakennetaan taulukon mukaan sektorikaavio Venäjän federaation ulkomaankaupan rakenteesta vuonna 2006. 2 (katso kuva 2). Tietokoneohjelmia käytettäessä sektorikaaviot rakennetaan kolmiulotteiseen muotoon, eli ei kahteen, vaan kolmeen tasoon (ks. kuva 3).

Riisi. 2. Yksinkertainen ympyräkaavio 3. 3D-ympyräkaavio

Kiharat (kuva)kaaviot lisäävät kuvan selkeyttä, koska ne sisältävät kuvan näytettävästä indikaattorista, jonka koko vastaa indikaattorin kokoa.

Kaaviota piirtäessä kaikki on yhtä tärkeää - graafisen kuvan oikea valinta, mittasuhteet, kaavioiden suunnittelun sääntöjen noudattaminen. Näitä kysymyksiä käsitellään tarkemmin ja.

Kartogrammeja ja kartogrammeja käytetään kuvaamaan tutkittavien ilmiöiden maantieteellisiä ominaisuuksia. Ne osoittavat tutkittavan ilmiön sijainnin, sen voimakkuuden tietyllä alueella - tasavallassa, alueella, talous- tai hallintoalueella jne. Kartogrammien ja kartogrammien rakentamista tarkastellaan esimerkiksi erikoiskirjallisuudessa.

UO FPB MITSO

Logistiikan laitos

SURS №1

tieteenala Tilastot aiheesta: "Tilastotietojen esittämismenetelmät ja -muodot"

Esitetty

2. vuoden opiskelija

F-ta MEOiM d / o

ryhmä 916

Verina E. A.

Opettaja tarkastanut

Bondar S.V.

Minsk, 2010

Graafisen menetelmän tulkinta tilastotietojen esittämiseksi erityisenä merkkijärjestelmänä - keinotekoisena viittomakielenä - liittyy semiotiikan, merkkitieteen ja merkkijärjestelmien kehitykseen.

Tilastollinen graafi on piirros, jossa tietyillä indikaattoreilla luonnehdittuja tilastollisia populaatioita kuvataan käyttämällä ehdollisia geometrisia kuvia tai merkkejä. Taulukkotietojen esittäminen kaavion muodossa tekee vahvemman vaikutelman kuin numerot, antaa sinun ymmärtää paremmin tilastollisen havainnoinnin tuloksia, tulkita niitä oikein, helpottaa huomattavasti tilastomateriaalin ymmärtämistä, tekee siitä visuaalisen ja helposti saatavilla olevan. Tämä ei kuitenkaan tarkoita, että kaaviot olisivat vain havainnollistavia. Ne antavat uutta tietoa tutkimuksen aiheesta, koska ne ovat tapa yleistää lähtötietoa.

Graafista kuvaa rakennettaessa tulee huomioida useita vaatimuksia. Ensinnäkin graafin tulee olla riittävän visuaalinen, koska graafisen kuvan tarkoitus analyysimenetelmänä on visuaalisesti kuvata tilastollisia indikaattoreita. Lisäksi aikataulun tulee olla ilmeikäs, ymmärrettävä ja ymmärrettävä.

Kaavio koostuu graafisesta kuvasta ja apuelementeistä. Graafinen kuva on kokoelma viivoja, kuvioita, pisteitä, jotka edustavat tilastotietoja. Tilastokaavioissa käytetyt halkaisijamerkit, piirustukset tai kuvat ovat erilaisia. Nämä ovat pisteitä, suorien viivojen segmenttejä, merkkejä erimuotoisten, viivoitettujen tai värittyvien kuvien muodossa (ympyrät, neliöt, suorakulmiot jne.). Näitä merkkejä käytetään vertailemaan tilastollisia arvoja, jotka edustavat vertailtavien populaatioiden absoluuttista ja suhteellista kokoa. Vertailu kaaviossa tehdään joidenkin mittojen mukaan: kuvan yhden sivun pinta-ala tai pituus, pisteiden sijainti, niiden tiheys, kuoriutumisen tiheys, värin intensiteetti tai väri.

Apuelementtejä ovat yleinen otsikko, symbolit, koordinaattiakselit, asteikot asteikoilla ja numeerinen ruudukko.

Graafille sijoitettujen geometristen kuvien sanalliset selitykset (kaavion selitys), jotka ovat erilaisia ​​konfiguraatioltaan, varjostukseltaan tai väriltään, mahdollistavat henkisen siirtymisen geometrisista kuvista kaaviossa kuvattuihin ilmiöihin ja prosesseihin.

Tilastokaavioissa käytetään yleisimmin suorakulmaisten koordinaattien järjestelmää, mutta on olemassa myös napakoordinaatteihin perustuvia kaavioita (ympyräkaavioita).

Kun kuvaaja piirretään suorakaiteen muotoisina koordinaatteina, kuvattujen ilmiöiden tai prosessien tilastollisten piirteiden ominaisuudet sijoitetaan vaaka-abskissalle ja pystyordinaatoille tietyssä järjestyksessä ja geometriset merkit, jotka muodostavat itse graafin, sijoitetaan kuvaajaan. ala. Kaaviokenttä on tila, jossa graafin muodostavat geometriset merkit sijaitsevat.

Koordinaattiakseleilla sijaitsevat ominaisuudet voivat olla laadullisia ja määrällisiä.

Yksi tilastograafin tärkeimmistä tehtävistä on sen koostumus: tilastollisen materiaalin valinta, näyttötavan valinta, ts. kaavion muoto. Kaavion koon tulee vastata sen tarkoitusta.

Kuvaajan otsikko (nimet) määrittelee tehtävän, joka ratkaistaan ​​graafin avulla, antaa kuvauksen paikasta ja ajasta, johon graafi viittaa.

Asteikoissa olevat merkinnät osoittavat yksiköt, joilla ominaisuudet mitataan. Kunkin parametrin arvojen numerot asetetaan asteikon rajamerkkeihin.

Asteikkopalkki on viiva (yleensä suora viiva tilastokaaviossa), jossa on asteikkomerkit ja niiden numeeriset merkinnät. On parempi tehdä nämä merkinnät vain pyöreitä numeroita vastaaviin merkkeihin: tässä tapauksessa välimerkit luetaan laskemalla asteikolla ilmoitetusta lähimmästä numerosta. Kaavion kentässä olevien asteikkomerkkien mukaan piirretään kuvattujen ilmiöiden tai prosessin mitat. Asteikkomerkit sijaitsevat asteikolla tasaisesti (tasainen, aritmeettinen asteikko) tai epätasaisesti (funktionaalinen asteikko, logaritminen asteikko).

Funktionaalinen asteikko - asteikko, jossa merkittyjen pisteiden numeeriset arvot ilmaisevat argumentin arvoja ja näiden pisteiden sijainti vastaa saman argumentin jonkin funktion tasaisesti jakautuneita arvoja. Tilastollisten kaavioiden funktionaalisista asteikoista käytetään pääasiassa logaritmista asteikkoa. Lisäksi, jos otetaan huomioon kaksi suuretta, tällainen asteikko voi olla sovellettavissa molempiin tai vain toiseen niistä ("puolilogaritminen" kaavio tai asteikko). Logaritmisen asteikon numeerisiin merkkeihin piirrettyjen pisteiden väliset etäisyydet vastaavat vastaavien lukujen logaritmien välistä eroa ja kuvaavat siten lukujen välistä suhdetta.

Graafityyppien luokittelu.

Grafiikkatyyppejä on monenlaisia. Niiden luokittelu perustuu useisiin ominaisuuksiin:

a) menetelmä graafisen kuvan rakentamiseksi;

b) geometriset merkit, jotka kuvaavat tilastollisia indikaattoreita ja suhteita;

c) graafisen kuvan avulla ratkaistuja tehtäviä.

Tilastolliset kaaviot graafisen kuvan muodossa:

1. Lineaarinen: tilastolliset käyrät.

2. Tasomainen: palkki, kaistale, neliö, pyöreä, sektori, kihara, piste, tausta.

3. Volumetrinen: jakautumispinnat.

Tilastolliset graafit rakennusmenetelmän ja kuvatehtävien mukaan:

1. Kaaviot: vertailukaaviot, dynamiikkakaaviot, rakennekaaviot.

2. Tilastokartat: kartogrammit, kartogrammit.

Rakennetavan mukaan tilastolliset graafit jaetaan kaavioihin ja tilastokarttoihin. Kaaviot ovat yleisin tapa esittää graafisia esityksiä. Nämä ovat kvantitatiivisten suhteiden kaavioita. Niiden rakennustyypit ja -menetelmät ovat erilaisia. Kaavioita käytetään visuaaliseen vertailuun toisistaan ​​riippumattomien arvojen eri näkökulmissa (paikallinen, ajallinen jne.): alueet, väestö jne. Tässä tapauksessa tutkittujen populaatioiden vertailu suoritetaan joidenkin merkittävien vaihteluiden mukaan. attribuutti. Tilastokartat - kaaviot kvantitatiivisesta jakautumisesta pinnan yli. Päätarkoituksessaan ne liittyvät läheisesti kaavioihin ja ovat spesifisiä vain siinä mielessä, että ne ovat ehdollisia esityksiä tilastotiedosta ääriviivamaantieteellisellä kartalla, eli ne osoittavat tilastotiedon alueellisen jakauman. Geometriset merkit, kuten edellä mainittiin, ovat joko pisteitä tai viivoja tai tasoja tai geometrisia kappaleita. Tämän mukaisesti on olemassa piste-, viiva-, taso- ja spatiaaliset (tilavuus)kuvaajat.

Sirontakaavioita rakennettaessa pistejoukkoja käytetään graafisina kuvina; kun rakennetaan lineaarisia viivoja. Kaikkien tasokaavioiden rakentamisen perusperiaate on, että tilastolliset suureet on kuvattu geometristen kuvioiden muodossa ja ne puolestaan ​​jaetaan pylväs-, kaistale-, ympyrä-, neliö- ja kiharoiksi.

Graafisen kuvan mukaiset tilastokartat on jaettu kartogrammeihin ja kartogrammeihin.

Ratkaistavien tehtävien joukosta riippuen erotetaan vertailukaaviot, rakennekaaviot ja dynamiikkakaaviot.

Yleisimmin käytetyt kaaviot vaihtelusarjojen eli ominaisarvojen ja vastaavien taajuuksien tai suhteellisten taajuuksien välisten suhteiden kuvaamiseen ovat monikulmio, histogrammi ja kumulaatio.

Monikulmio käytetään useimmiten edustamaan erillisiä sarjoja. Monikulmion rakentamiseksi suorakaiteen muotoiseen koordinaattijärjestelmään argumentin arvot eli valinnat piirretään abskissa-akselille mielivaltaisesti valitulla asteikolla ja ordinaatta-akselilla, myös mielivaltaisesti valitulla asteikolla, arvot. taajuuksista tai suhteellisista taajuuksista. Mittakaava valitaan siten, että näkyvyys on riittävä ja piirustus on halutun kokoinen. Lisäksi tässä koordinaattijärjestelmässä rakennetaan pisteitä, joiden koordinaatit ovat variaatiosarjan vastaavien lukujen pareja. Tuloksena olevat pisteet on kytketty sarjaan suorilla viivaosilla. Äärimmäinen "vasen" piste on yhdistetty abskissa-akselin pisteeseen, jonka abskissa sijaitsee tarkasteltavan pisteen vasemmalla puolella samalla etäisyydellä kuin lähimpänä oikeaa olevan pisteen abskissa. Vastaavasti äärimmäinen "oikea" piste on myös yhdistetty x-akselin pisteeseen.

Tietyn luokan oppilaiden matematiikan koulutussaavutuksia kuvaavat taulukossa esitetyt tiedot.

Muodosta monikulmio taajuuksista.

:

Teksti lomake

taulukkomuotoinen

Tilastotaulukko

Tilastokaaviot ovat ehdollisia esityksiä numeerisista arvoista ja niiden suhteista viivojen, geometristen muotojen, piirustusten tai maantieteellisten kaavioiden kautta. Graafinen muoto helpottaa tilastotietojen käsittelyä, tekee niistä visuaalisia, ilmeikkäitä ja näkyviä. Graafilla on kuitenkin tiettyjä rajoituksia: ensinnäkin kaavio ei voi sisältää niin paljon dataa kuin se mahtuu taulukkoon; lisäksi kaavio näyttää aina pyöristetyt tiedot - ei tarkkaa, mutta likimääräistä. Siten kaaviota käytetään vain yleisen tilanteen näyttämiseen, ei yksityiskohtiin. Viimeinen haittapuoli on piirtämisen monimutkaisuus. Se voidaan voittaa henkilökohtaisella tietokoneella (esimerkiksi "Chart Wizard" Microsoft Office Excel -paketista).

Empiirisen jakaumafunktion määritys.

Otos (empiirinen) jakaumafunktio matemaattisessa tilastossa se on approksimaatio teoreettisesta jakaumafunktiosta, joka on muodostettu käyttämällä sen otosta.

Määritelmä

Olkoon näyte jakautumisfunktion antaman satunnaismuuttujan jakaumasta. Oletetaan, että missä ovat riippumattomia satunnaismuuttujia, jotka on määritelty jollekin alkeistulosten avaruudelle. Päästää . Määritellään satunnaismuuttuja seuraavalla tavalla:

missä on tapahtuman ilmaisin , on Heaviside-funktio. Näin ollen näytteistysjakaumafunktio tietyssä pisteessä on yhtä suuri kuin niiden näyteelementtien suhteellinen tiheys, jotka eivät ylitä arvoa . Satunnaismuuttujaa kutsutaan satunnaismuuttujan otosjakaumafunktioksi ja se on funktion approksimaatio. On tulos, joka osoittaa, että , funktio konvergoi tasaisesti , ja osoittaa lähentymisnopeutta.

pylväsdiagrammi

Histogrammia käytetään jakaumien graafiseen esittämiseen jatkuvasti vaihtelevia ominaisuuksia ja koostuu vierekkäisistä suorakulmioista, kuten kuvassa 1 on esitetty. 2.1. Kunkin suorakulmion kanta on yhtä suuri kuin ryhmittelyvälin leveys ja sen korkeus on sellainen, että neliö- suorakulmio on verrannollinen osumistiheyteen (tai taajuuteen) annettuun väliin. Jos rivi on ei-intervalli, kaikkien sarakkeiden leveys valitaan mielivaltaiseksi, mutta samaksi. Näin ollen suorakulmioiden korkeuksien tulee olla verrannollisia arvoihin

missä n i-taajuus i-th ryhmittelyväli; Moi-leveys i-. ryhmittelyväli.

Histogrammikaaviossa suorakulmioiden pohja piirretään x-akselia ( x), ja korkeus on y-akselia pitkin ( klo) suorakaiteen muotoisesta koordinaattijärjestelmästä.

Kuitenkin tapauksissa, joissa kaikkien ryhmittelyvälien leveys on sama, histogrammin ulkonäkö ei muutu, jos arvoja ei ole piirretty y-akselia pitkin p i, ja intervallitaajuudet n i.

Riisi. 2.1. Edellisen esimerkin tulosten jakautumisen histogrammi (kun joidenkin ryhmittelyvälien leveys ei ole sama).

Tässä tapauksessa, jotta ei rikota histogrammin muodostamisperiaatetta (suorakulmioiden pinta-alat ovat verrannollisia intervallien taajuuksiin), taajuuksia ei voida enää piirtää y-akselia pitkin, vaan suorakulmioiden korkeuksia (jonka on oltava suhteessa suhteisiin) on piirrettävä.

Taajuus monikulmio

Toinen yleinen graafinen esitys on taajuuspolygoni.

Taajuuksien monikulmio muodostuu katkoviivasta, joka yhdistää ryhmittelyvälien mediaaniarvoja vastaavat pisteet ja näiden välien taajuudet, mediaaniarvot piirretään akselia pitkin X, ja taajuudet - pitkin akselia klo.

Kahden tarkasteltavan empiiristen jakaumien graafisen esityksen menetelmän vertailusta seuraa, että taajuusmonikulmion saamiseksi rakennetusta histogrammista on tarpeen yhdistää histogrammin muodostavien suorakulmioiden kärkien keskipisteet suorilla janoilla. . Esimerkki taajuuspolygonista on esitetty kuvassa. 2.2.

Riisi. 2.2. Taajuus monikulmio

Taajuuspolygonia käytetään edustamaan sekä jatkuvien että diskreettien piirteiden jakaumia. Jatkuvan jakauman tapauksessa taajuuspolygoni on edullisempi graafinen esitystapa kuin histogrammi, jos empiirisen jakauman kuvaaja kuvataan tasaisella riippuvuudella.

21.Hypoteesi(antiikin Kreikan ὑπόθεσις - oletus; sanasta ὑπό - alhaalta, alle + θέσις - teesi) - oletus tai olettamus; väite, joka edellyttää todistetta, toisin kuin aksioomit

Postulaatteja, jotka eivät vaadi todisteita. Hypoteesia pidetään tieteellisenä, jos se täyttää Popperin kriteerin, ts. voidaan mahdollisesti testata kriittisellä kokeella, sekä jos se täyttää muut kriteerit, jotka erottavat tieteen ei-tieteestä.

Tilastollinen hypoteesi on oletus satunnaismuuttujien tai tapahtumien ominaisuuksista, joita haluamme testata käytettävissä olevien tietojen perusteella. Esimerkkejä tilastollisista hypoteeseista kasvatustutkimuksessa:

Hypoteesi 1. Luokan suoritus riippuu stokastisesti (todennäköisesti) opiskelijan oppimisen tasosta.

Hypoteesi 2. Matematiikan alkukurssin assimilaatiossa ei ole merkittäviä eroja 6- tai 7-vuotiaana opintonsa aloittaneiden opiskelijoiden kesken.

Hypoteesi 3. Ongelmalähtöinen oppiminen ensimmäisellä luokalla on tehokkaampaa kuin perinteiset opetusmenetelmät suhteessa oppilaiden kokonaiskehitykseen.

Esimerkki 1 Joidenkin lääkevalmisteiden valmistusprosessi on hyvin monimutkainen. Ensi silmäyksellä merkityksettömät poikkeamat tekniikasta aiheuttavat erittäin myrkyllisen sivuepäpuhtauden ilmaantumisen. Tämän epäpuhtauden myrkyllisyys voi olla niin suuri, että jopa määrä, jota ei voida havaita tavanomaisella kemiallisella analyysillä, voi olla vaarallinen tätä lääkettä käyttävälle henkilölle. Tämän seurauksena ennen kuin uusi tuote-erä saatetaan markkinoille, sille tehdään myrkyllisyystutkimus biologisin menetelmin. Pieniä annoksia lääkettä annetaan useille koe-eläimille, kuten hiirille, ja tulos kirjataan. Jos lääke on myrkyllistä, kaikki tai melkein kaikki eläimet kuolevat. Muuten eloonjääneiden määrä on korkea.

Lääkkeen tutkimus voi johtaa johonkin seuraavista mahdollisista toimintatavoista: erän luovuttaminen markkinoille (a 1), erän palauttaminen toimittajalle uudelleenkäsittelyä tai mahdollisesti tuhoamista varten (a 2).

Toimiin a 1 ja a 2 liittyvät kahdenlaiset virheet ovat täysin erilaisia, ja niiden välttämisen merkitys on myös erilainen. Harkitse ensin tapausta, jossa käytetään toimintoa a 1, kun taas 2 on parempi. Lääke on vaarallinen potilaalle, vaikka se tunnustetaan turvalliseksi. Tällainen virhe voi aiheuttaa kuoleman tätä lääkettä käyttäville potilaille. Tämä on tyypin I virhe, koska sen välttäminen on meille tärkeämpää.

Harkitse tapausta, jossa toimenpide 2 suoritetaan, kun taas 1 on parempi. Tämä tarkoittaa, että kokeen suorittamisen epätarkkuuksien vuoksi myrkytön lääkeerä luokiteltiin vaaralliseksi. Virheen seuraukset voivat ilmaistua taloudellisena tappiona ja lääkkeen hinnan nousuna. Täysin turvallisen lääkkeen tahaton hylkääminen on kuitenkin selvästi vähemmän ei-toivottavaa kuin potilaiden satunnainen kuolema. Myrkyttömän lääkeerän hylkääminen on tyypin II virhe.

Sallittu tyypin I virheen todennäköisyys(Rkr) voi olla 5 % tai 1 % (0,05 tai 0,01).

22. Tilastollinen hypoteesitesti(tilastollisten hypoteesien testaus) on prosessi, jossa päätetään, onko tietty tilastollinen hypoteesi ristiriidassa havaitun tietootoksen kanssa.

tilastollinen testi tai tilastollinen testi- tiukka matemaattinen sääntö, jolla hyväksytään tai hylätään tilastollinen hypoteesi.

· 23.hypoteesien luokittelu

· yksinkertainen- ilmoitetaan yksi seikka, jonka olemassaolossa tai puuttuessa oikeusnormi on voimassa;

· monimutkainen- hypoteesissa kahden tai useamman seikan esiintyminen samanaikaisesti, jotka yhdessä määräävät normin toiminnan;

· vaihtoehto- esitetään useita eri olosuhteiden muunnelmia (vaihtoehto), joissa sääntöä voidaan soveltaa. Tässä tapauksessa, kun yksi niistä tapahtuu, normi on voimassa;

parametrinen hypoteesi kutsutaan hypoteesiksi jakeluparametrien arvot tai kahden jakauman parametrien vertailuarvosta. Esimerkki parametrisesta tilastollisesta hypoteesista on hypoteesi noin matemaattisten odotusten tasa-arvo kaksi normaalia settiä.

Ei-parametriset hypoteesit jota kutsutaan hypoteesiksi satunnainen jakautuminen määriä.

Tyhjä, päähypoteesi eli testattu hypoteesi on alun perin esitetty hypoteesi, joka on merkitty H0.

Tilastollinen hypoteesi edustaa jotakin oletusta satunnaismuuttujan jakautumislaista tai tämän lain parametreista otoksen perusteella muotoiltuna. Esimerkkejä tilastollisista hypoteeseista ovat oletukset: yleinen populaatio jakautuu eksponentiaalisen lain mukaan; kahden eksponentiaalisesti jakautuneen otoksen matemaattiset odotukset ovat keskenään yhtä suuret. Ensimmäisessä niistä tehdään oletus jakautumislain muodosta ja toisessa kahden jakauman parametreista. Kutsutaan hypoteeseja, joiden perusteella ei ole olemassa oletuksia tietyntyyppisestä jakautumislaista ei-parametrinen, muuten - parametrinen.

Hypoteesi, jonka mukaan vertailtavien ominaisuuksien välillä ei ole eroa ja havaitut poikkeamat selittyvät vain satunnaisilla vaihteluilla vertailun perustana olevissa näytteissä, on ns. tyhjä(pää)hypoteesi ja merkitse H 0 . Päähypoteesin ohella harkitsemme myös vaihtoehto(kilpailee, kiistää) hänen hypoteesinsa H yksi . Ja jos nollahypoteesi hylätään, vaihtoehtoinen hypoteesi toteutuu.

Erota yksinkertaiset ja monimutkaiset hypoteesit. Hypoteesi on ns yksinkertainen, jos se luonnehtii yksiselitteisesti satunnaismuuttujan jakaumaparametria. Esimerkiksi jos  on eksponentiaalisen jakauman parametri, niin hypoteesi H 0 tasa-arvosta  = 10 on yksinkertainen hypoteesi. monimutkainen kutsutaan hypoteesiksi, joka koostuu äärellisestä tai äärettömästä joukosta yksinkertaisia ​​hypoteeseja. Monimutkainen hypoteesi H 0 epätasa-arvosta  > 10 koostuu äärettömästä määrästä yksinkertaisia ​​hypoteeseja H 0 tasa-arvosta =b i, missä b i- mikä tahansa luku, joka on suurempi kuin 10. Hypoteesi H 0, että normaalijakauman odotus on kaksi tuntemattomalle varianssille, on myös hankalaa. Monimutkainen hypoteesi on oletus satunnaismuuttujan jakautumisesta X normaalin lain mukaan, jos matemaattisen odotuksen ja varianssin tietyt arvot eivät ole kiinteitä.

Hypoteesin testaus perustuu jonkin satunnaismuuttujan - kriteerin - laskemiseen, jonka tarkka tai likimääräinen jakauma tunnetaan. Merkitään tämä määrä numerolla z, sen arvo on otoksen elementtien funktio z=z(x 1 , x 2 , …, x n). Hypoteesin testausmenettely määrää jokaiselle kriteeriarvolle yhden kahdesta päätöksestä - hypoteesin hyväksyminen tai hylkääminen. Siten koko näytetila ja vastaavasti kriteeriarvot jaetaan kahteen ei-päällekkäiseen osajoukkoon S 0 ja S yksi . Jos kriteerin arvo z putoaa alueelle S 0, niin hypoteesi hyväksytään, ja jos S 1 , – hypoteesi hylätään. Joukko S 0 kutsutaan hypoteesin hyväksymisalue tai hyväksyttävien arvojen alue, ja setti S 1 – hypoteesin hylkäämisalue tai kriittinen alue. Yhden alueen valinta määrittää yksilöllisesti toisen alueen.

Hypoteesin hyväksyminen tai hylkääminen H 0 satunnaisotoksen mukaan vastaa jollain todennäköisyydellä totuutta ja vastaavasti kahdenlaisia ​​virheitä on mahdollista. Tyypin I virhe tapahtuu todennäköisyydellä , kun oikea hypoteesi hylätään. H 0 ja kilpaileva hypoteesi hyväksytään H yksi . Toisenlainen virhe tapahtuu todennäköisyydellä  siinä tapauksessa, että hyväksytään väärä hypoteesi H 0, kun taas kilpaileva hypoteesi on totta H 1 . Luottamuksen todennäköisyys on todennäköisyys, että ei tehdä tyypin I virhettä ja hyväksyä oikea hypoteesi H 0 . Väärän hypoteesin hylkäämisen todennäköisyys H 0 kutsutaan kriteerin voima. Siksi hypoteesia testattaessa on neljä mahdollista tulosta, Taulukko. 3.1.

Taulukko 3.1.

Tarkastellaan esimerkiksi tapausta, jossa tilavuusnäytteestä lasketaan jokin puolueeton estimaatti parametrista  n, ja tällä arviolla on jakautumistiheys f(), kuva. 3.1.

Riisi. 3.1. Hypoteesin alueet ja poikkeamat

Oletetaan, että arvioidun parametrin todellinen arvo on yhtä suuri kuin T. Jos ajatellaan hypoteesia H 0 tasa-arvosta  = T, niin kuinka suuri eron  ja välillä pitäisi olla T hylkäämään tämän hypoteesin. Tähän kysymykseen voidaan vastata tilastollisessa mielessä, kun otetaan huomioon todennäköisyys saavuttaa jokin tietty ero välillä  ja T parametrin  näytteenottojakauman perusteella.

On suositeltavaa olettaa samat arvot todennäköisyydelle, että parametri  ylittää intervallin ala- ja ylärajan. Tällainen oletus mahdollistaa monissa tapauksissa luottamusvälin minimoimisen, ts. lisää testikriteerin tehoa. Kokonaistodennäköisyys, että parametri  ylittää välin rajoilla  1– /2 ja   /2 on  . Tämä arvo tulee valita niin pieneksi, että se ei todennäköisesti ylitä intervallia. Jos parametrin estimaatti osuu tietyn väliin, niin tässä tapauksessa ei ole syytä kyseenalaistaa testattavaa hypoteesia, joten yhtäläisyyshypoteesi  = T voidaan hyväksyä. Mutta jos otoksen vastaanottamisen jälkeen käy ilmi, että arvio on asetettujen rajojen ulkopuolella, niin tässä tapauksessa on vakavia syitä hylätä hypoteesi H 0 . Tästä seuraa, että tyypin I virheen tekemisen todennäköisyys on yhtä suuri kuin  (yhtä kuin kriteerin merkitsevyystaso).

Olettaen esimerkiksi, että parametrin todellinen arvo on itse asiassa yhtä suuri kuin T+d, sitten hypoteesin mukaan H 0 tasa-arvosta  = T– todennäköisyys, että parametrin  estimaatti putoaa hypoteesin hyväksymisalueelle, on  , kuva 3.2.

Tietyllä otoskoolla tyypin I virheen tekemisen todennäköisyyttä voidaan pienentää alentamalla merkitsevyystasoa  . Tässä tapauksessa kuitenkin toisen tyyppisen virheen  todennäköisyys kasvaa (kriteerin teho pienenee). Samanlainen päättely voidaan suorittaa tapaukselle, jossa parametrin todellinen arvo on yhtä suuri kuin Td.

Ainoa tapa pienentää molempia todennäköisyyksiä on suurentaa otoskokoa (parametriestimaatin jakautumistiheydestä tulee "kapeampi"). Kriittistä aluetta valittaessa ohjataan Neumann-Pearsonin sääntöä: kriittinen alue tulee valita siten, että todennäköisyys  on pieni, jos hypoteesi pitää paikkansa, ja muussa tapauksessa suuri. Tietyn :n arvon valinta on kuitenkin suhteellisen mielivaltaista. Yleiset arvot vaihtelevat välillä 0,001 - 0,2. Manuaalisten laskelmien yksinkertaistamiseksi on koottu tyypillisille :n arvoille intervallitaulukot  1– /2 ja   /2 rajalla sekä erilaisia ​​kriteerin muodostamismenetelmiä.

Merkitystasoa valittaessa on otettava huomioon kriteerin teho vaihtoehtoisen hypoteesin mukaan. Joskus kriteerin suuri potenssi osoittautuu pienempää merkitsevyystasoa tärkeämmäksi ja sen arvo valitaan suhteellisen suureksi, esimerkiksi 0,2. Tällainen valinta on perusteltu, jos toisen tyyppisten virheiden seuraukset ovat merkittävämpiä kuin ensimmäisen tyyppisten virheiden seuraukset. Jos esimerkiksi oikea päätös "jatka käyttäjillä nykyisillä salasanoilla" hylätään, tyypin I virhe aiheuttaa jonkin verran viivettä järjestelmän normaalissa toiminnassa salasanan vaihtamisesta johtuen. Jos salasanoja päätetään olla vaihtamatta huolimatta luvattomien henkilöiden luvattomasta pääsystä tietoihin, tämä virhe aiheuttaa vakavampia seurauksia.

Testattavan hypoteesin luonteesta sekä ominaisuuden arvioinnin ja sen teoreettisen arvon välisen ristiriidan mittareista riippuen käytetään erilaisia ​​kriteerejä. Yleisimmin käytettyjä kriteereitä jakaumalakeja koskevien hypoteesien testaamiseen ovat Pearsonin, Kolmogorovin, Misesin, Wilcoxonin khin neliötestit sekä Fisherin ja Studentin testit parametriarvoille.

25. KRIITTINEN ALUE- näyteavaruuden osa siten, että siinä olevan satunnaismuuttujan havaitun arvon esiintyminen, jonka jakautumiseen testattu hypoteesi liittyy, johtaa tämän hypoteesin hylkäämiseen

kriittiset kohdat(rajat) k cr ovat pisteet, jotka erottavat kriittisen alueen hypoteesin hyväksymisalueesta.
On yksipuolisia (oikea- tai vasenpuolisia) ja kaksipuolisia kriittisiä alueita.

Satunnaismittausvirhe muodostuu useiden tekijöiden vaikutuksesta mittausprosessin mukana. Jokaisella erityisellä tilanteella on oma virheenmuodostusmekanisminsa. Siksi on luonnollista olettaa, että jokaisella tilanteella tulee olla omanlaisensa virhejakauma. Monissa tapauksissa jakaumafunktion muodosta voidaan kuitenkin tehdä joitain oletuksia jo ennen mittauksia, niin että mittausten jälkeen jää vain määrittää joidenkin parametrien arvot, jotka sisältyvät estimoidun lausekkeeseen. jakelutoiminto.

Satunnaisvirhe luonnehtii tietojemme epävarmuutta havaintojen tuloksena saadun mitatun arvon todellisesta arvosta. K. Shannonin mukaan satunnaismuuttujan X kuvaaman tilanteen epävarmuuden mitta on entropia


joka on differentiaalijakaumafunktion funktionaalinen funktio. Voidaan olettaa, että mikä tahansa mittausprosessi muodostuu siten, että havaintotuloksen epävarmuus on suurin tietyissä sallittujen virhearvojen määrittämissä rajoissa. Siksi todennäköisimpiä tulisi olla sellaiset jakaumat, joissa entropia kääntyy maksimiin.

Todennäköisimpien jakaumien tyypin tunnistamiseksi tarkastellaan joitain tyypillisimpiä tapauksia.

1. Havaintotulosten jakaumien luokassa, joissa arvojen välillä on tietty sirontavyöhyke x = b ja x = a leveys b-a=2a, etsi sellainen, joka maksimoi entropian rajoittavien olosuhteiden vallitessa:
, , ,
missä on havaintotulosten matemaattinen odotus. Ongelman ratkaisu löydetään Lagrangen kertoimien menetelmällä.

Havaintojen tulosten haluttu jakautumistiheys kuvataan lausekkeella

Määritellään tasaisen jakauman numeeriset ominaisuudet. Satunnaisvirheen matemaattinen odotus saadaan kaavalla (10):

Satunnaisen tasaisesti jakautuneen virheen dispersio löytyy kaavasta (18):

Jakauman symmetrian vuoksi suhteessa matemaattiseen odotukseen vinovuuskertoimen on oltava nolla:

Kurtoosin määrittämiseksi löydämme ensin satunnaisvirheen neljännen hetken:

Niin

Yhteenvetona voidaan todeta, että todennäköisyys sille, että satunnainen virhe osuu tietylle välille, joka on yhtä suuri kuin kuvan 7 varjostettu alue

2. Havaintotulosten jakaumien luokasta tietyllä varianssilla löydämme sellaisen, joka maksimoi entropian jos on rajoituksia:

, , , .

Ratkaisu tähän ongelmaan löytyy myös Lagrange-kertoimien menetelmästä. Havaintojen tulosten haluttu jakautumistiheys kuvataan lausekkeella

Yhtälöiden (25) ja (26) kuvaamaa jakaumaa kutsutaan normaali tai Gaussin jakauma.

Kuvassa 8 on esitetty satunnaisvirheiden normaalijakauman käyrät eri keskihajonnan arvoille .

Kuvasta näkyy, että keskihajonnan kasvaessa jakauma leviää yhä enemmän, suurten virheiden todennäköisyys kasvaa ja pienempien virheiden todennäköisyys pienenee, ts. havaintotulosten hajonta kasvaa.

Lasketaan todennäköisyys, että havainnon tulos osuu jollekin määrätylle välille:

Muutetaan muuttujia:

Sitten saadaan seuraava lauseke halutulle todennäköisyydelle:

Hakasulkeissa olevia integraaleja ei ilmaista alkeisfunktioissa, joten ne lasketaan käyttämällä ns. normalisoitua normaalijakaumaa differentiaalifunktiolla

funktion F( z) todennäköisyys löydetään muodossa

(29)

Tätä kaavaa käytettäessä on pidettävä mielessä identiteetti

Seuraa suoraan funktion Ф( z).

Virheiden normaalijakauman laaja jakautuminen mittauskäytännössä selittyy todennäköisyysteorian keskeisellä rajalauseella, joka on yksi merkittävimmistä matemaattisista teoreemoista, jonka kehittämiseen osallistuivat monet merkittävät matemaatikot - De Moivre, Laplace, Gauss , Chebyshev ja Ljapunov. Keskirajalause väittää, että satunnaisvirheiden jakauma tulee olemaan lähellä normaalia aina, kun havainnon tulokset muodostuvat useiden itsenäisesti vaikuttavien tekijöiden vaikutuksesta, joista kullakin on vain pieni vaikutus verrattuna kaikkien muiden kokonaisvaikutukseen.

3. Oletetaan, että havaintojen tulokset ovat normaalijakautuneita, mutta niiden keskihajonta on satunnaisarvo, joka vaihtelee kokemuksesta toiseen. Tämä oletus on varovaisempi kuin oletus invarianssista koko mittausajan ajan. Tässä tapauksessa samalla tavalla kuin ennenkin päätellen on helppo todeta, että entropia on maksimoitu, jos havaintojen tuloksilla on Laplacen jakauma tiheydellä

(30)

missä on matemaattinen odotus, on havaintotulosten keskihajonta. Laplace-jakaumaa tulee käyttää tapauksissa, joissa tarkkuusominaisuuksia ei tiedetä etukäteen tai ne ovat epävakaita ajan myötä.

Satunnaisvirheiden differentiaalijakaumafunktio saadaan korvaamalla lausekkeeksi (30):

Jakauman vinouma on nolla, koska jakauma on symmetrinen nollan suhteen ja kaavan (22) mukainen kurtoosi on

Näin ollen normaalijakaumaan verrattuna ( esim= 0) tasainen jakauma on tasaisempi ( esim= -1,2), ja Laplace-jakauma on huippuluokkaa ( esim = 3).

Tilastotietojen esittämismuodot.

Tilastotiedot tulee esittää siten, että niitä voidaan käyttää. Niitä on 3 pääasiallista tilastotietojen esittämismuodot:

Teksti - tietojen sisällyttäminen tekstiin;

Taulukko - tietojen esittäminen taulukoissa;

Graafinen - tiedon ilmaisu kaavioiden muodossa.

Teksti lomake käytetään pienen määrän digitaalista dataa kanssa.

taulukkomuotoinen käytetään useimmin, koska se on tehokkaampi tapa esittää tilastotietoja. Toisin kuin matemaattiset taulukot, jotka alkuehtojen mukaan mahdollistavat yhden tai toisen tuloksen saamisen, tilastotaulukot kertovat lukujen kielen tutkittavista objekteista.

Tilastotaulukko- tämä on rivi- ja sarakejärjestelmä, jossa tilastotietoa sosioekonomisista ilmiöistä esitetään tietyssä järjestyksessä ja yhteydessä.

Erottele tilastotaulukon aihe ja predikaatti. Kohde osoittaa luonnehditun kohteen - joko populaation yksiköt tai yksikköryhmät tai kokonaisuuden kokonaisuutena. Predikaatissa subjektin tunnus on annettu, yleensä numeerisessa muodossa. Taulukon otsikko on pakollinen, joka kertoo mihin luokkaan ja mihin aikaan taulukon tiedot kuuluvat.

Tilastotaulukot jaetaan aiheen luonteen mukaan yksinkertaisiin, ryhmä- ja yhdistelmätaulukoihin. Yksinkertaisen taulukon aiheessa tutkimuskohdetta ei jaeta ryhmiin, vaan joko annetaan luettelo kaikista perusjoukon yksiköistä tai ilmoitetaan populaatio kokonaisuudessaan. Ryhmätaulukon aiheessa tutkittava kohde on jaettu ryhmiin yhden attribuutin mukaan ja predikaatti ilmaisee ryhmien yksiköiden lukumäärän (absoluuttinen tai prosentteina) ja ryhmien yhteenvetoindikaattorit. Yhdistelmätaulukon aiheessa väestö on jaettu ryhmiin ei yhden, vaan usean kriteerin mukaan.

Taulukoita laadittaessa tulee noudattaa seuraavia yleisiä sääntöjä.

Taulukon aihe sijaitsee vasemmassa (harvoin - yläosassa) ja predikaatti - oikealla (harvemmin - alemmalla).

Sarakeotsikoissa on tunnuslukujen nimet ja niiden mittayksiköt.

Viimeinen rivi täydentää taulukon ja sijaitsee sen lopussa, mutta joskus se on ensimmäinen: tässä tapauksessa toinen rivi kirjoitetaan "mukaan lukien", ja seuraavat rivit sisältävät kokonaisrivin komponentit.

Numeeriset tiedot kirjoitetaan samalla tarkkuudella kuhunkin sarakkeeseen siten, että numeroiden numerot sijaitsevat numeroiden alla, ja kokonaislukuosa erotetaan murto-osasta.

Taulukko ei saa sisältää tyhjiä soluja: jos data on nolla, laitetaan "–"-merkki (viiva); jos tietoja ei tunneta, tehdään merkintä "ei tietoja" tai merkitään "…" (ellipsi). Jos eksponenttiarvo ei ole nolla, vaan ensimmäinen merkitsevä numero ilmestyy hyväksytyn tarkkuusasteen jälkeen, kirjataan 0,0 (jos esimerkiksi tarkkuusaste 0,1 hyväksyttiin).

Joskus tilastotaulukoita täydennetään kaavioilla, kun tavoitteena on korostaa jotakin aineiston ominaisuutta, vertailla niitä. Graafinen muoto on tehokkain tiedon esitysmuoto niiden havainnoinnin kannalta. Graafeiden avulla saavutetaan rakenteen ominaisuuksien, dynamiikan, ilmiöiden suhteiden ja niiden vertailun näkyvyys.

TILASTOTIEDON GRAAFIINEN ESITTÄMINEN, menetelmä sosioekonomisia ilmiöitä koskevan tiedon visuaaliseen esittämiseen ja yleistämiseen geometristen kuvien, piirustusten tai kaavamaisten maantieteellisten karttojen ja niitä selittävien merkintöjen avulla. Tilastotietojen graafinen esitys näyttää selkeästi ja visuaalisesti sosiaalisen elämän ilmiöiden ja prosessien väliset suhteet, niiden kehityksen pääsuuntaukset, niiden avaruusjakauman asteen; voit nähdä sekä ilmiöiden kokonaisuuden kokonaisuutena että sen yksittäiset osat.

Tilastotietojen graafiseen esittämiseen käytetään erilaisia ​​tilastokaavioita. Jokainen kaavio koostuu graafisesta kuvasta ja apuelementeistä. Näitä ovat: kaavion selitys, paikkaviittaukset, mittakaavaviitteet, karttakenttä. Apuelementit mahdollistavat kaavion lukemisen, ymmärtämisen ja käytön. Kaaviot voidaan luokitella useiden ominaisuuksien mukaan: graafisen kuvan muodosta riippuen ne voivat olla piste-, viiva-, tasomaisia, spatiaalisia ja kiharaisia. Grafiikan rakennusmenetelmän mukaan ne jaetaan kaavioihin ja tilastollisiin karttoihin.

Yleisin graafisten kuvien tapa on kaavio. Tämä on piirros, jossa tilastotiedot esitetään geometrisina kuvioina tai merkkeinä ja alue, johon nämä tiedot liittyvät, on osoitettu vain sanallisesti. Jos kaavio on päällekkäin maantieteellisen kartan tai sen alueen suunnitelman päällä, johon tilastotiedot liittyvät, kuvaajaa kutsutaan karttakaavioksi. Jos tilastotiedot esitetään varjostamalla tai värittämällä vastaava alue maantieteellisellä kartalla tai suunnitelmalla, kuvaajaa kutsutaan kartogrammiksi.

Eri tyyppisiä kaavioita voidaan käyttää vertaamaan samanlaisia ​​eri kohteita tai alueita kuvaavia tilastotietoja. Näkyvimmät ovat pylväskaaviot, joissa tilastotiedot näkyvät pystysuunnassa pitkänomaisina suorakulmioina. Niiden selkeys saavutetaan vertaamalla pylväiden korkeutta (kuva 1).

Jos perusviiva on pystysuora ja palkit vaakasuorat, kaaviota kutsutaan kaistalekaavioksi. Kuvassa 2 on vertailupylväskaavio, joka kuvaa maapallon aluetta.

Populaaristamiseen tarkoitetut kaaviot rakennetaan toisinaan vakiokuvioihin - näytettävälle tilastotiedolle tyypillisiksi piirroksiksi, mikä tekee kaaviosta ilmaisuvoimaisemman ja kiinnittää siihen huomion. Tällaisia ​​kaavioita kutsutaan kiharaiksi tai kuvallisiksi (kuva 3).

Suuri joukko suuntaa antavia kaavioita on rakennekaavioita. Tilastotietojen rakenteen graafisen esittämisen menetelmä koostuu rakenteellisten ympyräkaavioiden tai ympyräkaavioiden laatimisesta (kuva 4).

Ilmiöiden ajallisen kehityksen kuvaamista ja analysointia varten laaditaan dynamiikkakaavioita: pylväs, kaistale, neliö, ympyrä, lineaarinen, säteittäinen jne. Kaavion tyypin valinta riippuu lähtötietojen ominaisuuksista, tutkimuksen tarkoitus. Jos esimerkiksi on olemassa sarja dynamiikkaa, joiden tasot ovat hieman epätasaiset ajallisesti (1913, 1940, 1950, 1980, 2000, 2005), käytetään pylväs-, neliö- tai ympyräkaavioita. Ne ovat visuaalisesti vaikuttavia, hyvin muistettuja, mutta eivät sovellu kuvaamaan suurta määrää tasoja. Jos dynamiikkasarjan tasojen määrä on suuri, käytetään viivakaavioita, jotka toistavat kehitysprosessin jatkuvan katkoviivan muodossa (kuva 5).

Usein samassa viivakaaviossa esitetään useita käyriä, jotka antavat vertailevan kuvauksen eri indikaattoreiden tai saman indikaattorin dynamiikasta eri maissa (kuva 6).

Yhden indikaattorin riippuvuuden näyttämiseksi toisesta luodaan suhdekaavio. Yksi indikaattori on X ja toinen Y (eli X:n funktio). Muodostetaan suorakaiteen muotoinen koordinaattijärjestelmä asteikoilla indikaattoreita varten ja siihen piirretään kuvaaja (kuva 7).

Tietotekniikan ja sovellettavien ohjelmistojen kehitys on mahdollistanut paikkatietojärjestelmien (GIS) luomisen, jotka edustavat laadullisesti uutta vaihetta tiedon graafisessa esittämisessä. GIS tarjoaa paikkakoordinoitujen tietojen keräämisen, tallennuksen, käsittelyn, pääsyn, näyttämisen ja jakelun; sisältää suuren määrän graafisia ja temaattisia tietokantoja sekä malli- ja laskentatoimintoja, jotka mahdollistavat tiedon esittämisen tila- (kartografisessa) muodossa, monikerroksisten sähköisten karttojen hankkimisen alueesta eri mittakaavassa. Alueellisen kattavuuden mukaan GIS-tyypit erotetaan globaaleista, submannerisista, osavaltioista, alueellisista ja paikallisista. GIS:n aihesuuntauksen määräävät sen avulla ratkeavat tehtävät, joihin voi sisältyä resurssien inventointi, analysointi, arviointi, seuranta, hallinta ja suunnittelu.

Lit .: Gerchuk Ya. P. Graafiset menetelmät tilastoissa. M., 1968; Tilastoteoria / Toimittanut R. A. Shmoylova. 4. painos M., 2005. S. 150-83.