Kuinka työskennellä tilasto-ohjelmassa. Ilmaisia ​​ohjelmia tilastotietojen analysointiin

Yleiskatsaus tilasto-ohjelmiin






Kokeen suunnitteluvaiheessa Näytteenotto-valikon toiminnot ovat hyödyllisiä tutkijalle, jolloin voit määrittää tarvittavan määrän ryhmiä joihinkin yleisimpiin tutkimustehtäviin. MedCalcissa toteutetuista toiminnoista on syytä mainita erityisesti kyky suorittaa tilastollisen analyysin perustyyppejä ilman näytearvoja, ts. perustuu keskiarvoihin, hajontaindikaattoreihin jne. Tästä voi olla hyötyä tutkittaessa kirjallisuusaineistoa, koska julkaisuissa ei ole täydellistä tietoa kokeen primäärituloksista. Esimerkiksi otoskeskiarvojen vertailuun Studentin testillä riittää, että tiedät itse aritmeettiset keskiarvot, keskihajonnan ja molempien otosten koot. Nämä tiedot tulee syöttää ikkunaan Testit > Vertailu >


Otsikko: Tilasto-ohjelmien katsaus
Yksityiskohtainen kuvaus:

Työn tuottavuus liittyy läheisesti käytettyihin työkaluihin. Joten legendan mukaan Arkhimedes sanoi, että hän voisi kääntää Maan, jos hän saisi tarvittavan tukipisteen ja vipuvaikutuksen. Mutta suurella filosofilla ei ollut tarvittavia työkaluja, ja planeettamme lentää edelleen kiertoradalla. Vastaava tilanne on tutkimustulosten tilastollisen analyysin alalla. On täysin mahdollista suorittaa tilastotietojen käsittely pelkällä kynällä ja paperilla, mutta se on paljon nopeampaa ja tehokkaampaa tehdä erikoistyökalujen, nimittäin tilastoohjelmistojen, avulla. Tarkkaan ottaen tilastolliseen analyysiin käytetyt ohjelmistopaketit tulisi luokitella matemaattisiksi ohjelmiksi, joten tässä artikkelissa termejä "matemaattinen" ja "tilastollinen" käytetään vaihtokelpoisina.

Pääsääntöisesti nuoret tutkijat ottavat ensimmäiset askeleensa tilastoissa taulukkolaskentaprosessoreilla, ja suurin osa käyttää MS Exceliä. Toiseksi suosituin taulukkolaskentaprosessori nykyään on Calc OpenOffice.org-toimistopaketista. Valitettavasti jotkut tutkijat pitävät näitä ohjelmia kätevimpänä ja sopivimpana analyysityökaluna. He ovat kuitenkin väärässä. Tällaisten ohjelmistojen käyttö on sallittua tapauksissa, joissa on tarpeen suorittaa yksinkertaisia ​​toimintoja, kuten tietojen lajittelua, kuvaavien tilastojen laskemista, tietyntyyppisten kaavioiden rakentamista sekä yksinkertaisesti kokeen perustietojen tallentamista ja laboratoriopäiväkirjan pitämistä. Toisin sanoen tutkimustulosten täydellinen tilastollinen käsittely Excelissä on mahdotonta. Tämä on toimistosovellus, ei tieteellinen.

Kaikki tieteelliset matemaattiset sovellukset voidaan jakaa kahteen suureen ryhmään: ohjelmat, joissa on graafinen käyttöliittymä ja ilman sitä. Sinun ei pitäisi ajatella, että graafinen käyttöliittymä jotenkin luonnehtii ohjelmistotuotteen laatua. Nämä ominaisuudet eivät ole millään tavalla riippuvaisia ​​toisistaan. Tällaisella jaolla on kuitenkin suuri käytännön merkitys. Tosiasia on, että kaikki eivät voi mukavasti työskennellä komentorivillä. Nykyään monet tietokoneen käyttäjät eivät edes ajattele luopuvansa "klikedromeista", joilla vaikuttava osa nykyaikaista IT-alaa lepää. Matemaattisten laskutoimitusten suorittaminen on kuitenkin edelleen kätevämpää kirjoittamalla komentoja näppäimistöltä sen sijaan, että napsautat useita näytön painikkeita. Siksi vakavissa sovelluksissa on komentorivitila, jossa on sisäänrakennettu ohjelmointikieli ja graafinen käyttöliittymä.

Ensin tutustutaan tilastolaskentaympäristöön ja ohjelmointikieleen R. Sen juuret ovat S-ohjelmointikielessä, jonka kanssa niillä on paljon yhteistä. R:n vakiopaketti ei sisällä monille käyttäjille tuttua graafista käyttöliittymää. Tämän seurauksena useilla tutkijoilla on virheellinen mielipide, että tällä työkalulla voit suorittaa vain numeerisia laskelmia, mutta sillä ei ole kykyä luoda kaavioita. Tämä on väärin. R-järjestelmässä on laajat mahdollisuudet tilastotietojen käsittelyyn, mukaan lukien työskentely grafiikan kanssa, ja ikkunaliittymä voidaan asentaa lisäsovellukseksi. Mutta on syytä muistaa, että R:n graafiset käyttöliittymät ovat huomattavasti huonompia kuin muiden tilastopakettien.

Voit asentaa R-ympäristön Windows-, MacOS- tai Linux-tietokoneeseen. Kun käynnistät R-järjestelmän, kokemattomalle käyttäjälle tulee kysymys: "Mihin minun pitäisi syöttää tiedot?" Sisäänrakennetun taulukkoeditorin puuttuessa analysoidut tiedot joko syötetään suoraan komentoriville argumenttina vastaaville funktioille tai ladataan ulkoisista tiedostoista. Ensimmäinen vaihtoehto on kätevä, kun työskentelet yksittäisten arvojen kanssa, ja toinen - tapauksissa, joissa on tarpeen työskennellä taulukoiden kanssa. Itse taulukot voidaan luoda millä tahansa taulukkolaskentaprosessorilla, ja tiedostot voidaan tallentaa *.csv-muodossa, joka on helppo ladata R:hen.

Kun olet ladannut tiedot muuttujiin, voit aloittaa sen käsittelyn käyttämällä valtavaa määrää R:ssä toteutettuja toimintoja. Mutta sinun tulee muistaa, että kaikki välitiedot tämän kielen kanssa työskennellessäsi ei tallenneta väliaikaisiin tiedostoihin, vaan suoraan RAM-muistiin. Tämä ominaisuus on pidettävä mielessä, kun käsitellään erittäin suuria tietomääriä: R käyttää huomattavan osan tietokoneen RAM-muistista.
Kielen syntaksi on melko yksinkertainen ja helppo oppia. Tähän mennessä on kirjoitettu yli sata kirjaa erilaisista R-tilastolaskentaympäristön käyttöalueista, mutta ne kaikki ovat englanninkielisiä. Valitettavasti venäjänkielistä tietoa on edelleen hyvin vähän ja se esitetään vain hajallaan olevien artikkeleiden muodossa joistakin tämän ohjelmointikielen käyttöä koskevista kysymyksistä. Juuri tiedon puute jarruttaa laadukkaan ohjelmistopaketin leviämistä maassamme (vaikka se on ilmainen).

R:n luotettavuus tulee sen alkuperästä. Kieli luotiin ilmaisena toteutuksena erittäin tehokkaasta S-ohjelmointikielestä, jonka historia ulottuu vuoteen 1976, jolloin ensimmäinen toimiva versio ilmestyi. Nykyään S-kieli on TIBCO Software Inc:n kehittämän S-PLUS -sovelluksen perusta, ja toisin kuin R, se on kaupallinen tuote. S-PLUS:ssa on hieno graafinen käyttöliittymä, johon tietoja voidaan syöttää lataamalla ulkoisesta tiedostosta, tietokannasta tai kopioimalla taulukko tekstitiedostosta tai taulukkolaskentaohjelmasta. S-PLUS, kuten R, voi toimia eri käyttöjärjestelmissä ja sitä voidaan käyttää numeeristen ja graafisten analyysimenetelmien suorittamiseen.

Toinen suosittu tilastosovellus on SAS, joka syntyi 1960-luvulla North Carolinan yliopistossa maatalouden tutkimustulosten analysointisovellukseksi. Nykyään järjestelmän kehittämistä jatkaa SAS Institute, joka on julkaissut jo yhdeksännen version tästä ohjelmasta. SAS:n soveltamisalaan kuuluu laaja valikoima tieteellistä tutkimusta, liiketoimintaanalytiikkaa jne.

Järjestelmä koostuu moduuleista, joista jokainen suorittaa tietyn joukon tehtäviä. BASE- ja STAT-moduuleja käytetään useimmiten tilastollisessa käsittelyssä. SAS-järjestelmä toteuttaa oman ohjelmointikielensä, joka on syntaksiltaan lähempänä BASICia eikä ole samanlainen kuin R tai S. Järjestelmän avulla voit ladata tietoja ulkoisista tiedostoista tai syöttää ne suoraan pääteikkunaan. Työskentely SAS:n kanssa voit suorittaa eri monimutkaisuustason tietojen tilastollista käsittelyä annettujen tehtävien mukaisesti. Vuorovaikutus ohjelman kanssa on mahdollista sekä konsolitilassa että graafisen käyttöliittymän kautta, joka on graafinen kuori SAS-ohjelmointikielen komentojen yksinkertaistamiseen.

Pääasiassa komentorivikäyttöliittymää käyttäviin ohjelmiin kuuluu myös amerikkalaisen StataCorp-yhtiön kehittämä Stata. Sovellus voi toimia Windows-, MasOS- ja Linux-käyttöjärjestelmissä. Tietojen syöttäminen tänne on mahdollista joko lataamalla ulkoisista tiedostoista tai käyttämällä sisäänrakennettua taulukkoeditoria, joka on melko yksinkertainen, mutta antaa sinun suorittaa kaikki tarvittavat käsittelyt taulukoiden kanssa. Stata-sovelluksen kanssa työskentelyn periaatteet eivät poikkea yllä kuvattujen ohjelmien käytön periaatteista. Käyttäjät, joille päätetila on hankalaa, voivat käyttää ohjelmavalikkoa luodakseen automaattisesti sisäänrakennettuja ohjelmointikielikomentoja.
Kaikkia kuvattuja tilastopaketteja voidaan käyttää minkä tahansa tyyppiseen tilastolliseen analyysiin. Siten R-kielen toimivuutta voidaan muuttaa lisäämällä funktiokirjastoja, jotka on suunnattu tiukasti tietyntyyppiseen tehtävään. Lisäksi kuka tahansa, jolla on riittävät tiedot ja kokemus tästä kielestä, voi luoda omia toimintoja ja kirjastoja, jotka vastaavat tietyn käyttäjän erityispiirteitä.

Mutta "yleisen profiilin" tilastoohjelmistojen lisäksi on olemassa ohjelmia, jotka on suunnattu biolääketieteellisen tutkimuksen alalla työskenteleville tutkijoille. Näin ollen belgialaisen MedCalc Softwaren vuodesta 1993 kehittämä MedCalc-ohjelma sijoittuu biolääketieteen tutkijoiden tarpeiden mukaan laadituksi täysimittaiseksi tilastosovellukseksi. Kehittäjät kiinnittävät tutkijoiden huomion MedCalcin helppokäyttöisyyteen ROC-käyrien analysoinnissa.

Ohjelma on kätevä, koska se ei tarjoa redundantteja toimintoja, mikä usein hämmentää valmistautumattoman henkilön, joka alkaa työskennellä yleissovellusten kanssa. Tämän lisäksi kyky työskennellä vain graafisessa käyttöliittymässä ilman komentoriviä tekee ohjelmasta vähemmän joustavan, mutta houkuttelevamman käytettäväksi tällä tieteenalalla, koska lääketieteen koulutuksen saaneet asiantuntijat voivat harvoin ylpeillä laajasta kokemuksesta matemaattiset ohjelmat.

Tähän mennessä ohjelmasta on luotu kahdestoista versio. Valitettavasti vain Windows-käyttäjät voivat työskennellä MedCalcissa, mutta tämän haitan kompensoivat suhteellisen alhaiset järjestelmävaatimukset ja kyky suorittaa sovellusta sekä Windows 2000:ssa että Windows 7:ssä. Niille, jotka eivät ole koskaan käyttäneet ohjelmaa, on mahdollista ladata täysin toimiva demoversio tuotteesta medcalc.org:sta, joka toimii ilman rajoituksia viisitoista päivää. Lisäksi paketti sisältää demotiedostoja, jotka sisältävät datajoukkoja ja esimerkkejä niiden analysoinnista.

Tietojen syöttäminen MedCalciin suoritetaan integroidulla taulukkoeditorilla tai tuomalla eri muotoisia tiedostoja, kuten *.csv, excel jne. Voit kutsua sisäänrakennetun editorin valitsemalla valikosta Taulukko-komennon, jonka jälkeen voi aloittaa taulukon luomisen. Tilastoohjelmissa taulukoiden sarakkeita kutsutaan "muuttujiksi" ja rivejä "tapauksiksi". Taulukkoa luotaessa on hyödyllistä noudattaa useita sääntöjä:
. Ensimmäisen muuttujan tulee sisältää tapausten sarjanumerot. Tämä on tarpeen, jotta niiden edellinen järjestys voidaan palauttaa arvojen uudelleen lajittelun jälkeen.
. Numeeriset arvot tulee syöttää ilman pyöristystä tietojen menettämisen välttämiseksi.
. Jos joitain arvoja puuttuu, voit ohittaa ne jättäen taulukkoon tyhjiä soluja.
. Jokaisella muuttujalla saa olla vain yksi arvo kullekin tapaukselle.

Taulukon tallennuksen tai datan sisältävän tiedoston lataamisen jälkeen tietojenkäsittelyvaihe alkaa. Suorittaaksesi tilastollisen analyysin valitse Tilastot-valikosta sopiva kohta. Jokaisella analyysityypillä on omat asetukset, joihin saat apua napsauttamalla Ohje-painiketta.
Kokeen suunnitteluvaiheessa Näytteenotto-valikon toiminnot ovat hyödyllisiä tutkijalle, jolloin voit määrittää tarvittavan määrän ryhmiä joihinkin yleisimpiin tutkimustehtäviin. MedCalcissa toteutetuista toiminnoista on syytä mainita erityisesti kyky suorittaa tilastollisen analyysin perustyyppejä ilman näytearvoja, ts. perustuu keskiarvoihin, hajontaindikaattoreihin jne. Tästä voi olla hyötyä tutkittaessa kirjallisuusaineistoa, koska julkaisuissa ei ole täydellistä tietoa kokeen primäärituloksista. Esimerkiksi otoskeskiarvojen vertailuun Studentin testillä riittää, että tiedät itse aritmeettiset keskiarvot, keskihajonnan ja molempien otosten koot. Nämä tiedot tulee syöttää ikkunaan Testit > Vertailu > keskiarvot (t-testi), ja vertailutulos näytetään samassa ikkunassa. Muita Testit-valikon toimintoja käytetään samalla tavalla.

Siten MedCalc-ohjelma tarjoaa suhteellisen alhaisella hinnalla käyttäjälle kätevän käyttöliittymän ilman tarpeettomia "toiminnallisuuksia", joka on varustettu hyvällä laskentataulukkoeditorilla. Kaikki laskelmat ja kaaviot tallennetaan yhteen tiedostoon ja ne lajitellaan helposti erityiseen luetteloon pääohjelman pääikkunan vasemmalla puolella. Tilastollinen analyysi tehdään kätevästi järjestettävillä valikoilla, jotka on varustettu tiiviillä ja ymmärrettävällä viitemateriaalilla. Tässä suhteessa ohjelma on erittäin hyödyllinen biolääketieteellistä tutkimusta suorittaville ja matemaattisissa sovelluksissa kokemattomille tutkijoille.

MedCalcl on yksinkertainen ja helppokäyttöinen ohjelma, mutta kaikki käyttäjät eivät voi saada siitä kaikkea, mitä hän tarvitsee työnsä suorittamiseen. Niiden joukossa, jotka asettavat erittäin korkeat vaatimukset tilastoohjelmistoille ja ovat valmiita maksamaan siitä useita tuhansia dollareita, sovellukset, kuten Statistica tai SPSS Statistics, ovat suosittuja. Molemmat ohjelmat ovat todellisia "hirviöitä" MedCalciin verrattuna - sekä kustannuksiltaan että laskentaominaisuuksiltaan. Niistä on mahdotonta puhua yksityiskohtaisesti artikkelin puitteissa, tätä varten sinun on kirjoitettava useita satoja sivuja sisältävä kirja, joten rajoitamme lyhyeen johdatukseen.

Statistican on kehittänyt StatSoft. Tähän mennessä viimeisin versio on Statistica 9. SPSS-ohjelma, jonka nimi on lyhenne sanoista Statistical Package for the Social Sciences, tuli suhteellisen hiljattain IBM:n omistukseen ja muutti nimensä PASW (Predictive Analytics SoftWare) Statisticsiksi. Molemmissa ohjelmissa on erinomainen graafinen käyttöliittymä, sisäänrakennettu ohjelmointikieli ja kyky integroida tilastolaskentakielen R kanssa.

On huomattava, että näiden työkalujen tarjoamat lähes rajattomat mahdollisuudet tilastolliseen käsittelyyn vaativat suuria tietokoneresursseja. Näin ollen SPSS vaatii vähintään 1 Gt RAM-muistia toimiakseen. Käyttöjärjestelmät, jotka voivat käyttää SPSS:ää: Windows, MacOS ja Linux. Statistica on kehitetty vain Windowsille, mikä vähentää jonkin verran sen käyttäjien määrää.

Kuten aina, työ ohjelmissa alkaa tietojen syöttämisellä. Integroidun taulukkoprosessorin avulla voit luoda taulukoita jokaiselle toimistosovellusten käyttäjälle tutuilla menetelmillä. Tallennetut taulukot sekä laskentatulokset, kaaviot ja raportit Statistikassa voidaan järjestää kätevästi yhteen tiedostoon nimeltä "työkirja", kun taas työtilan järjestäminen SPSS:ssä on vähemmän kätevää, mutta silti melko hyväksyttävää käytettäväksi lyhyen ajan kuluttua. sopeutumista.

Ohjelmat sisältävät kaikki suosituimmat tilastolliset menetelmät: frekvenssianalyysi, tilastollisten ominaisuuksien laskenta, kontingenssitaulukot, korrelaatiot, piirtäminen, t-testit ja suuri määrä ei-parametrisia testejä, monimuuttuja lineaarinen regressioanalyysi, diskriminanttianalyysi, tekijäanalyysi, klusteri analyysi, varianssianalyysi, luotettavuusanalyysi, moniulotteinen skaalaus ja monet muut. Näiden tilastollisten toimintojen kutsuminen tapahtuu valitsemalla valikosta sopivat ikkunat ja tekemällä niihin tarvittavat asetukset. Kaikki analyysityypit on jaettu ryhmiin, mikä auttaa sinua navigoimaan nopeasti sovelluksen käyttöliittymässä.

STATISTICA- ja SPSS-järjestelmillä on laajat graafiset ominaisuudet. Ne sisältävät suuren määrän erilaisia ​​luokkia ja graafisia tyyppejä, mukaan lukien tieteelliset, liiketoiminnalliset, kolmiulotteiset ja kaksiulotteiset graafit erilaisissa koordinaattijärjestelmissä, erikoistuneet tilastokaaviot - histogrammit, matriisi, luokitellut graafit jne.

Molemmissa sovelluksissa saatavilla olevat tilastofunktiot ovat hämmästyttäviä monipuolisuudessaan. Näyttää siltä, ​​​​että näiden tilastollisten analyysityökalujen avulla voit tehdä mitä tahansa, jos käyttäjä on perehtynyt perusteellisesti niiden toimintaan. Suurin este näiden ohjelmien hallitsemiselle on koulutukseen käytettävä aika. Juuri käyttäjän tietämättömyyden vuoksi tämän tason tilastopakettien tehoa ei useimmiten käytetä puoliksikään.

Kuten näette, maailmassa on monia sovelluksia tilastolliseen analyysiin. Vain pieni osa niistä on kuvattu lyhyesti tässä artikkelissa. Sen ulkopuolella oli sellaisia ​​ohjelmia kuin Minitab, MatLab, Octave, GenStat, JMP, Analyse-it, kotimaista kehitystä STADIA ja monia muita, suuria ja pieniä, kalliita ja ilmaisia ​​ohjelmia. Tällainen ohjelmistojen runsaus ei kuitenkaan saisi pelotella tutkijaa, riittää, että kerran tekee harkitun valinnan yhden tai kahden ohjelman hyväksi, tutkii huolellisesti niiden käytön hienouksia ja ne toimivat uskollisina avustajina tilastollisessa analyysissä. koetuloksista useiden vuosien ajan.



TILASTO on järjestelmä tilastotietojen analysointiin, joka sisältää laajan valikoiman analyyttisiä menettelyjä ja menetelmiä:
yli 100 erilaista kaaviota, kuvaavat ja ryhmän sisäiset tilastot, tutkiva data-analyysi, korrelaatiot, nopeat perus- ja lohkotilastot, interaktiivinen todennäköisyyslaskin, T-testit (ja muut ryhmäerotestit), taajuus-, satunnaisuus-, lippu- ja otsikkotaulukot, monimuuttujaanalyysin vastaukset, moninkertainen regressio, ei-parametriset tilastot, yleinen varianssi- ja kovarianssimallin analyysi, jakauman sovitus, tiedon louhinta, neuroverkot ja paljon muuta. STATISTICA-sarjan tuotteet perustuvat uusimpiin teknologioihin, noudattavat täysin IT:n viimeisimpiä edistysaskeleita, mahdollistavat tietojen analysoinnin ja käsittelyn ongelmien ratkaisemisen ja ovat ihanteellisia käytännön ongelmien ratkaisemiseen markkinoinnissa, rahoituksessa, vakuutuksessa ja taloustieteessä. , liiketoiminta, teollisuus, lääketiede jne. .d.

Comsol Multiphysics 4.3
Ohjelma monimutkaisten tieteellisten ja teknisten ongelmien äärellisten elementtien laskemiseen. COMSOL Multiphysicsin avulla voit simuloida lähes kaikkia osittaisdifferentiaaliyhtälöillä kuvattuja fyysisiä prosesseja. Ohjelma sisältää erilaisia ​​ratkaisijoita, jotka auttavat sinua selviytymään nopeasti monimutkaisimmistakin ongelmista, ja sovelluksen yksinkertainen rakenne takaa käytön helppouden ja joustavuuden. Minkä tahansa ongelman ratkaisu perustuu osittaisdifferentiaaliyhtälöiden numeeriseen ratkaisuun elementtimenetelmällä. Ohjelmassa mallinnettavissa olevien tehtävien kirjo on erittäin laaja.

Ohjelman erikoismoduulit kattavat lähes kaikki osittaisdifferentiaaliyhtälöiden käyttöalueet.
COMSOL Multiphysics (Femlab) on simulaatiopaketti, joka ratkaisee epälineaaristen osittaisdifferentiaaliyhtälöiden järjestelmiä elementtimenetelmillä yhdessä, kahdessa ja kolmessa ulottuvuudessa. Sen avulla voit ratkaista ongelmia sähkömagnetismin, elastisuusteorian, nesteiden ja kaasujen dynamiikan ja kemiallisen kaasudynamiikan alalla. Femlab mahdollistaa myös ongelman ratkaisemisen sekä matemaattisessa formulaatiossa (yhtälöjärjestelmän muodossa) että fysikaalisessa muodossa (valitsemalla fyysinen malli, esimerkiksi diffuusioprosessin malli). Tietysti joka tapauksessa yhtälöjärjestelmä ratkaistaan, ja ero on vain kyvyssä käyttää fyysisiä yksikköjärjestelmiä ja fyysistä terminologiaa. Ns. fysikaalisessa toimintatavassa on myös mahdollista käyttää ennalta määriteltyjä yhtälöitä useimpiin tieteen ja teknologian ilmiöihin, kuten lämmön ja sähkön siirtoon, kimmoteoriaan, diffuusioon, aallon etenemiseen ja nestevirtaukseen.

TILASTO
Vuosi/julkaisupäivä: 2011
Versio: 10.0.1011
Bittisyvyys: 32-bittinen
Vista-yhteensopivuus: koko
Windows 7 -yhteensopivuus: koko
Käyttöliittymän kieli: Englanti
Tabletti: Esittää

Comsol Multiphysics 4.3
Vuosi/julkaisupäivä: 2012
Versio: 4.3 koontiversio 151 (koontiversio 184, jos asennat päivityksen 1)
Bittinen syvyys: 32-bittinen ja 64-bittinen
Yhteensopiva Vistan ja Windows 7:n kanssa: koko
Käyttöliittymän kieli: Englanti
Tabletti: Esittää
Rakennekoko: 5,18 Gt

Kuinka korjata ongelmat:
1. Jos lisenssissä on ongelma (asennuksen tai käynnistyksen aikana) ja työskentelet etätyöpöydän kautta, yritä käyttää Radminia.
2. Jos mitään ei näy pääikkunassa, kokeile vaihtaa Options -> Preferences -> Graphics -> Rendering to jotain muuta (oletus on OpenGL, eli yleensä joudut vaihtamaan DirectX:ään... voit myös Ohjelmistoon, mutta se on hitaampi).

Lyhyesti ohjelman perustoimintojen suorittamisestaStatistica 6.0

Tietojen valmistelu käsittelyä varten

Kaikki tiedot on esitettävä taulukkomuodossa.

Jokainen taulukon rivi edustaa yhtä tutkimukseen osallistunutta. Eli jos tutkittiin yhteensä esimerkiksi 42 henkilöä (sekä koe- että kontrolliryhmät yhdessä), niin taulukossa on 42 riviä plus otsikot.

Jokainen taulukon sarake on muuttuja.

Kun valmistellaan tietoja muuttuja Otamme huomioon kaikki tutkimukseen osallistujaa koskevat tiedot. Esimerkiksi ensimmäinen muuttuja - taulukon ensimmäinen sarake - voi olla aiheen sarjanumero tai jopa jokin yksilöllinen nimi. Itse nimeä EI vaadita tutkimuksessa. Voi olla hyödyllistä vain syöttää tarkasti ja tarkasti kaikki tiedot tästä henkilöstä.

Seuraava muuttuja voisi olla ryhmätyyppi– kokeellinen tai kontrolli. Voit kutsua muuttujaa "ryhmä". Tämä muuttuja on täytettävä kaikkien tutkimukseen osallistuvien osalta. Huomaa: SAMAA nimitystä on käytettävä kaikille SAMAN ryhmän osallistujille. Esimerkiksi, ex.g.– kaikille koeryhmän osallistujille, laskuri.g.– kaikille kontrolliryhmän osallistujille. Seuraavaksi voit määrittää tutkimukseen osallistuneiden sukupuolen.

Esimerkkidatatiedostossa ensimmäinen muuttuja on Pol. Seuraava muuttuja on ikä. Tässä ikä on yksinkertaisesti ilmoitettu vuosina. Seuraavaksi tulee muuttuja Edu – koulutustaso. Tämä muuttuja voi ottaa vain 3 arvoa - "toissijainen erikoistunut", "korkeampi", "epätäydellinen korkeampi". Alla on palvelusaika vuosina. Seuraava muuttuja, siviilisääty, voi myös saada useita arvoja. Tässä esimerkissä kuusi ensimmäistä muuttujaa sisältävät yleistä sosiodemografista tietoa; Nämä eivät ole vielä tekniikoita.

Seuraavat kolme muuttujaa - nro 9, 10, 11 - vastaavat kolmea Maslach-metodologian asteikkoa (asteikkojen nimet eivät ole meille nyt tärkeitä). Jokainen niistä voi ottaa arvot 0: sta tietylle tasolle, nyt tämä ei ole tärkeää.

Muuttujat 12, 13 ja 14 – sosiopsykologisen ilmaston komponenttien arvioinnit: emotionaaliset, kognitiiviset ja käyttäytymiskomponentit. Laskettu menetelmän mukaan. Voi ottaa vain kolme arvoa -1, 0, 1.

Yhteensä esimerkissämme saamme 14 muuttujaa.

Kiinnitän huomionne siihen, että muuttujat ovat erilaisia. Olemme kiinnostuneita ensisijaisesti muuttujien jaosta metrinen Ja nominatiivi. Mittarimuuttujat - esimerkiksi ikä, älykkyysasteikon pisteet jne. - voivat saada erilaisia ​​arvoja tietyllä alueella, jolloin suurempi tai pienempi arvo vastaa mitattavan ominaisuuden korkeampaa tai matalampaa tasoa.

Nominatiiviset muuttujat voivat ottaa kiinteän määrän arvoja. Esimerkiksi muuttuja "gender". Se voi ottaa kaksi arvoa – M tai F. Muuttuja "koulutustaso": voi ottaa kolme arvoa - keskiasteen ammatillinen, korkeampi, keskeneräinen korkeampi. Ryhmätyyppi-muuttuja on myös nimeävä, sillä se määrittää, kuuluuko osallistuja koe- vai kontrolliryhmään.

Kysymys: Selvitä, mitkä tutkimuksesi muuttujat ovat metrisiä ja mitkä nimeäviä. Tämä on erittäin tärkeää tutkimusmenetelmien valinnassa.

Tämän työvaiheen tuloksena on taulukko, jossa on tiedot (koottu paperille tai - parempi - Exceliin) sekä ymmärrys siitä, mitkä muuttujat ovat metrisiä ja mitkä nimeäviä.

Uuden tiedoston luominen ohjelmassaStatistica 6.0

Avaa ohjelma ja valitse ylävalikosta Tiedosto–Uusi. (Suosittelen käyttämään ohjelman englanninkielistä versiota)

Näyttöön tulee ikkuna, jossa voit valita tarvittavan määrän muuttujia (NumberofVariables) ja havaintojen lukumäärän (NumberofCases). Esimerkissämme on 14 muuttujaa ja 78 havaintoa. Napsauta OK.


Saamme puhtaan tiedoston, johon voit syöttää tutkimustulokset. Tämä taulukko ei ehkä ole täysin näkyvissä, joten alhaalla ja oikealla on vierityspalkit.

Tämän vaiheen tulos on tyhjä arkki, jolle tutkimuksen tulokset voidaan kirjoittaa.

Esimerkki tällaisesta arkista on alla.

Datan syöttö

Jos loit tietotaulukon Excelissä, voit kopioida tiedot sieltä tilastoihin.

(Yleisesti ottaen Statistica-ohjelma tukee tietojen tuontia Excelistä, mutta tätä varten tiedot on järjestettävä erittäin oikein ja itse tuonti on suoritettava erittäin oikein. Virheitä voi tehdä. Siksi suosittelen tietojen siirtämistä "manuaalisesti".)

Kuinka luoda muuttujien nimiä

Uutta tiedostoa luotaessa kaikki siinä olevat muuttujat on jo allekirjoitettu ja niitä kutsutaan nimellä Muutt1, Muutt2, Muutt3 jne. Työskentelyn helpottamiseksi sinun on nimettävä ne uudelleen. Voit tehdä tämän kaksoisnapsauttamalla muuttujan otsikoita l eva Vastaanottaja jalka m yushki (nimitys – 2LKM). Ikkuna avautuu. Napsauta siinä "AllSpecs..." -painiketta kuvan osoittamalla tavalla.

Näyttöön tulee ikkuna, jossa voit merkitä kaikki muuttujat.

Napsauta sen jälkeen OK. Kirjoittamiesi muuttujien nimet näkyvät Muutt1:n jne. sijaan. Muuttujien numerointi säilyy, ja tämä on normaalia.

Seuraavaksi sinun on täytettävä koko taulukko tiedoilla. Jos olet jo syöttänyt tiedot Excel-ohjelmaan, voit valita sieltä tietoalueen (ilman numerointia ja ilman muuttujien nimiä), kopioida sen ja liittää sen Statistica-ohjelmaan.

Tämän jälkeen kannattaa tallentaa datatiedosto: menu File–SaveAs..., jonka jälkeen ilmoita mihin tämä tiedosto tulee sijoittaa ja millä nimellä. Ohjelma kirjoittaa tiedostotyypin automaattisesti. Tallenna napsauttamalla "Tallenna" -painiketta. Kun tiedosto on tallennettu, sen nimi näkyy näytöllä otsikkorivin sinisellä taustalla. Se näyttää jotakuinkin tältä:

Tämän vaiheen tuloksena on valmis ja tallennettu tiedosto tutkimustuloksista.

Laskelmat ohjelmassa

Tästä eteenpäin ylävalikon hyödyllisin kohta on Tilastot.

Keskiarvojen vertailu kahdessa ryhmässä - Studentin T-testi

Tätä kriteeriä voidaan käyttää vertaamaan VAIN mittarimuuttujien keskiarvoja ja VAIN KAHDESSA ryhmässä (ei kolmessa, neljässä, ...)

Esimerkissämme muuttujat ovat metrisiä:

    Nro 3 – Ikä – ikä

    Nro 5 – Stajj – työkokemus

    Nro 7 – ProfStress – ammattistressin indikaattori

    Nro 9 – Maslach_1 – Maslach-menetelmän ensimmäinen indikaattori

    Nro 10 – Maslach_2 – Maslach-menetelmän toinen indikaattori

    Nro 11 – Maslach_3 – Maslach-menetelmän kolmas indikaattori

"Sukupuoli"-muuttuja jakaa kaikki osallistujat kahteen ryhmään – miehiin ja naisiin.

"Ryhmä"-muuttuja jakaa kaikki osallistujat kahteen ryhmään - koeryhmään ja kontrolliryhmään.

Vastaavasti esimerkissämme Studentin T-testillä voidaan tarkistaa, 1) eroavatko edellä lueteltujen muuttujien keskiarvot miesten ja naisten välillä; 2) eroavatko yllä olevien muuttujien keskiarvot koe- ja kontrolliryhmän osallistujien välillä.

Valitse ylävalikosta Tilastot – siinä Perustilastot/taulukot.

valitse, napsauta OK.

Näkyviin tulee ikkuna asetusten kanssa. Ensinnäkin meidän on valittava muuttujat, joille haluamme suorittaa laskennan. Voit tehdä tämän napsauttamalla Muuttujat-painiketta kuvan osoittamalla tavalla:

Muuttujien valintaikkuna tulee näkyviin.

Tässä vasemmalla puolella – Dependentvariables – sinun tulee ilmoittaa ne mittarimuuttujat, joiden keskiarvoja haluamme vertailla. Näitä ovat esimerkiksi muuttujat 3, 5, 7, 9-11 (ikä, kokemus, stressi jne.). Voit valita muuttujia luettelosta tai kirjoittaa numeroita tyhjään ikkunaan.

Oikealla puolella - Groupingvariable - merkitsemme YKSI muuttuja, joka jakaa otoksemme kahteen ryhmään. Voit esimerkiksi valita 1-Pol-muuttujan, jonka jälkeen vertaamme miesten ja naisten indikaattoreita. Tai voit valita 2-ryhmän muuttujan tästä, niin vertaamme koe- ja kontrolliryhmiä. Jos olemme kiinnostuneita molemmista vaihtoehdoista, meidän on sovellettava T-testiä kahdesti. Mutta vain yksi muuttuja valitaan kerrallaan ikkunan oikealta puolelta.

Katsotaanpa nyt esimerkkiä 1-Pol-muuttujan kanssa. Se näyttää tältä:

Nyt ok.

Ohjelma palauttaa meidät edelliseen ikkunaan. Suorittaaksesi laskelmia, sinun on napsautettava Yhteenveto-painiketta, jompikumpi kahdesta, ne näkyvät kuvassa.

Näyttöön tulee toinen ikkuna – Työkirja1. Ohjelma kirjoittaa kaikki laskutoimitukset tähän tiedostoon.

Tarkastellaanpa saatuja tuloksia yksityiskohtaisesti.

Vasemmalla olevassa taulukossa on listattu muuttujat, joiden keskiarvoja vertailimme harmaalla taustalla. Sarakkeet "Keskiarvo" ja "Keskiarvo" sisältävät muuttujien keskiarvot naisille ja miehille. Eli naisten keski-ikä on 40,68 vuotta, miesten keski-ikä 39,15 vuotta. Naisten keskimääräinen palvelusaika on 17,44 vuotta, miesten 16,87 vuotta. Seuraavaksi t-arvosarake sisältää t-kriteerin arvon; emme tarvitse sitä. Df-sarake ilmaisee vapausasteiden lukumäärää; emme myöskään tarvitse sitä. (Toisin sanoen tilastollisen tietojenkäsittelyn tuloksia työssä esitettäessä nämä luvut olisi kiva ilmoittaa, mutta niitä ei tarvitse purkaa). Seuraava sarake –p– vaaditaan. Tämä on keskiarvojen erojen sama luotettavuustaso. Todennäköisesti tärkein sarake tästä taulukosta.

Teoreettinen poikkeama. Testataksemme, ovatko näiden kahden ryhmän keskiarvot erilaiset, laskemme ensin nämä arvot. Ja lähes aina kahden ryhmän keskiarvot ovat ainakin jonkin verran erilaisia. Toisin sanoen saamme lähes aina ERI keskiarvoja. Esimerkissämme se on sama – naisten ja miesten kaikkien muuttujien keskiarvot ovat erilaisia. Mutta joissain paikoissa ne eroavat enemmän, toisissa vähemmän. Ja "silmällä" emme voi määrittää, eroavatko keskiarvot "vähän" vai "paljon". Tämä voidaan määrittää vain tilastollisilla testeillä, esimerkiksi Studentin t-testillä.

Menemättä laskelmien yksityiskohtiin, suosittelen muistamaan:

Keskiarvot kahdessa ryhmässä mille tahansa muuttujalle merkittävästi erilainen,Jos indeksi s<0,05 (ohjelmassa nämä muuttujat on korostettu punaisella)

Tässä tapauksessa he sanovat myös, että erot keskiarvoissa ovat luotettavia (tai tilastollisesti merkittäviä) 5 %:n tasolla.

Joskus, jos p on suurempi kuin 0,05, mutta pienempi kuin 0,1, niin erojen sanotaan olevan tilastollisen trendin tasolla. Eli nämä ovat vähemmän ilmeisiä eroja.

Mutta yleensä jos p>0,05, niin he sanovat, että merkittäviä eroja ei ole tunnistettu/ei todettu/ei löytynyt. Mutta VAIKKA P>0,1, ET VOI SANOA, ETTÄ KESKIARVO OVAT SAMAT.

Näin ollen tässä tapauksessa vain ammatillisen stressin indikaattorit eroavat merkittävästi miehillä ja naisilla (p-arvo = 0,029, mikä on alle 0,05). Trenditasolla Maslach_2-indikaattorissa on eroja (tässä p = 0,051, tämä on enemmän kuin 0,05, mutta alle 0,1). Muiden muuttujien kohdalla ei havaittu merkittäviä eroja.

Katsotaan nyt koe- ja kontrolliryhmien keskiarvojen vertailua.

Valitse jälleen ylävalikosta Tilastot – siinä BasicStatistics/Tables. Koska olemme jo käynnistäneet tämän ohjelmamoduulin, näyttöön tulee ikkuna

Voit jatkaa laskentaa valitsemalla "Jatkuva".

Voit siirtyä vertailuun kokeellisen ja kontrolliryhmän välillä napsauttamalla Muuttuja-painiketta. Valitse ikkunan oikeasta kohdasta – Groupingvariable – muuttujan numero 2. Napsauta OK. Napsauta Yhteenveto kuten yllä olevissa kuvissa.

Saamme seuraavan tuloksen.

Huomaa, että koe- ja kontrolliryhmien osallistujien keski-ikä, keskimääräinen palvelusaika ja Maslach_2-indikaattorin keskiarvot eroavat merkittävästi. Muiden muuttujien kohdalla ei havaittu merkittäviä eroja.

Kuinka sulkea ohjelma.

Ensin sinun on suljettava kaikki laskelmat. Voit tehdä tämän napsauttamalla vasemmassa alakulmassa olevaa suorakulmiota, laskentaikkuna avautuu, sulje se ristillä tai Peruuta-painikkeella.

Toinen vaihe on sulkea Työkirja1-ikkuna – myös ristillä. Voit tallentaa tämän tiedoston, mutta se ei ole pakollinen.

Kolmas vaihe on sulkea datatiedosto.

Neljänneksi, sulje ohjelma.

Lisään myöhemmin:

Kahden ryhmän keskiarvojen vertailu on ei-parametrinen menetelmä.

Kolmen tai useamman ryhmän keskiarvojen vertailu - varianssianalyysi

Valmiustaulukoiden analyysi - Chi-neliö.

Khin-neliö-kriteeriä käytettäessä havaitsemme, että "pidän/en pidä jäätelöstä" -attribuutin mukainen jakautuminen poikien ja tyttöjen kesken on merkittävästi erilainen. Eli heillä on "erilainen" asenne jäätelöön.

Tässä Chi-neliöä käyttämällä havaitsemme, että merkittäviä eroja ei löytynyt. Eli pojat ja tytöt "eivät eroa" rakkaudessaan/inhossaan tietokonepelejä kohtaan.

Tarkistamme, eroaako koe- ja kontrolliryhmien osallistujien koulutustaso.

Korrelaatiokertoimet.

Tulosten siirtäminen Exceliin

Kaupallisten tilastopakettien ohella on olemassa melko suuri määrä täysin ilmaisia ​​tilasto-ohjelmia ja -sovelluksia. Samaan aikaan monet ilmaiset ohjelmat eivät ole huonompia, vaan jopa parempia toiminnallisuudeltaan kuin kaupalliset sovellukset. Annan luettelon tärkeimmistä ilmaisista tilastotietojen käsittelyyn tarkoitetuista ohjelmista.

ξ EpiInfo - ilmainen tilastopaketti, jota tukee Yhdysvaltain tautivalvontakeskus. Pääominaisuus on kyky paitsi suorittaa tilastoanalyysiä myös luoda kyselylomakkeita ja lomakkeita tietojen syöttämistä varten (mukaan lukien lomakkeiden luominen tietojen keräämiseksi Internetissä). Uusin versio tukee myös integraatiota Google Mapsiin ja kartografisten tietojen visualisointia. Melko merkittävä rajoitus suurille tietojoukoille voi olla Microsoft Access -muodon käyttö tietokantana.

ξ OpenEpi— joukko tilastofunktioita, joiden avulla voit nopeasti soveltaa suhteellisen yksinkertaisia ​​ja usein käytettyjä tilastollisia testejä. OpenEpiä voidaan käyttää verkossa kehittäjän verkkosivustolla tai asentaa tietokoneellesi. Paketin etuna on joukko funktioita tilastollisen tehon laskemiseen, ryhmien lukumäärään, satunnaislukujen generointiin sekä mahdollisuus laskea tilastollinen merkitsevyys ryhmätilastojen perusteella, mikä on hyödyllistä artikkeleita arvioitaessa.

ξ PSPP- Ulkonäöltään ja toiminnallisuudeltaan se on hyvin samanlainen kuin SPSS (itse asiassa paketin nimi on peilikuva), ja se on täysin ilmainen.

ξ SOFA — Mahdollistaa tilastollisten perustestien suorittamisen, mutta ei regressioanalyysin suorittamista. Yksi paketin erityispiirteistä on erilaisten vakiokaavioiden ja summaustaulukoiden nopea luominen, jotka eivät vaadi muotoilua, sekä kyky suorittaa mukautettuja komentosarjoja Pythonissa.

ξSEER-Stat on ilmainen onkologiaan sovellettava tilastopaketti, jonka kehitystä tukee US Cancer Institute. Ohjelmistopaketissa on monia toimintoja sairastuvuuden, eloonjäämisen ja kuolleisuuden laskemiseen (mukaan lukien ikästandardisoidut indikaattorit).

ξWINPEPI— ohjelma epidemiologisten tietojen analysoimiseksi. Yksityiskohtainen kuvaus toiminnoista on saatavilla. Sama kirjoittaja loi useita muita ohjelmia käytettäväksi epidemiologiassa.

ξ Geneettisen epidemiologian tilastollinen analyysi on geneetikoille ja epidemiologeille tarkoitettu tilastollinen analyysiohjelma, joka sisältää monia toimintoja kuvaavien tilastojen hankkimiseen, tietojen tarkistamiseen, piirteen tai taudin periytyvyyden kvantifiointiin, taudin todennäköisimmän puhkeamisiän arvioimiseen, yksittäisten alleelien esiintymismallien tunnistamiseen tai yhden nukleotidin muutokset ja muut ominaisuudet.