Statistische verwerkingsprogramma's. Statistische programma's - Programma's downloaden - Soft Soft

MS Excel... De meest genoemde (en gebruikte) in Russischtalige artikelen is de MS Excel-applicatie uit het Microsoft Office-softwarepakket - MS Office. De redenen hiervoor liggen in de wijdverbreide verspreiding van deze software, de beschikbaarheid van de Russischtalige versie, nauwe integratie met MS Word en PowerPoint. MS Excel is echter een spreadsheet met behoorlijk krachtige wiskundige mogelijkheden, waarbij sommige statistische functies slechts extra ingebouwde formules zijn. De berekeningen die met zijn hulp zijn gemaakt, worden niet herkend door gerenommeerde biomedische tijdschriften. Ook is het onmogelijk om wetenschappelijke grafieken van hoge kwaliteit te bouwen in MS Excel. MS Excel is ongetwijfeld zeer geschikt voor gegevensaccumulatie, tussentijdse transformatie, voorlopige statistische schattingen, voor het bouwen van bepaalde soorten grafieken. De uiteindelijke statistische analyse moet echter gebeuren in programma's die speciaal voor dit doel zijn ontworpen. Er is een macro-add-on XLSTAT-Pro voor MS Excel, die meer dan 50 statistische functies bevat, waaronder overlevingsanalyse, die in basisgevallen voldoende zijn voor normaal gebruik.

STADIA... Russisch ontwikkelingsprogramma met een geschiedenis van 16 jaar. Bevat alle noodzakelijke statistische functies. Het doet uitstekend werk met zijn taak - statistische analyse. Maar uiterlijk is het programma sinds 1996 niet echt veranderd. Grafieken en diagrammen die met STADIA zijn gemaakt, zien er archaïsch uit in moderne presentaties. Het kleurenschema van het programma (rood op groen) is erg vermoeiend om mee te werken. De positieve eigenschappen van het programma zijn onder meer de Russisch-talige interface en de aanwezigheid van boeken die het werk beschrijven. Bijvoorbeeld: A.P. Kulaichev Methoden en tools voor data-analyse in de Windows-omgeving. - M: InKo, 2002 .-- 341 d.

SPSS(Statistisch pakket voor sociale wetenschappen). Het meest gebruikte pakket voor statistische gegevensverwerking met meer dan 30 jaar ervaring. Verschilt in flexibiliteit, kracht is toepasbaar voor alle soorten statistische berekeningen die in de biogeneeskunde worden gebruikt. Er is een Russisch sprekend vertegenwoordigingskantoor van het bedrijf, dat een volledig Russified-versie van SPSS 12.0.2 voor Windows aanbiedt. Er was een leerboek in het Russisch waarmee je stap voor stap de mogelijkheden van SPSS onder de knie krijgt, een statistiekleraar in het Russisch die helpt bij het kiezen van de juiste statistische of grafische procedure voor specifieke gegevens en taken, evenals hulp bij SPSS Base en SPSS-tabellen . Het Russische kantoor van SPSS geeft regelmatig trainingen over data-analyse met behulp van SPSS-software. Er is een boek over SPSS in het Russisch vertaald, dat in 2002 door uitgeverij "Diasoft" in Kiev werd gepubliceerd onder de titel "SPSS 10: The Art of Information Processing. Analyse van statistische gegevens en herstel van verborgen patronen ”.

STATA... Professioneel statistisch softwarepakket met datamanagementsysteem voor biomedische doeleinden. Een van de meest populaire onderwijs- en wetenschappelijke instellingen in de Verenigde Staten, samen met SPSS. Het programma is goed gedocumenteerd; er wordt een speciaal tijdschrift uitgegeven voor de gebruikers van het systeem.

STATISTICA... De fabrikant van het programma is StatSoft Inc. (VS), dat sinds 1985 statistische toepassingen produceert. STATISTICA omvat een groot aantal statistische analysemethoden (meer dan 250 ingebouwde functies) verenigd door de volgende gespecialiseerde statistische modules: basisstatistieken en tabellen, niet-parametrische statistieken, variantieanalyse, meervoudige regressie, niet-lineaire schatting, tijdreeksanalyse en voorspelling, Clusteranalyse, factoranalyse, discriminerende functionele analyse, levensduuranalyse, canonieke correlatie, multidimensionale schaling, structurele vergelijkingsmodellering, enz. Dit statistisch pakket is gemakkelijk te leren en kan worden aanbevolen voor biomedisch onderzoek van elke complexiteit.

JMR... Een van de wereldleiders op het gebied van data-analyse. Dit statistische pakket wordt ontwikkeld door het SAS Institute, dat eind 2002 het bekende statistische programma StatView overnam. Dit softwareproduct heeft echter geen speciale voordelen voor biomedische statistiek.

SYSTAAT... Statistisch systeem voor personal computers. De nieuwste versie heeft een goede intuïtieve interface. Systat Software ontwikkelt ook SigmaStat en SigmaPlot, populair bij binnenlandse onderzoekers, die respectievelijk een statistisch verwerkingsprogramma en een diagramprogramma zijn. Wanneer ze samenwerken, worden ze één pakket voor statistische verwerking en datavisualisatie.

NCSS... Het programma is in ontwikkeling sinds 1981 en is bedoeld voor niet-professionals op het gebied van statistische verwerking. De systeeminterface is multi-venster en als gevolg van dit fenomeen is het een beetje ongebruikelijk om te gebruiken. Alle gebruikersacties gaan vergezeld van prompts.

MINITAB 14... Het statistische pakket MINITAB is momenteel uitgebracht in versie 14. Het is een vrij eenvoudig te gebruiken softwarepakket met een goede gebruikersinterface, goede mogelijkheden om de resultaten van werk te visualiseren. Heeft gedetailleerde hulp.

STATGRAFIEK PLUS... Een behoorlijk krachtig statistisch programma. Bevat meer dan 250 statistische functies, genereert duidelijke, aanpasbare rapporten.

PRISMA... Dit programma is speciaal gemaakt voor biomedische doeleinden. Met de intuïtieve interface kunt u binnen enkele minuten gegevens analyseren en grafieken van hoge kwaliteit maken. Het programma bevat de belangrijkste veelgebruikte statistische functies, die voor de meeste onderzoeken voldoende zullen zijn. Echter, zoals de ontwikkelaars zelf opmerken, kan het programma serieuze statistische pakketten niet volledig vervangen. Op de site van de ontwikkelaar kunt u, naast de mogelijkheid om kennis te maken met de demoversie van Prism, een PDF-gids voor biomedische statistieken krijgen.

Onder de veelheid aan statistische verwerkingsprogramma's kiezen onderzoekers in de regel de meest geschikte voor het oplossen van specifieke taken. In deze samenvatting worden voorbeelden besproken van het gebruik van de programma's StatSoft STATISTICA 7, GraphPad Prism 6 en Advanced Grapher voor het verwerken van biologische onderzoeksgegevens.

Overzicht van statistische programma's






In de fase van de experimentplanning is het handig voor de onderzoeker om de functies van het Sampling-menu te gebruiken, waarmee u het vereiste aantal groepen kunt bepalen voor enkele van de meest voorkomende onderzoekstaken. Van de functies die in MedCalc zijn geïmplementeerd, moet met name worden opgemerkt dat het mogelijk is om de belangrijkste soorten statistische analyse uit te voeren zonder steekproefwaarden te hebben, d.w.z. op basis van gemiddelden, spreidingsindexen, etc. Dit kan handig zijn bij het bestuderen van literatuurgegevens, aangezien volledige informatie over de primaire resultaten van het experiment niet in publicaties wordt gegeven. Om bijvoorbeeld steekproefgemiddelden te vergelijken met behulp van de Student's test, is het voldoende om de rekenkundige gemiddelden zelf, de standaarddeviatie en de grootte van beide steekproeven te kennen. Deze gegevens moeten worden ingevoerd in het venster met de naam Tests> Vergelijking van>


Titel: Beoordeling van statistische programma's
Gedetailleerde beschrijving:

De productiviteit van het uitgevoerde werk hangt nauw samen met de gebruikte tools. Dus, volgens de legende, zei Archimedes dat hij de aarde zou kunnen draaien als hij het nodige steunpunt en hefboom zou krijgen. Maar de grote filosoof had niet de benodigde gereedschappen en onze planeet vliegt nog steeds in zijn baan. Een soortgelijke situatie ontwikkelt zich op het gebied van statistische analyse van onderzoeksresultaten. Het is heel goed mogelijk om statistische verwerking van gegevens uit te voeren met alleen potlood en papier, maar het is veel sneller en efficiënter om dit te doen met speciale tools, namelijk statistische software. Strikt genomen moeten softwarepakketten die worden gebruikt voor statistische analyse worden geclassificeerd als wiskundige programma's, daarom zullen in dit artikel de termen "wiskundig" en "statistisch" door elkaar worden gebruikt.

In de regel zetten jonge wetenschappers hun eerste stappen in de statistiek in spreadsheetprocessors, en de overgrote meerderheid gebruikt MS Excel. De op één na populairste spreadsheetprocessor van vandaag is Calc van de OpenOffice.org-kantoorsuite. Helaas beschouwen sommige onderzoekers deze programma's als het handigste en meest geschikte hulpmiddel voor analyse. Ze hebben echter ongelijk. Het gebruik van dergelijke software is toegestaan ​​in gevallen waarin het nodig is om de eenvoudigste bewerkingen uit te voeren, zoals het sorteren van gegevens, het berekenen van beschrijvende statistieken, het plotten van bepaalde soorten grafieken, en ook om eenvoudig de primaire gegevens van uw experiment op te slaan en een laboratoriumdagboek bij te houden. Met andere woorden, een volwaardige statistische verwerking van onderzoeksresultaten in Excel is onmogelijk. Dit is een kantoortoepassing, geen wetenschappelijke.

Alle wetenschappelijke wiskundige toepassingen zijn onder te verdelen in twee grote groepen: programma's met en zonder grafische interface. Denk niet dat de grafische interface op de een of andere manier de kwaliteit van een softwareproduct kenmerkt. Deze eigenschappen zijn op geen enkele manier van elkaar afhankelijk. Toch is een dergelijke indeling van groot praktisch belang. Het feit is dat niet iedereen comfortabel in de opdrachtregel kan werken. Tegenwoordig denken veel computergebruikers er niet eens aan om de "clikodromes" te verlaten waarop een indrukwekkend deel van de moderne IT-industrie rust. Wiskundige berekeningen zijn echter nog steeds handiger om uit te voeren door opdrachten vanaf het toetsenbord te typen, in plaats van op de talrijke knoppen op het scherm te klikken. Daarom hebben serieuze applicaties een opdrachtregelmodus met een ingebouwde programmeertaal en een grafische interface.

Laten we eerst kennis maken met de statistische rekenomgeving en de programmeertaal R. De oorsprong ligt in de programmeertaal S, waarmee ze veel gemeen hebben. Het standaard R-pakket bevat niet de grafische interface die veel gebruikers gewend zijn. Als gevolg hiervan hebben een aantal onderzoekers de verkeerde mening dat deze tool alleen numerieke berekeningen toestaat, maar niet de mogelijkheid heeft om grafieken te tekenen. Dit is niet waar. Het R-systeem biedt volop mogelijkheden voor statistische gegevensverwerking, ook voor het werken met afbeeldingen, en de vensterinterface kan als extra applicatie worden geïnstalleerd. Maar houd er rekening mee dat de grafische gebruikersinterfaces voor R merkbaar inferieur zijn aan die in de rest van de statistische pakketten.

U kunt de R-omgeving installeren op een computer met Windows, MacOS of Linux. Bij het opstarten van het R-systeem zal een onervaren gebruiker een vraag hebben: "Waar kan ik gegevens invoeren?" Vanwege het ontbreken van een ingebouwde spreadsheet-editor, wordt de geanalyseerde informatie ofwel rechtstreeks in de opdrachtregel ingevoerd als argument voor de overeenkomstige functies, of geladen vanuit externe bestanden. De eerste optie is handig wanneer u met enkele waarden werkt, en de tweede - in die gevallen waarin u met tabellen moet werken. De tabellen zelf kunnen in elke spreadsheetprocessor worden gemaakt en de bestanden kunnen worden opgeslagen in * .csv-indeling, die eenvoudig in R kan worden geladen.

Nadat u de informatie in variabelen hebt geladen, kunt u beginnen met het verwerken ervan met behulp van een groot aantal functies die in R zijn geïmplementeerd. Maar er moet aan worden herinnerd dat alle tussentijdse gegevens bij het werken met deze taal niet in tijdelijke bestanden worden opgeslagen, maar rechtstreeks in RAM. Deze functie moet in gedachten worden gehouden bij het verwerken van zeer grote hoeveelheden informatie: R zal een aanzienlijk deel van het RAM-geheugen van de computer gebruiken.
De syntaxis van de taal is vrij eenvoudig en gemakkelijk te leren. Tot op heden zijn er meer dan honderd boeken geschreven over een breed scala aan toepassingen van de statistische computeromgeving R, maar ze zijn allemaal in het Engels. Helaas is er nog steeds heel weinig Russischtalige informatie en wordt deze alleen gepresenteerd in de vorm van verspreide artikelen over enkele problemen met het gebruik van deze programmeertaal. Het is het gebrek aan informatie dat de verspreiding van een kwalitatief hoogstaand softwarepakket in ons land belemmert (ondanks dat het gratis is).

De betrouwbaarheid van de R is te danken aan zijn oorsprong. De taal is gemaakt als een gratis implementatie van de zeer krachtige programmeertaal S, waarvan de geschiedenis teruggaat tot 1976, toen de eerste werkende versie verscheen. Tegenwoordig vormt de S-taal de basis van de S-PLUS-toepassing die is ontwikkeld door TIBCO Software Inc. en is, in tegenstelling tot R, een commercieel product. S-PLUS heeft een prettige grafische interface, gegevensinvoer die kan worden uitgevoerd door te laden vanuit een extern bestand, database, of door een tabel te kopiëren uit een tekstbestand, of een spreadsheetprocessor. S-PLUS kan, net als R, op verschillende besturingssystemen draaien en worden gebruikt om numerieke en grafische analysemethoden uit te voeren.

Een andere populaire statistische toepassing is SAS, die in de jaren zestig ontstond aan de Universiteit van North Carolina als een toepassing voor het analyseren van landbouwkundige onderzoeksresultaten. Tegenwoordig blijft het systeem zich ontwikkelen bij het SAS Institute, dat al de negende versie van dit programma heeft uitgebracht. De reikwijdte van SAS is een breed scala aan wetenschappelijk onderzoek, bedrijfsanalyses, enz.

Het systeem bestaat uit modules die elk een specifiek takenpakket uitvoeren. De BASE- en STAT-modules worden het meest gebruikt bij statistische verwerking. Het SAS-systeem implementeert zijn eigen programmeertaal, die qua syntaxis dichter bij de basis ligt en niet lijkt op R of S. Met het systeem kunt u gegevens uit externe bestanden laden of deze rechtstreeks in het terminalvenster invoeren. Door het gebruik van SAS is het mogelijk om statistische verwerking van gegevens van verschillende niveaus van complexiteit uit te voeren, in overeenstemming met de gestelde taken. Interactie met het programma is mogelijk zowel in de consolemodus als via de grafische interface, een grafische shell voor vereenvoudigde invoer van opdrachten in de SAS-programmeertaal.

Stata, ontwikkeld door het Amerikaanse bedrijf StataCorp, behoort ook tot de programma's die voornamelijk de opdrachtregelinterface gebruiken. De applicatie kan draaien op besturingssystemen van de Windows-familie, MasOS en Linux. Gegevensinvoer hier is mogelijk door zowel externe bestanden te laden als de ingebouwde spreadsheeteditor te gebruiken, wat vrij eenvoudig is, maar u in staat stelt alle noodzakelijke manipulaties met tabellen uit te voeren. De principes van het werken met de Stata-applicatie zijn hetzelfde als bij het gebruik van de hierboven beschreven programma's. Die gebruikers die de terminalmodus onhandig vinden, kunnen het programmamenu gebruiken om automatisch ingebedde programmeertaalopdrachten te genereren.
Alle beschreven statistische pakketten kunnen worden gebruikt voor elke vorm van statistische analyse. De functionaliteit van de R-taal kan dus worden gewijzigd door bibliotheken met functies toe te voegen die zijn gericht op een goed gedefinieerd type taken. Bovendien kan iedereen die voldoende kennis en ervaring heeft met deze taal zijn eigen functies en bibliotheken creëren die overeenkomen met de specifieke kenmerken van het werk van een bepaalde gebruiker.

Maar naast statistische software "breed profiel" zijn er programma's gericht op wetenschappers werkzaam op het gebied van biomedisch onderzoek. Het MedCalc-programma, sinds 1993 ontwikkeld door het Belgische bedrijf MedCalc Software, wordt dus gepositioneerd als een volwaardige statistische toepassing die is gemaakt in overeenstemming met de behoeften van onderzoekers in het biomedische veld. De ontwikkelaars richten onderzoekers op de bruikbaarheid van MedCalc voor het analyseren van ROC-curves.

Het programma is handig omdat het geen redundante functionaliteit biedt, wat vaak een onvoorbereid persoon in de war brengt die met universele applicaties begint te werken. Bovendien maakt de mogelijkheid om alleen in een grafische interface te werken zonder de opdrachtregel te gebruiken het programma minder flexibel, maar aantrekkelijker voor gebruik in dit wetenschapsgebied, aangezien specialisten met een medische opleiding zelden kunnen bogen op uitgebreide ervaring in het werken met wiskundige programma's.

Tot op heden is de twaalfde versie van het programma al gemaakt. Helaas kunnen alleen Windows-gebruikers in MedCalc werken, maar dit nadeel wordt gecompenseerd door de relatief lage systeemvereisten en de mogelijkheid om de applicatie zowel in Windows 2000 als in Windows 7 uit te voeren. Voor degenen die het programma nog nooit hebben gebruikt, is er een mogelijkheid om een ​​volledig functionele demo te downloaden van een versie van het product van medcalc.org die vijftien dagen zonder beperkingen zal werken. Daarnaast bevat de leveringsset demobestanden met datasets en voorbeelden van hun analyse.

Gegevensinvoer in MedCalc wordt uitgevoerd in een geïntegreerde spreadsheet-editor of door bestanden van verschillende formaten te importeren, zoals * .csv, Excel, enz. Om de ingebouwde editor op te roepen, selecteert u gewoon de opdracht Spreadsheet in het menu, waarna u kan beginnen met het genereren van de spreadsheet. In statistische programma's worden de kolommen van tabellen "variabelen" genoemd en de rijen "gevallen". Bij het maken van een tabel is het handig om een ​​paar regels te volgen:
... De eerste variabele moet de volgnummers van de gevallen bevatten. Dit is nodig om de vorige volgorde te kunnen herstellen na het opnieuw sorteren van de waarden.
... Numerieke waarden moeten worden ingevoerd zonder afronding om geen informatie te verliezen.
... Als sommige waarden ontbreken, kunt u deze overslaan en lege cellen in de tabel achterlaten.
... Elke variabele zou slechts één waarde voor elk geval moeten hebben.

Nadat de tabel is opgeslagen of het gegevensbestand is geladen, begint de fase van informatieverwerking. Om statistische analyses uit te voeren, selecteert u het juiste item in het menu Statistieken. Elk type analyse heeft zijn eigen set instellingen, hulp die kan worden verkregen door op de knop Help te klikken.
In de fase van de experimentplanning is het nuttig voor de onderzoeker om de functies van het Sampling-menu te gebruiken, waarmee het vereiste aantal groepen kan worden bepaald voor enkele van de meest voorkomende onderzoekstaken. Van de functies die in MedCalc zijn geïmplementeerd, moet met name worden opgemerkt dat het mogelijk is om de belangrijkste soorten statistische analyse uit te voeren zonder steekproefwaarden te hebben, d.w.z. op basis van gemiddelden, spreidingsindexen, etc. Dit kan handig zijn bij het bestuderen van literatuurgegevens, aangezien volledige informatie over de primaire resultaten van het experiment niet in publicaties wordt gegeven. Om bijvoorbeeld steekproefgemiddelden te vergelijken met behulp van de Student's test, is het voldoende om de rekenkundige gemiddelden zelf, de standaarddeviatie en de grootte van beide steekproeven te kennen. Deze gegevens moeten worden ingevoerd in het venster met de naam Tests> Vergelijking van> gemiddelden (t-test), en het vergelijkingsresultaat wordt in hetzelfde venster weergegeven. De rest van de functies in het menu Tests worden op dezelfde manier gebruikt.

Zo biedt het MedCalc-programma voor een relatief lage prijs de gebruiker een handige interface zonder onnodige "functionaliteit", uitgerust met een goede spreadsheet-editor. Alle berekeningen en diagrammen worden in één bestand opgeslagen en kunnen eenvoudig worden gesorteerd in een speciale lijst aan de linkerkant van het hoofdvenster van het programma. Statistische analyse wordt uitgevoerd met behulp van overzichtelijke menu's met beknopt en gemakkelijk te begrijpen referentiemateriaal. In dit opzicht zal het programma zeer nuttig zijn voor wetenschappers die biomedisch onderzoek uitvoeren en voor mensen die geen ervaring hebben met wiskundige toepassingen.

MedCalcl is een eenvoudig en gemakkelijk te gebruiken programma, maar niet elke gebruiker kan er alles uit halen wat hij nodig heeft om te werken. Onder degenen die zeer hoge eisen stellen aan statistische software en bereid zijn er enkele duizenden dollars voor uit te geven, zijn toepassingen zoals Statistica of SPSS Statistics populair. Beide programma's zijn echte "monsters" in vergelijking met MedCalc - zowel qua kosten als qua computermogelijkheden. Het is onmogelijk om er in het kader van het artikel in detail over te praten, hiervoor zul je een boek van enkele honderden pagina's moeten schrijven, dus we zullen ons beperken tot een korte kennismaking.

Statistica is ontwikkeld door StatSoft. Tot op heden is de nieuwste versie Statistica 9. SPSS, waarvan de naam een ​​afkorting is voor Statistical Package for the Social Sciences, werd relatief recent eigendom van IBM en veranderde de naam in PASW (Predictive Analytics SoftWare) Statistics. Beide programma's hebben een uitstekende grafische interface, evenals een ingebouwde programmeertaal en de mogelijkheid om te integreren met de statistische rekentaal R.

Opgemerkt moet worden dat de bijna onbeperkte mogelijkheden in statistische verwerking die door deze tools worden geboden, grote middelen van de computer vereisen. Dus om SPSS te laten werken, heb je minimaal 1 GB RAM nodig. Besturingssystemen waarop SPSS kan draaien: Windows, MacOS en Linux. Statistica daarentegen is alleen ontwikkeld voor Windows, wat het aantal gebruikers enigszins vermindert.

Zoals altijd begint het werken in programma's met gegevensinvoer. Met de geïntegreerde spreadsheetprocessor kunt u tabellen ontwerpen met de methoden die bekend zijn bij elke gebruiker van kantoortoepassingen. De opgeslagen tabellen, evenals de resultaten van berekeningen, grafieken en rapporten in Statistica kunnen handig worden geplaatst in een enkel bestand genaamd het "Werkboek", terwijl de organisatie van de werkruimte in SPSS minder handig is, maar nog steeds redelijk acceptabel voor gebruik na een korte aanpassingsperiode.

De programma's hebben de meest populaire statistische methoden: frequentieanalyse, berekening van statistische kenmerken, contingentietabellen, correlaties, grafieken, t-tests en een groot aantal niet-parametrische criteria, multivariate lineaire regressieanalyse, discriminantanalyse, factoranalyse, clusteranalyse, variantieanalyse, betrouwbaarheidsanalyse, multidimensionale schaling en een aantal andere. Het oproepen van deze statistische procedures wordt gedaan door de juiste vensters in het menu te selecteren en de nodige instellingen erin te maken. Alle soorten analyses zijn onderverdeeld in groepen, wat helpt om snel door de applicatie-interface te navigeren.

De systemen STATISTICA en SPSS zijn grafisch rijk. Ze omvatten een breed scala aan categorieën en soorten grafieken, waaronder wetenschappelijke, zakelijke, 3D- en 2D-grafieken in verschillende coördinatensystemen, gespecialiseerde statistische grafieken - histogrammen, matrixgrafieken, gecategoriseerde grafieken, enz.

De statistische functies die in beide toepassingen beschikbaar zijn, vallen op door hun verscheidenheid. Het lijkt erop dat u met deze statistische analysetools kunt doen wat u wilt, op voorwaarde dat de gebruiker goed bekend is met de principes van zijn werk. Het belangrijkste obstakel voor het beheersen van deze programma's is de tijd die aan training moet worden besteed. Juist door het gebrek aan kennis van de gebruiker wordt in de meeste gevallen de kracht van statistische pakketten van dit niveau nog niet eens half benut.

Zoals u kunt zien, zijn er veel toepassingen voor statistische analyse in de wereld. Slechts enkele daarvan zijn in dit artikel kort beschreven. Daarbuiten waren programma's als Minitab, MatLab, Octave, GenStat, JMP, Analyse-it, binnenlandse ontwikkeling STADIA en vele andere, grote en kleine, dure en gratis programma's. Een dergelijke overvloed aan software mag de onderzoeker echter niet afschrikken, het is voldoende om eenmaal een doordachte keuze te maken voor een of twee programma's, de subtiliteiten van hun toepassing zorgvuldig te bestuderen en ze zullen als trouwe assistenten dienen bij de statistische analyse van experimentele resultaten gedurende meer dan een jaar.


annotatie: In de moderne wereld is het nemen van management-, productie-, financiële, personeels- en andere beslissingen in toenemende mate gebaseerd op een uitgebreide analyse van gegevens, waardoor beter geïnformeerde conclusies en prognoses kunnen worden gemaakt, de waarschijnlijkheid van de implementatie ervan kan worden beoordeeld en vaak wordt voorkomen dat onredelijke en slechte -weloverwogen beslissingen.

Dit hoofdstuk geeft een overzicht van de meest bekende softwareproducten die zijn ontwikkeld voor statistische verwerking van gegevens op een computer en gerelateerd aan de drie belangrijkste groepen programma's die eerder zijn genoemd (zie tabel 11.1), en geeft een overzicht van hun belangrijkste kenmerken en mogelijkheden voor statistische gegevensanalyse.

Als u elk pakket afzonderlijk bekijkt, wordt de nadruk gelegd op de statistische analysemogelijkheden die het gebruikers biedt. Opgemerkt moet worden dat er een minimale set statistische analysemethoden is, die is opgenomen in alle overwogen pakketten:

  • beschrijvende statistieken(basis statistische methoden, controle van de normale verdeling van gegevens);
  • variantieanalyse;
  • niet-parametrische statistieken (analyse van contingentietabellen, niet-parametrische vergelijkingen, variantieanalyse);
  • kwaliteitscontrole;
  • overlevingsanalyse;
  • clusteranalyse;
  • factoren analyse;
  • discriminerende analyse;
  • regressie analyse;
  • gegevensverwerking (sorteren, selecteren, data transformatie).

11.2. SPSS-pakket

SPSS-pakket (Statistisch Pakket voor de Sociale Wetenschappen) - universeel statistisch pakket van SPSS Inc 5 Officiële website van SPSS Inc.: http://www.spss.com... De eerste versie van het pakket werd uitgebracht in 1968. In 2009 nam IBM SPSS Inc. over, dus de nieuwe versie van het pakket bevat de afkorting IBM (IBM SPSS Statistics 19) in zijn naam.

Volgens de ontwikkelaars van het pakket is SPSS een van de toonaangevende softwareproducten op het gebied van statistische data-analyse voor het oplossen van problemen in de overheid, de academische wereld en het bedrijfsleven.

SPSS is een modulair programma. Het is gebaseerd op een basismodule (SPSS Base), waarmee: Gegevensbeheer en met de meest gebruikelijke methoden voor statistische gegevensanalyse: beschrijvende statistieken; constructie van lineaire en niet-lineaire modellen; implementatie van dataconversie; uitvoeren van faculteit, cluster, variantieanalyse; berekening van correlaties; plotten; opstellen van rapporten, enz.

Voor geavanceerde en diepgaande gegevensanalyse kunnen aanvullende pakketmodules worden geïnstalleerd. Er zijn 16 verschillende modules ontwikkeld voor het IBM SPSS Statistics 19 pakket. De IBM SPSS Advanced Statistics-module is bijvoorbeeld ontworpen om complexe relaties te analyseren met behulp van procedures die rekening houden met de eigenschappen van de gegevens die worden onderzocht, waardoor u verder kunt gaan dan de basisgegevensanalyse. De module heeft krachtige ingebouwde tools voor het bouwen van modellen. module

  • 7. Informatietechnologieën voor het verzamelen, opslaan en snel verwerken van wetenschappelijke informatie
  • 8 Computertechnologie, classificatie van computers per toepassing
  • 9 Problemen en risico's bij het introduceren van informatietechnologieën in de openbare praktijk
  • 10. Randapparatuur. Elektronische kantoorapparatuur
  • 11. Hardware en software voor moderne procedures van wetenschappelijke activiteit.
  • 12. Het concept van het model. Basisprincipes en stadia van modellering.
  • 13. Computersimulatie
  • 14. Wiskundige ondersteuning van informatietechnologieën
  • 15. Pakketten van toegepaste programma's voor statistische gegevensanalyse
  • 16. Mogelijkheden en kenmerken van het Statgraphics pakket
  • 17. Statgraphics-pakket. Eendimensionale statistische analyse: schatting van numerieke kenmerken, selectie van de distributiewet van willekeurige variabelen
  • 18. Statgraphics-pakket. Vergelijking van verschillende willekeurige variabelen: vergelijking van numerieke kenmerken en verdelingswetten
  • 19. Statgraphics-pakket. Analyse van relaties tussen waarden: regressie- en correlatieanalyse. Tijdreeksanalyse
  • 20. Statgraphics-pakket. Multivariate analyse: hoofdcomponentenanalyse, cluster, discriminantanalyse
  • 21. Simulatiemodellering. Principes van bouwsimulatiemodellen
  • 22. Simulatie-experimenten. De gps-simulatietaal - kenmerken, structuur
  • 23. Doel en samenstelling van de universele geïntegreerde computerwiskunde matlab
  • 24 systeeminterface, basisobjecten en matlab-nummerformaten.
  • 25 operators en functies in matlab.
  • 26. Matrixberekeningen in MathCad
  • 27. Grafieken bouwen
  • 28. Basisprincipes van programmeren in MathCad
  • 29. Tekst- en tabelprocessors
  • 30. Data-analyse door middel van Excel
  • 31. Analysepakket ms Excel. Beschrijvende statistieken. Histogrammen.
  • 1. Algemene informatie
  • 2. Basis ingebouwde statistische functies
  • 3. Analyse van steekproeven en populatie
  • 4. Beschrijvende statistieken van het analysehulpmiddel
  • 5. Gereedschapshistogram
  • 6. Rang en percentiel
  • 32. Analysepakket ms Excel. Generatie van willekeurige getallen.
  • 7. Willekeurige getallen genereren
  • 8. Constructie van steekproeven uit de algemene bevolking
  • 9. Berekening van het voortschrijdend gemiddelde
  • 10. Lineaire en exponentiële regressie
  • 33. Correlatie-regressieanalyse in msExcel
  • Eenrichtingsregressieanalyse met behulp van de regressietool
  • 34 De wortels van een vergelijking zoeken met behulp van de selectie van een parameter in ms Excel
  • 35 Zoek naar een oplossing. Optimalisatieproblemen oplossen met ms Excel
  • 36. Presentatievoorbereidingssystemen.
  • 37 Basisprincipes van webdesign
  • 38 Basisprincipes van het gebruik van de html-taal
  • Sectie 1
  • Sectie 2
  • Sectie 1
  • Sectie 2
  • 39. Servicetools.
  • 40. Grondbeginselen van computergraphics.
  • 41 Functies en doel van AutoCad.
  • 42 Projectontwikkeling in het Autocad-systeem
  • 43 Modellen van gegevenspresentatie. Typen, gegevensstructuren.
  • 44 Databases en databanken. Basisprincipes van databaseontwerp.
  • 45 Relationeel netwerk en hiërarchische databases
  • 46. ​​​​Databasebeheersystemen subd
  • 47. ms Access-objecten
  • 48. Verschillende soorten query's bouwen in ms Access
  • 1 Maak een selectiequery met behulp van de wizard
  • 2 Maak een selectiequery aan zonder een wizard
  • 3. Maak een query met parameters die u vragen om de selectievoorwaarden bij elke lancering in te voeren
  • 49. Formulieren en rapporten in ms Access
  • 50. Grondbeginselen van programmeren in de taal Visual Basic for Applications
  • 51. Kennisbank
  • 52. Computernetwerken: lokaal, zakelijk, regionaal, wereldwijd.
  • 53. Internetdiensten
  • 54. Werken met de mailclient.
  • 55 Gezamenlijke activiteiten plannen in het bedrijfsnetwerk met behulp van e-mailprogramma's.
  • 56. Werken met navigatiehulpmiddelen in www
  • 57 Methoden en hulpmiddelen voor het vinden van informatie op internet
  • 1 Zoekmachines
  • 3. Directory's met internetbronnen
  • 58. Zakelijke internettechnologieën
  • 59. Problemen met informatiebescherming.
  • 60. Organisatorische methoden voor informatiebescherming
  • 61. Technische en softwaremethoden voor het beschermen van lokale gegevens
  • 62. Technische en softwaremethoden voor het beschermen van gedistribueerde gegevens.
  • 1) www-service
  • 2) Elektronische digitale handtekening (EDS)
  • 63 Trends in de ontwikkeling van informatietechnologie
  • 64. Manieren om het probleem van de informatisering van de samenleving op te lossen
  • 65. Nieuwe technische middelen en softwareproducten, intellectualisering van middelen
  • 66. Implementatie van informatietechnologie (IT) in het onderwijs
  • Hoofdstuk 1 algemene bepalingen
  • Hoofdstuk 2 staatsregulering en beheer op het gebied van informatie, informatisering en informatiebeveiliging
  • Hoofdstuk 3 wettelijk informatieregime
  • Hoofdstuk 4 verspreiding en (of) informatievoorziening
  • Hoofdstuk 5 informatiebronnen
  • Hoofdstuk 6 informatietechnologie, informatiesystemen en informatienetwerken
  • Hoofdstuk 7 informatiebeveiliging
  • Hoofdstuk 8 rechten en plichten van subjecten van informatierelaties. Verantwoordelijkheid voor overtreding van de eisen van wetgeving op het gebied van informatie, informatisering en informatiebescherming
  • Hoofdstuk 9 slotbepalingen
  • 9 augustus 2010 nr. 1174
  • Hoofdstuk 1 algemene bepalingen
  • Hoofdstuk 2 de stand van de ontwikkeling van de informatiemaatschappij
  • Hoofdstuk 3 doel, doelstellingen en voorwaarden voor de ontwikkeling van de informatiemaatschappij
  • Hoofdstuk 4 Factoren in de ontwikkeling van de informatiemaatschappij
  • Hoofdstuk 5 Prioritaire aanwijzingen voor de ontwikkeling van de informatiemaatschappij
  • Hoofdstuk 6 indicatoren van het monitoringsysteem
  • Hoofdstuk 7 mechanisme voor het implementeren van deze strategie
  • Hoofdstuk 8 verwachte resultaten van de implementatie van deze strategie
  • 15. Pakketten van toegepaste programma's voor statistische gegevensanalyse

    Alle programma's voor statistische gegevensverwerking zijn onder te verdelen in professioneel, semi-professioneel (populair) en gespecialiseerd.

    MS Excel. Microsoft Excel(ook wel Microsoft Office Excel genoemd) is een spreadsheetprogramma. Het biedt de mogelijkheden van economische en statistische berekeningen, grafische hulpmiddelen en de macro-programmeertaal VBA (Visual Basic for Applications). MS Excel is een spreadsheet met behoorlijk krachtige wiskundige mogelijkheden, waarbij sommige statistische functies slechts extra ingebouwde formules zijn.

    SPSS (Statistisch Pakket voor Sociale Wetenschappen). SPSS-statistieken(afkorting van het Engelse "Statistical Package for the Social Sciences" - "statistical package for the social sciences") - een computerprogramma voor statistische gegevensverwerking, een van de marktleiders op het gebied van commerciële statistische producten bestemd voor toegepast onderzoek in de sociale wetenschappen.

    Tussen 2009 en 2010 is de naam van de SPSS-software veranderd in PASW (Predictive Analytics SoftWare) Statistics. Met ingang van januari 2010 werd het bedrijf omgedoopt tot SPSS: An IBM Company.

    Mogelijkheden

      Gegevensinvoer en opslag.

      De mogelijkheid om variabelen van verschillende typen te gebruiken.

      Frequentie van tekens, tabellen, grafieken, contingentietabellen, diagrammen.

      Primaire beschrijvende statistieken.

      Marktonderzoek

      Analyse van marktonderzoekgegevens

    STATISTICA. statistiek(handelsmerk - STATISTICA) is een uitgebreid pakket voor statistische analyse ontwikkeld door StatSoft. Het STATISTICA-pakket implementeert procedures voor data-analyse, databeheer, datamining, datavisualisatie. Dit eenvoudig te leren statistische pakket bevat een groot aantal statistische analysemethoden (meer dan 250 ingebouwde functies) gecombineerd met gespecialiseerde statistische modules.

    Er zijn verschillende opties voor het pakket, afhankelijk van de doelen en doelstellingen van de gebruiker:

      versie voor één gebruiker

      netwerkversie (Concurrent Network) - voor gebruik in lokale netwerken

      Enterprise-versie - voor gebruik in computersystemen en grote organisaties

      Webgebaseerd - voor gebruik in grote netwerken via een webbrowser.

    Pakketstructuur:

      Het STATISTICA pakket is modulair. Elke module bevat unieke procedures en methoden voor gegevensanalyse:

      Basis - bevat een uitgebreide selectie basisstatistieken, een breed scala aan methoden voor verkennende analyse.

      Geavanceerde lineaire/niet-lineaire modellen - Biedt een breed scala aan lineaire en niet-lineaire modelleringstools, regressieanalyse, variantiecomponentanalyse, tijdreeksanalyse en meer.

      Multivariate verkenningstechnieken - STATISTICA biedt een breed scala aan verkennende technologieën, variërend van clusteranalyse tot geavanceerde classificatieboommethoden, gecombineerd met een eindeloze reeks interactieve visualisatietools voor het bouwen van relaties en patronen

      QC - Kwaliteitscontrole - Biedt een breed scala aan analytische kwaliteitscontrolemethoden en checklists voor presentatiekwaliteit, ongeëvenaarde flexibiliteit en diversiteit.

      Neural Networks - (aparte module) 's werelds enige softwareproduct voor onderzoek naar neurale netwerken, volledig vertaald in het Russisch

      Data Miner - datamining

    Grafische afbeeldingen

    Het STATISTICA-systeem heeft uitgebreide grafische mogelijkheden. STATISTICA omvat een groot aantal verschillende categorieën en soorten grafieken (inclusief wetenschappelijke, zakelijke, driedimensionale en tweedimensionale grafieken in verschillende coördinatensystemen, gespecialiseerde statistische grafieken - histogrammen, matrixgrafieken, gecategoriseerde grafieken, enz.).

    Het STATISTICA-systeem bevat een groot aantal tools voor het opzetten van alle kaartcomponenten. Het is mogelijk om verschillende soorten lijnen, formaten voor het markeren van assen, kleuren, legenda's, titels en andere attributen van de grafiek te selecteren. Aangepaste kenmerken kunnen worden opgeslagen in een speciaal bestand en vervolgens worden toegepast op andere grafieken. Toegang tot alle hoofdconfiguratiecommando's wordt gerealiseerd met behulp van de contextmenu's die verschijnen door op de rechtermuisknop te drukken, het algemene menu en vanuit de diagramwerkbalk. STATGRAFIEK PLUS. Een behoorlijk krachtig statistisch programma. Bevat meer dan 250 statistische functies, genereert duidelijke, aanpasbare rapporten. De laatst beschikbare versie is 5.1. Het kan worden verkregen via de website http://www.statgraphics.com/ Het is mogelijk om een ​​demoversie te downloaden. Opgemerkt moet worden dat vroege versies van dit programma erg populair waren bij Russische onderzoekers.

    MATLAB MATLAB (afkorting voor "Matrix Laboratory") is een term die verwijst naar een pakket van toegepaste programma's voor het oplossen van technische computerproblemen, evenals naar de programmeertaal die in dit pakket wordt gebruikt. MATLAB wordt gebruikt door meer dan 1.000.000 ingenieurs en wetenschappers en draait op de meeste moderne besturingssystemen, waaronder Linux, Mac OS, Solaris en Microsoft Windows.

    MATLAB biedt de gebruiker een groot aantal (enkele honderden) functies voor data-analyse, die bijna alle gebieden van de wiskunde bestrijken, met name:

      Matrices en lineaire algebra - matrixalgebra, lineaire vergelijkingen, eigenwaarden en vectoren, singulariteiten, matrixfactorisatie en andere.

      Veeltermen en interpolatie - wortels van veeltermen, bewerkingen op veeltermen en hun differentiatie, interpolatie en extrapolatie van krommen, en andere.

      Wiskundige statistiek en gegevensanalyse - statistische functies, statistische regressie, digitale filtering, snelle Fourier-transformatie en andere.

      Gegevensverwerking - een reeks speciale functies, waaronder plotten, optimalisatie, zoeken naar nullen, numerieke integratie (in kwadratuur) en andere.

      Differentiaalvergelijkingen - oplossen van differentiaal- en differentiaal-algebraïsche vergelijkingen, differentiaalvergelijkingen met vertraging, vergelijkingen met beperkingen, partiële differentiaalvergelijkingen en andere.

      Sparse matrices zijn een speciale MATLAB-gegevensklasse die wordt gebruikt in gespecialiseerde toepassingen.

      Rekenen met gehele getallen - Voert rekenkundige bewerkingen met geheel getal uit in de MATLAB-omgeving.

    STADIA. Russisch ontwikkelingsprogramma met een geschiedenis van 16 jaar. Bevat alle noodzakelijke statistische functies. Ze doet uitstekend werk met haar taak - statistische analyse. Maar het programma is uiterlijk sinds 1996 niet echt veranderd. Grafieken en diagrammen die met STADIA zijn gemaakt, zien er archaïsch uit in moderne presentaties.

    STAAT. Professioneel statistisch softwarepakket. Een van de meest populaire onderwijs- en wetenschappelijke instellingen in de Verenigde Staten, samen met SPSS.

    JMR. Een van de wereldleiders op het gebied van data-analyse.

    SYSTAT Statistisch systeem voor personal computers.

    NCSS. Het programma is in ontwikkeling sinds 1981 en is bedoeld voor niet-professionals op het gebied van statistische verwerking. De systeeminterface heeft meerdere vensters en is daarom een ​​beetje ongewoon om te gebruiken.

    MINITAB 14. Dit is een redelijk eenvoudig te gebruiken softwarepakket met een goede gebruikersinterface, goede mogelijkheden om de resultaten van het werk te visualiseren.

    STATGRAFIEK PLUS. Een behoorlijk krachtig statistisch programma. Bevat meer dan 250 statistische functies, genereert duidelijke, aanpasbare rapporten.

    PRISMA. Met de intuïtieve interface kunt u binnen enkele minuten gegevens analyseren en grafieken van hoge kwaliteit maken. Het programma bevat de belangrijkste veelgebruikte statistische functies, die voor de meeste onderzoeken voldoende zullen zijn.

    Invoering

    STATISTICA is een geïntegreerd data-analyse- en beheersysteem. STATISTICA is een op maat gemaakte applicatie-ontwikkelingstool voor bedrijven, economie, financiën, industrie, geneeskunde, verzekeringen en andere gebieden. STATISTICA is gemakkelijk te leren en te gebruiken.

    Alle analytische tools die in het systeem beschikbaar zijn, zijn beschikbaar voor de gebruiker en kunnen worden geselecteerd met behulp van een alternatieve gebruikersinterface. De gebruiker kan zijn werk volledig automatiseren, van het gebruik van eenvoudige macro's om routinehandelingen te automatiseren tot diepgaande projecten, inclusief de integratie van het systeem met andere applicaties of internet. Automatiseringstechnologie stelt zelfs een onervaren gebruiker in staat om het systeem voor zijn project aan te passen.

    De procedures van het STATISTICA-systeem hebben een hoge snelheid en nauwkeurigheid van berekeningen.

    Dankzij flexibele en krachtige gegevenstoegangstechnologie kunt u efficiënt werken met zowel gegevenstabellen op een lokale schijf als met gegevensopslag op afstand.

    Het systeem heeft de volgende algemeen erkende voordelen:

    • bevat een volledige set klassieke methoden voor gegevensanalyse: van eenvoudige statistische methoden tot geavanceerde methoden, waarmee u de analyse flexibel kunt organiseren;
    • is een hulpmiddel voor het bouwen van toepassingen in specifieke gebieden;
    • de leveringsset bevat speciaal geselecteerde voorbeelden waarmee u de analysemethoden systematisch onder de knie krijgt;
    • voldoet aan alle Windows-standaarden, wat de analyse zeer interactief maakt;
    • het systeem kan worden geïntegreerd in het internet;
    • ondersteunt webformaten: HTML, JPEG, PNG;
    • gemakkelijk te leren en de ervaring leert dat gebruikers uit alle toepassingsgebieden het systeem snel onder de knie krijgen;
    • gegevens van het STATISTICA-systeem kunnen eenvoudig worden omgezet in verschillende databases en spreadsheets;
    • Ondersteunt afbeeldingen van hoge kwaliteit voor effectieve datavisualisatie en grafische analyse;
    • is een open systeem: bevat programmeertalen waarmee u het systeem kunt uitbreiden, uitvoeren vanuit andere Windows-applicaties, bijvoorbeeld vanuit Excel.

    STATISTICA bestaat uit een reeks modules, die elk thematisch verwante groepen procedures bevatten. Wanneer u van module wisselt, kunt u ofwel slechts één venster van de STATISTICA-toepassing open laten, of alle eerder genoemde modules, aangezien elk ervan in een afzonderlijk venster kan worden uitgevoerd (als een onafhankelijke Windows-toepassing).

    Wanneer STATISTICA-modules als zelfstandige toepassingen worden uitgevoerd, is er op elk moment in elke module directe toegang tot "gemeenschappelijke" bronnen (gegevenstabellen, BASIC- en SCL-talen, grafische procedures).

    Bij het installeren van het systeem zal het installatieprogramma ( Opstelling( Hulp, Configuratie). De gebruiker vindt het misschien handiger om modules te starten door op hun pictogrammen op het bureaublad te klikken (in plaats van het Module Switcher-venster te gebruiken); dus hij zal waarschijnlijk extra pictogrammen voor de modules willen maken naast de pictogrammen die automatisch door het installatieprogramma worden gegenereerd ( Opstelling). Volg de standaardprocedure om nog een pictogram in deze groep te maken ramen(selecteer Nieuw in het menu Bestand in het raam Verzender programma's ( Programmabeheer r) en maak een nieuw programma-item aan).

    Opzetten van het STATISTICA systeem. Het systeem biedt de mogelijkheid om een ​​verscheidenheid aan kenmerken en programma-interface aan te passen in overeenstemming met de voorkeuren van de gebruiker. U kunt bijvoorbeeld het opstartproces wijzigen, namelijk de standaardmodus voor volledig scherm annuleren, het uiterlijk van de startbalk, werkbalk, gegevenstabellen en andere parameters wijzigen.

    Algemene systeemparameters configureren. Wijzig de instelling van de algemene systeemparameters op elk moment wanneer u met het programma werkt. Deze parameters bepalen:

    • algemene aspecten van programmagedrag (maximalisering van het STATISTICA-venster bij opstarten, werkmappen, tool) Slepen en neerzetten en laat gaan - Slepen en neerzetten, automatische koppelingen tussen grafieken en gegevens, multitasking, enz.),
    • uitvoermodus (bijv. automatisch afdrukken van tabellen of grafieken, rapportformaten, buffering, enz.),
    • algemeen overzicht van het toepassingsvenster (pictogrammen, werkbalken, enz.),
    • weergave van documentvensters (kleuren, lettertypen).

    Elk van deze parameters kan worden geconfigureerd in het bijbehorende venster, dat toegankelijk is via het menu Onderhoud... De volgende afbeeldingen tonen twee voorbeelden van dergelijke vensters.


    Alle algemene parameters kunnen worden geconfigureerd, ongeacht het type documentvenster (bijvoorbeeld tabel of grafiek) dat momenteel actief is.

    De gebruikersinterface aanpassen. Wanneer u met het STATISTICA-systeem werkt, is het mogelijk om de gebruikersinterface van het programma aan te passen zodat het "doordachter" wordt in termen van de behoeften van een bepaalde gebruiker.


    Afhankelijk van de vereisten van de taak en persoonlijke voorkeuren (evenals esthetische overwegingen), kunt u verschillende "modi" en voorwaarden van het programma gebruiken.


    Ondersteuning voor verschillende configuraties van het STATISTICA-systeem. Totdat er speciale wijzigingen worden aangebracht, behoudt STATISTICA alle huidige instellingen en standaardparameters.

    Het feit dat de systeemconfiguratie-informatie wordt opgeslagen in dezelfde map van waaruit het STATISTICA-programma wordt aangeroepen, stelt u in staat om verschillende programmaconfiguratie-opties tot uw beschikking te hebben voor verschillende projecten of soorten werk. U kunt het programma bijvoorbeeld oproepen vanuit verschillende mappen op de schijf, die elk een bepaalde coherente set documenten bevatten, en voor elk van deze mappen kan het systeem worden geconfigureerd met zijn eigen uitvoerinstellingen, standaard grafische parameters, enz. U kan verschillende STATISTICA-pictogrammen maken in verschillende groepen toepassingen op het bureaublad ramen(elk komt overeen met een specifiek project of type werk) en stel er verschillende waarden voor in het veld Werkmap ( Werkmap)(met behulp van het systeemdialoogvenster) ramen Eigenschappen programma-item (Programma-item eigenschappen)).

    Multitasking... STATISTICA ondersteunt de multitasking-modus (tussen de modules of andere applicaties).


    Bij het verwerken van zeer grote hoeveelheden informatie of het uitvoeren van complexe analyseprocedures, kunt u overschakelen naar een andere STATISTICA-module (of een andere applicatie) ramen), gebruikmakend van de mogelijkheid om gegevensverwerking op de achtergrond uit te voeren.

    Werken in één venster van de STATISTICA-applicatie(in plaats van modus met meerdere vensters). Een van de opties voor de algemene systeeminstellingen van het STATISTICA-pakket stelt de gebruiker in staat om de modus in te stellen waarin het programma standaard zal werken - in één toepassingsvenster of als een reeks toepassingen (elk in zijn eigen venster). Een van de directe gevolgen van deze keuze is de modus waarin het Module Switcher-venster zal werken: wanneer u dubbelklikt op de naam van een module in dit venster, wordt de geselecteerde module geopend in plaats van een reeds geopende, of er wordt een nieuw toepassingsvenster voor geopend, terwijl het vorige venster open blijft ...

    De keuze voor een of andere bedrijfsmodus wordt gemaakt in het veld Modules schakelen: enkele toepassingsmodus in het dialoogvenster Standaardinstellingen: algemene instellingen (opgeroepen vanuit het servicemenu). Als dit vakje is aangevinkt, werkt STATISTICA in de modus voor één toepassing.


    Enkele toepassingsmodus... Wanneer de modus van het ene toepassingsvenster is geselecteerd, zal het overschakelen van de ene module naar de andere plaatsvinden zonder nieuwe vensters te openen. Elke keer dat een nieuwe module in hetzelfde venster wordt geopend, vervangt de vorige. Sommige gebruikers geven de voorkeur aan zo'n "eenvoudige" werkingsmodus, omdat alle analyses in één toepassingsvenster plaatsvinden en het aantal actieve programma's op de desktop minimaal zal zijn.

    Ongeveer hetzelfde effect kan worden bereikt door op de knop te drukken Af te maken en schakel in het dialoogvenster Moduleschakelaar; in dit geval zal het toepassingsvenster van de huidige module sluiten, maar niet worden vervangen door een nieuw venster; in plaats daarvan zal het systeem het "volgende" toepassingsvenster openen.

    Meerdere toepassingsmodus. Het belangrijkste voordeel van de modus voor meerdere toepassingen is de mogelijkheid om verschillende analyseprocedures (modules) parallel uit te voeren in verschillende gelijktijdig geopende toepassingsvensters. Tegelijkertijd kunt u schakelen tussen modules zonder de vorige te sluiten, en alle voordelen gebruiken van het werken met onafhankelijke wachtrijen van tabellen met resultaten en grafieken voor toepassingsvensters van verschillende modules. Deze modus heeft duidelijke voordelen voor de meeste gegevensanalysetaken en stelt u in staat verschillende analysemethoden te gebruiken (en de verkregen resultaten te vergelijken).

    Interactieve data-analyse in STATISTICA... Het systeem vereist niet dat de gebruiker alle informatie specificeert die vóór de analyse op het scherm moet worden weergegeven. De analyse van zelfs een eenvoudig plan kan inderdaad een groot aantal tabellen met resultaten en gewoon een immens aantal grafieken genereren, daarom is het bij het uitvoeren van een echte analyse, voordat de belangrijkste resultaten worden bestudeerd, moeilijk voor te stellen welke grafieken of tabellen eerst geanalyseerd moeten worden. Daarom biedt STATISTICA de gebruiker de mogelijkheid om bepaalde soorten output te selecteren en interactief opeenvolgende vergelijkingen en gesimuleerde analyses uit te voeren nadat de gegevens zijn verwerkt en de belangrijkste resultaten zijn verkregen.

    Het aantal weergegeven vensters kan ook worden aangepast om het computerscherm niet te overbelasten.


    Flexibele rekenprocedures STATISTICA en een breed scala aan methoden voor het grafisch weergeven van gegevens van elk type bieden de gebruiker onbeperkte mogelijkheden voor verkennende analyse en het testen van statistische hypothesen.

    Welke mogelijkheden werkboeken bieden?... Werkmappen helpen u bij het ordenen van sets bestanden (bijv. resultatentabellen, grafieken, tekst/grafische rapporten, aangepaste programma's, enz.) die zijn gemaakt of gebruikt (bijv. bekeken) tijdens de analyse van de dataset. Werkmappen houden een lijst bij van alle bestanden die met de huidige dataset worden gebruikt.


    Een bijgewerkte lijst van deze bestanden wordt automatisch opgeslagen met het gegevensbestand. Als u het vakje aanvinkt Auto naast de bestandsnaam wordt deze automatisch geopend met de huidige dataset.

    Helpsysteem en online (elektronische) handleiding... Voor meer informatie over sommige systeemfuncties, drukt u op de Help-toets (F1) wanneer het bijbehorende commando of menu-item is gemarkeerd. STATISTICA bevat een elektronische handleiding - referentie-informatie over alle procedures en functies van het programma, beschikbaar in contextgevoelige modus door op de F1-toets of de help-knop in de titelbalk van alle dialoogvensters te drukken (de referentie bevat meer dan 10 megabyte aan gecomprimeerde documentatie ). Vanwege de dynamische organisatie van de e-Manual met hyperlinks (en de verschillende aanpassingsmogelijkheden) is het meestal sneller om dit helpsysteem te gebruiken dan om de gewenste informatie in gedrukte vorm te zoeken. Hulp kan ook worden opgeroepen door te dubbelklikken op het berichtveld in de statusbalk onder aan het STATISTICA-toepassingsvenster (het berichtveld geeft ook korte opmerkingen weer over de functies van respectievelijk vervolgkeuzemenu's of werkbalkknoppen wanneer een menu-item is geselecteerd of er wordt op een knop gedrukt).

    Statistisch Adviseur. De Statistisch Adviseur is een online helpsysteem. Na het selecteren van het Expert Advisor-item in het vervolgkeuzemenu (Help), zal het programma u eenvoudige vragen stellen over de aard van het probleem dat wordt opgelost en het type invoergegevens, en vervolgens zal het een lijst met de meest geschikte procedures aanbieden (en leg uit waar u ze kunt vinden in het STATISTICA-systeem).


    Met behulp van hyperlinks kunt u rechtstreeks vanuit het gedeelte Statistisch adviseur naar een gedetailleerde beschrijving van de relevante statistische methoden en procedures in het gedeelte Inleidend overzicht.

    Toepassingen... Alle overwogen functies (beschikbaar op elk moment wanneer u met het systeem werkt) kunnen dienen als een zwaarwegend alternatief of aanvulling op de gebruikelijke interactieve gebruikersinterface, omdat u hiermee het routinematige proces van het herhaaldelijk uitvoeren van dezelfde, inclusief zeer complexe, taken kunt automatiseren . Een macro (aangeroepen door op een knop op de werkbalk Opstartknoppen te klikken of met een enkele toetsaanslag) kan bijvoorbeeld een lange lijst met variabelen, een veelgebruikte grafiek, een insluitbewerking, enzovoort bevatten.

    Automatische rapporten en automatische afdruk van tabellen met resultaten. Of de verwerking nu in batchmodus is of interactief wordt aangevraagd door de gebruiker, de uitvoermodus kan worden geselecteerd: Automatisch rapport... In deze modus kan automatisch, zonder enige actie van de gebruiker, de inhoud van alle uitvoervensters die tijdens de analyse worden verkregen, afdrukken (of verzenden naar het rapportvenster of naar een bestand).

    De modus voor automatische uitvoer van elke tabel met resultaten en / of grafieken die op het scherm is gebouwd, kan niet alleen nuttig zijn voor het maken van een volledig rapport over de analyseresultaten, maar ook voor verkennende gegevensanalyse, wanneer het nodig is om terug te keren naar de vorige stap en bekijk de resultaten die zijn verkregen in de vroege stadia van gegevensverwerking. ... Om dit te doen, kan alle uitvoerinformatie (tabellen met resultaten en grafieken) naar een tijdelijk Scrolling Text / Output Window worden gestuurd en pas daarna, indien nodig, opslaan, afdrukken of kopiëren naar een teksteditorbestand.

    Automatisch afdrukken van grafieken. De automatische afdrukmodus van alle grafieken die op het scherm verschijnen, is vooral handig als een manier om grafische batches af te drukken.


    Grafieken zijn doorgaans tijdrovend om af te drukken. Daarom is het logisch om deze modus te gebruiken om een ​​reeks ("cascade") van grafieken af ​​te drukken die zijn verkregen bij het gebruik van bepaalde analysemethoden (er is bijvoorbeeld een lange reeks grafieken vereist voor de visuele weergave van de configuraties van gemiddelden in de studie van hogere-orde relaties in ANOVA, en voor multidimensionale tabellen, een cascade van driedimensionale histogrammen voor twee variabelen).

    Het is echter veel efficiënter om de gegenereerde reeks plots naar het tekst-/uitvoervenster te sturen. STATISTICA biedt de mogelijkheid om alle eerder opgeslagen grafieken en tabellen met resultaten batchgewijs af te drukken; selecteer hiervoor het item Bestanden afdrukken in het vervolgkeuzemenu Bestand.

    Klembord. De snelste en in veel gevallen de gemakkelijkste manier om gegevens uit andere applicaties te krijgen ramen(bijvoorbeeld spreadsheets) is het gebruik van het klembord, dat in STATISTICA speciale gegevensindelingen ondersteunt die zijn gemaakt door toepassingen zoals MS Excel of Lotus voor Windows. STATISTICA interpreteert bijvoorbeeld opgemaakte (bijvoorbeeld 1.000.000 of $ 10) en tekstwaarden correct. Het klembord en de conversie van gegevensbestanden kunnen ook worden gebruikt om gegevens van STATISTICA naar andere formaten te exporteren. Bij het importeren en exporteren van gegevens gebruikt STATISTICA dezelfde set formaten en gegevenstypen.

    Functies voor het importeren van bestanden. Gegevensbestanden van applicaties ramen en andere besturingssystemen kunnen ook worden geconverteerd naar het STATISTIC A-formaat met behulp van functies voor het importeren van bestanden, waaronder toegang tot alle databases (via ODBC-ondersteuning) en de mogelijkheid om opgemaakte tekstbestanden en tekstbestanden in vrij formaat (ASCII) te importeren. Bestanden importeren zonder het klembord te gebruiken heeft zijn voordelen:

    • het stelt de gebruiker in staat om precies te specificeren hoe de import moet worden gedaan (selecteer bijvoorbeeld waardenbereiken uit bestanden, importeer wel of niet variabelenamen, tekstwaarden en hoofdletternamen en specificeer hoe deze moeten worden geïnterpreteerd);
    • het geeft de gebruiker toegang tot gegevenstypen die niet beschikbaar (of moeilijk toegankelijk) zijn tijdens bewerkingen met het klembord (bijvoorbeeld lange waardelabels of speciale codes voor ontbrekende gegevens).

    DDE-links. STATISTICA ondersteunt Dynamic Data Interchange (DDE)-conventies, waarmee u een reeks gegevens in een brongegevenstabel dynamisch kunt koppelen aan een gegevensset van andere toepassingen (Windows). Deze procedure is eigenlijk veel eenvoudiger dan het lijkt, en gemakkelijk te leren zonder technische kennis van het DDE-mechanisme, vooral bij gebruik van het Connect-commando (in plaats van een beschrijving van de relatie te typen). Er kunnen DDE-koppelingen (Dynamic Data Exchange) worden gemaakt tussen een bronbestand (server), zoals een MS Excel-spreadsheet, en een STATISTICA-gegevensbestand (clientbestand), zodat bij wijzigingen in het bronbestand de gegevens in het overeenkomstige deel van de brongegevenstabel STATISTICA (clientbestand) wordt automatisch bijgewerkt.


    Gewoonlijk worden twee bestanden dynamisch gekoppeld in industriële installaties wanneer een meetapparaat wordt aangesloten op de seriële poort van de computer waar het STATISTICA-gegevensbestand zich bevindt (bijvoorbeeld om automatisch bepaalde metingen op uurbasis bij te werken).

    DDE-koppelingen kunnen tot stand worden gebracht met de opdracht Koppelen in het vervolgkeuzemenu Brongegevenstabel bewerken of door een koppelingsdefinitie in te voeren in het veld Lange naam (label, formule, koppeling): van het dialoogvenster Variabele specificatie.


    Als de verbinding tot stand is gebracht, kunt u deze beheren in het dialoogvenster Linkmanager(aangeroepen met het commando Verbindingen... drop-down menu Bewerking).


    Datum- en tijdnotaties... In systeemgegevensbestanden (die zijn georganiseerd als databases), wordt de waardeweergave-indeling toegepast op de gehele variabele, niet op afzonderlijke cellen (zoals in Excel). Daarom worden waarden die in Excel zijn opgemaakt als datums weergegeven als Juliaanse (integer) waarden in het STATISTICA-bestand (bijvoorbeeld 34092 in plaats van 3 mei 1993), tenzij het formaat is ingesteld voor de bijbehorende variabelen datum of Tijd.

    Ondersteunt STATISTICA ODBC? Ja, om deze functie te implementeren, is er een lijst met Import Data-commando's, die kunnen worden opgeroepen vanuit het vervolgkeuzemenu Bestand van elke module. De ODBC STATISTICA-interface bevat mogelijkheden voor het combineren van velden uit meerdere tabellen en biedt toegang tot een verscheidenheid aan databasebestanden, inclusief grote en personal computerformaten (bijv. dBASE voor Windows, Paradox, Sybase, Oracle, SAS, enz.).


    ODBC-import kan worden geautomatiseerd met behulp van ODBC / Templates of SCL-programma's.

    Objecttypen. Als de modus is ingesteld op Nieuw object, kan het type object dat u wilt maken worden geselecteerd uit de lijst met Windows-toepassingen die OLE-tools ondersteunen. Na het selecteren van het type en het indrukken van de knop Oke een venster van de bijbehorende toepassing wordt geopend om een ​​nieuw object te maken. Als de modus Object uit bestand is, wordt het type object dat moet worden ingevoegd ook geselecteerd uit de lijst met Windows-toepassingen die OLE-tools ondersteunen; na het selecteren van het type worden alle eerder opgeslagen bestanden van deze applicatie getoond. In de modus Afbeelding uit bestand kunt u een object invoegen dat niet compatibel is met de OLE-methode, maar is opgenomen in een van de grafische Windows-indelingen: in het metabestandsformaat (bestand met de extensie * .wmf) of bitmap (bestand met de * bmp-extensie).


    Koppelen en insluiten... STATISTIC A ondersteunt OLE-faciliteiten (Object Linking and Embedding) in zowel client- als servermodus. Het is dus niet alleen mogelijk om STATISTICA-kaarten dynamisch te configureren in andere toepassingen (servermodus), maar ook om OLE-compatibele objecten uit andere toepassingen (bijvoorbeeld kaarten of tabellen) of native objecten in te sluiten en vervolgens te converteren naar STATISTICA-kaarten. Met andere woorden, naast het toevoegen van externe elementen aan STATISTICA-grafieken, kunt u met behulp van invoeging ook rechtstreeks toegang krijgen tot objecten in een bestand op schijf (sleep ze bijvoorbeeld rechtstreeks vanuit het venster Bestandsbeheer of Geleider(Windows Verkenner) en plaats op de STATISTICA-grafiek).


    STATISTICA ondersteunt zowel gekoppelde (dat wil zeggen dynamisch gekoppelde) als ingesloten (dat wil zeggen statisch "ingebedde") objecten. Ze kunnen echter worden gevonden in elk bestand dat door Windows-toepassingen is gemaakt, inclusief bestanden in het eigen grafische STATISTICA-formaat (met de extensie * .stg). Bovendien kan STATISTICA tegelijkertijd zowel een client als een server zijn in de OLE-methode, terwijl de unieke mogelijkheid behouden blijft om geneste samengestelde documenten te creëren (tot en met de vierde orde), dat wil zeggen dat een STATISTICA-document met een ingesloten document op zijn beurt , worden ingesloten in een ander document van dit systeem.

    Merk op dat elk van deze twee bevestigingsmethoden (linken en insluiten) voor- en nadelen heeft.

    Gerelateerde objecten. Grafieken met gekoppelde objecten zijn langzamer te hertekenen omdat ze koppelingen naar externe bestanden kunnen bevatten. Tegelijkertijd worden deze grafieken automatisch bijgewerkt (de linkstatus kan worden ingesteld in het dialoogvenster Gegevens en grafieken, dat wordt opgeroepen vanuit het menu Grafisch bewerken), en dit maakt het gemakkelijk om samengestelde documenten te maken die precies de "huidige " inhoud van andere bestanden.


    Ingesloten objecten. Grafieken met ingesloten objecten worden sneller opnieuw getekend dan grafieken met gekoppelde objecten, omdat er geen koppelingen zijn naar bijgewerkte externe bestanden. Als u dubbelklikt op een embedded object, wordt de servertoepassing (dus de bron) aangeroepen, waarin u dit object kunt wijzigen. In dit geval kunt u een ingesloten object op twee manieren bijwerken: bewerk het of vervang het handmatig.

    Op het menu Bewerking u kunt alle parameters van externe objecten (gekoppeld of ingesloten) configureren, evenals hun relatie met andere componenten van de grafiek. Bovendien kunt u door met de rechtermuisknop op een object te klikken de gewenste configuratiecommando's selecteren in het contextmenu. De enige uitzondering is de manier om een ​​object te koppelen (linken of insluiten), die wordt gedefinieerd op het moment van het koppelen van het bestand (daarna kan alleen het gekoppelde object worden geconverteerd naar embedded, maar niet omgekeerd (zie de Convert to embedded opdracht uit het vervolgkeuzemenu Bewerking)).

    Gekoppelde of ingesloten OLE-objecten instellen. Objecten van OLE-grafieken STATISTICA kan worden bewerkt door te dubbelklikken op het object; hierdoor wordt de brontoepassing geopend in de OLE-servermodus met het object klaar om te bewerken. Als dit object een STATISTICA-grafiek is, wordt een nieuw grafisch venster geopend in de huidige module, waardoor het systeem tegelijkertijd als client en als server kan fungeren.


    Wanneer het bewerken is voltooid, kunt u een van de standaard OLE-conventies toepassen om de servermodus af te sluiten en de grafiek in het STATISTICA-systeem te vernieuwen (met behulp van de opdrachten Vernieuwen, Vernieuwen en Terugkeren naar ... enz. in het vervolgkeuzemenu Bestandstoepassing ; deze opdrachten zijn alleen beschikbaar in als de toepassing in servermodus draait).

    Grafische formaten Metafile en Bitmap. Als u een grafisch bestand wilt invoegen in toepassingen die geen OLE-methoden ondersteunen, gebruikt u de opdrachten Metabestand opslaan of Bitmap opslaan (uit het grafisch vervolgkeuzemenu Bestand). De grafiek in de Windows-metabestandsindeling wordt geschreven naar een bestand met de extensie * .wmf en in bitmapindeling - met de extensie * .bmp. Deze formaten, beschreven in de volgende twee paragrafen, implementeren niet alle aanpassingsopties voor STATISTICA-grafieken, maar zijn tegelijkertijd compatibel met alle toepassingen die grafische Windows-formaten ondersteunen.

    Wat is een Windows-metabestand? Grafisch formaat Metafile is een van de standaarden voor het schrijven van grafische bestanden (met de extensie * .wmf) en hun presentatie op het Windows-klembord. Het bevat een afbeelding in de vorm van beschrijvingen en definities van alle kaartcomponenten en de bijbehorende attributen (bijvoorbeeld lijnelementen, hun kleuren en patronen, opvulpatronen, tekstbeschrijvingen en de bijbehorende parameters).

    Vergeleken met de bitmapstandaard (zie hieronder), maakt het metabestandsformaat een flexibelere aanpassing van OLE-incompatibele objecten in Windows-toepassingen mogelijk.

    Wanneer u bijvoorbeeld een metabestand opent in Microsoft Draw, kunt u de grafiekafbeelding "uitvouwen", afzonderlijke lijnen, opvulpatronen of kleuren selecteren en wijzigen, en de tekst bewerken en de kenmerken ervan wijzigen.


    Niet alle Windows-toepassingen ondersteunen echter alle functies van de metabestandsindeling die beschikbaar zijn in STATISTICA. Sommige parameters van grafieken die door het STATISTICA-systeem in dit formaat zijn opgenomen, kunnen veranderen wanneer ze in andere toepassingen worden afgespeeld. De rotatie van sommige lettertypen kan bijvoorbeeld verdwijnen. Gebruik daarom waar mogelijk het grafische STATISTICA-formaat en de £ 01-methoden voor het werken met grafieken in andere toepassingen, om toegang te krijgen tot alle aanpassingsmogelijkheden van STATISTICA zelf.

    Beperkingen van de standaard Windows Metafile-indeling... Complexe grafische afbeeldingen die door STATISTICA worden gegenereerd, zijn mogelijk te groot (in termen van het aantal geleverde gegevenspunten) om te worden opgenomen in het metabestandsformaat, dat het standaard Windows-systeem is dat wordt gebruikt voor de meeste afbeeldingen voor het koppelen en insluiten van afbeeldingen. In dergelijke gevallen moet u een bitmap gebruiken. Raadpleeg voor meer informatie de online handleiding vanuit het dialoogvenster Geavanceerde opties, dat toegankelijk is via het tabblad Afbeeldingen van het dialoogvenster Pagina-/uitvoeropties.

    Wat is bitmapformaat? Het Bitmap-formaat is het tweede standaard grafische Windows-formaat dat wordt gebruikt om grafische bestanden weer te geven (met de extensie * .bmp) en om afbeeldingen over te brengen via het klembord (zoals het Metafile-formaat). Dit formaat slaat geen extra gegevens of parameters op, behalve de afbeelding van de afbeelding zelf.

    In tegenstelling tot een metabestand is een bitmap een "passieve" point-to-point weergave van het grafische venster. De mogelijkheid om deze grafiek in andere Windows-applicaties aan te passen is zeer beperkt. Ze omvatten meestal alleen rekken, krimpen, knippen, plakken en schilderen over de grafiek. Zoals hierboven vermeld, is het voor het werken met grafieken in andere toepassingen handiger om het grafische STATISTICA-formaat en de OLE-methoden te gebruiken om toegang te hebben tot alle opties voor het configureren van het STATISTICA-systeem zelf.

    Wat is STATISTICA Native Graphics Format? Grafische bestanden van het STATISTICA-systeem hebben de extensie * stg. Het belangrijkste verschil met metabestanden en bitmaps is dat ze niet alleen een afbeelding bevatten, maar ook alle informatie die nodig is om een ​​grafiek op te zetten en gegevens te analyseren. Alle gegevens die in de grafiek worden gepresenteerd, hun relaties, passende vergelijkingen, parameters van ingesloten objecten, relaties van grafieken en figuren, enz. De grafieken die in dit formaat zijn vastgelegd, kunnen vervolgens worden geopend in een van de STATISTICA-systeemmodules om verder te gaan opzetten en analyseren van de gegevens. Als alternatief kunnen ze in batch worden afgedrukt met het commando Zegel bestanden uit het vervolgkeuzemenu Bestand... Grafische bestanden in het oorspronkelijke STATISTICA-formaat kunnen dynamisch worden gekoppeld aan Windows-toepassingsdocumenten met behulp van OLE-methoden.

    Exporteer via het klembord (plakken of speciaal plakken met OLE-methoden). Het klembord gebruiken is de snelste manier om een ​​grafiek naar een andere toepassing te exporteren. Bij het kopiëren naar het klembord worden drie grafische weergaven van het object gemaakt: in de oorspronkelijke STATISTICA-indeling, in de Windows-metabestandsindeling en in de bitmapindeling. Elk van hen kan in andere toepassingen worden gebruikt.

    STATISTICA-grafieken kunnen in andere toepassingen (editors of spreadsheets) zowel als gekoppelde als ingesloten objecten aanwezig zijn. Bij het gebruik van OLE-methoden behouden ze hun verbinding met het STATISTICA-systeem en kunnen ze daarom interactief worden bewerkt binnen andere applicaties.

    Toegang tot alle kaartgegevens. De gegevens die op de systeemgrafieken worden gepresenteerd, kunnen direct worden bekeken en gewijzigd, ongeacht het type, in de ingebouwde Graph Data Editor. Dit kunnen onbewerkte gegevens zijn, delen van een resultatentabel of een reeks berekende waarden (bijvoorbeeld een waarschijnlijkheidsplot).

    Voor elke grafiek wordt een bijbehorend "kind" Editor-venster gemaakt, dat samen met het bijbehorende grafische venster wordt gesloten. De editor is georganiseerd als groepen kolommen die de individuele afhankelijkheden van een bepaalde grafiek vertegenwoordigen (zie volgende paragraaf).


    Gecategoriseerde grafieken. Gegevens zijn onderverdeeld in subgroepen om gecategoriseerde grafieken te maken. Eén afbeelding toont meerdere grafieken tegelijk, één voor elk van de gespecificeerde subgroepen. U kunt bijvoorbeeld grafieken apart plotten voor mannelijke en vrouwelijke proefpersonen, patiënten verdelen in groepen vrouwen met hoge bloeddruk, vrouwen met lage bloeddruk, mannen met hoge bloeddruk, producten verdelen naar kwaliteit, land van herkomst, enz. en verkennen de verbindingen tussen deze groepen is een uiterst belangrijke data-analysetechniek.


    • Ze zijn beschikbaar in de meeste dialoogvensters met analyseresultaten (deze grafieken worden automatisch gegenereerd in die procedures waar groepen of subgroepen van gegevens worden geanalyseerd, bijvoorbeeld tijdens classificatie, t-tests, in ANOVA, discriminante en niet-parametrische analyse).
    • Dit soort grafieken wordt vermeld in de lijst Snelle statistische grafieken in de contextmenu's van alle bron- en resultaattabellen.
    • Ze kunnen worden aangeroepen vanuit de lijst met statistische plots (in het vervolgkeuzemenu, Grafisch), die een breed scala aan verschillende methoden biedt voor het categoriseren van gegevens bij het bouwen ervan.

    Hoe worden "categorieën" gedefinieerd voor gecategoriseerde grafieken? U moet de gegevens dus eerst in groepen splitsen. Wanneer gecategoriseerde grafieken worden gegenereerd vanuit de analysedialoogvensters, worden gegevenssubgroepen automatisch geïdentificeerd (aangezien dergelijke onderverdelingen deel uitmaken van de gegevensverkenning). Bij het construeren van statistische grafieken worden verschillende manieren aangeboden om subgroepen te definiëren door een of twee groeperingsvariabelen. Bovendien kan de subgroepering door de gebruiker zelf worden georganiseerd, met behulp van een willekeurige combinatie van variabelen uit de huidige dataset.

    Er zijn verschillende methoden om categorieën te markeren:

    • door gehele waarden van de groeperingsvariabelen ( Hele getallen),
    • het verdelen van de groeperingsvariabelen in een bepaald aantal intervallen ( Categorieën),
    • het verdelen van de groeperingsvariabelen in intervallen met gespecificeerde grenswaarden ( Grenzen),
    • door specifieke waarden (codes) van groeperingsvariabelen in te stellen ( Codes),
    • door complexe subgroepen te vormen ( Complexe subgroepen); Om dit te doen, kan de gebruiker voorwaarden invoeren voor het selecteren van waarnemingen van bijna onbeperkte complexiteit en de waarden van elke variabele in het huidige gegevensbestand gebruiken, zoals hieronder weergegeven.

    De volgende afbeelding toont een nogal complexe grafiek, gecategoriseerd volgens twee criteria. In dit geval werd een gemengde methode gebruikt om subgroepen te identificeren. Tweerichtingscategorisatie betekent dat de elementen van de grafiek zijn gerangschikt als elementen van een tabel met twee ingangen, verkregen na gebruik van twee verschillende categorisatiemethoden.

    De twee lijnen in de onderstaande grafiek vertegenwoordigen de verdeling in subgroepen door de waarden van de variabele. Meet5. De drie kolommen van de grafiek vertegenwoordigen subgroepen die op een speciale manier zijn gedefinieerd door zaaknummers (nulvariabele) en waarden van de Home_7-variabele. Het dialoogvenster wordt hieronder weergegeven, de parameters van deze grafiek zijn ingesteld.


    Elke kleine grafiek toont de afhankelijkheid van honing van de variabelen Work_1 en Work_2 (respectievelijk als X en Y). De eerste categorisering (Categorieën op X - "kolommen" van grafieken) wordt uitgevoerd door de methode Complexe subgroepen in het dialoogvenster dat wordt opgeroepen door de knop Stel subgroepen in:

    De tweede klasse (Categorieën op Y of "lijnen" van grafieken) wordt bepaald door de groeperingsvariabele Naam_2. Het bereik van deze variabele is verdeeld in twee gelijke intervallen. Om dit te doen, wordt in het dialoogvenster voor het instellen van grafiekparameters in het veld Categorieën de waarde 2 ingevoerd (in dit geval de verdeling van de variabele Home_2 is verdeeld in twee groepen: gevallen waarvoor de waarden kleiner dan of gelijk zijn aan 104,62 en gevallen met waarden van deze variabele groter dan dit aantal).

    Ternaire oppervlakteplots en vlakke lijnkaarten. Bij het weergeven van de resultaten van de analyse van de samenstelling van mengsels in de module Experimentplanning, kunt u ternaire plots maken in de vorm van driedimensionale oppervlakken of kaarten van niveaulijnen.

    Ternaire kaarten kunnen worden opgebouwd vanuit het submenu Statistische XYZ-plots, statistische gecategoriseerde plots en aangepaste plots drop-down menu Grafisch.

    Polaire plots. Sommige soorten grafieken kunnen worden uitgezet in poolcoördinaten. Deze omvatten scatterplots, lijnplots en sequentiële geneste plots uit het submenu Statistical 2D plots (toegankelijk via het vervolgkeuzemenu Plots).


    In poolcoördinaten kunt u ook gecategoriseerde grafieken maken.

    Veel grafieken die in een conventioneel rechthoekig coördinatensysteem zijn getekend, kunnen worden weergegeven in poolcoördinaten. Om dit te doen, stelt u het overeenkomstige keuzerondje in het dialoogvenster Algemene lay-out in op Polaire positie.


    Hoe plaats je een grafisch object uit een andere applicatie op de STATISTICA-grafiek? Alle bovenstaande bewerkingen voor het plakken van het klembord (inclusief OLE-koppeling en insluiten) kunnen worden gebruikt om alle met Windows compatibele afbeeldingen te plakken. Deze bewerkingen kunnen worden uitgevoerd op rasterobjecten, Windows-metabestanden, grafieken in STATISTICA-formaat, evenals alle OLF-compatibele objecten.

    Hoe zet ik tekst op een STATISTICA-kaart (rapporten, tabellen, enz.)? Met behulp van de bovenstaande klembordbewerkingen kunt u een zeer groot tekstobject (bijvoorbeeld een rapport van meerdere pagina's lang) op STATISTICA-diagrammen plaatsen. Deze tekst wordt bewerkt en gewijzigd in het STATISTICA Graph Text Editor-venster of in de juiste toepassing die de server is in de OLE-methode.

    Alle plak- en klembordbewerkingen die in de vorige sectie zijn beschreven, zijn van toepassing op elk met Windows compatibel grafisch object, en de koppelings- en insluitbewerkingen worden uitgevoerd op alle objecten die OLE-methoden ondersteunen.

    Galerij van grafieken STATISTICA... Met deze knop opent u het dialoogvenster STATISTICA Graph Gallery. Deze knop is aanwezig in het dialoogvenster van elk grafiektype.


    Alle statistische en aangepaste grafieken, blanco grafische vensters en grafieken met gebruikersstatistieken kunnen hier snel en eenvoudig worden opgeroepen. Selecteer hiervoor de naam van het gewenste grafiektype en dubbelklik erop (of klik op Oke).

    Aangepaste en statistische grafieken. Naast gespecialiseerde grafieken, die rechtstreeks vanuit het overzichtsdialoogvenster van elk statistiekprogramma worden opgeroepen, zijn er twee hoofdtypen grafieken beschikbaar via het menu of de werkbalk van elke tabel: aangepaste grafieken en statistische (en snelle statistieken) grafieken.

    Het belangrijkste verschil tussen de twee hoofdtypen grafieken is de gegevensbron die moet worden weergegeven. Deze verschillen worden in de volgende paragrafen in meer detail beschreven.

    Aangepaste grafieken... Met een aangepaste grafiek kunt u elke door de gebruiker gedefinieerde combinatie van waarden uit brongegevenstabellen of resultaattabellen weergeven (evenals uit elke combinatie van hun rijen en/of kolommen). Het menu biedt vijf soorten van dergelijke grafieken: 2M aangepaste plots, 3M aangepaste sequentiële plots, 3M aangepaste spreidings- en oppervlakteplots, aangepaste matrixplots en aangepaste pictogrammen. Wanneer u er een selecteert, wordt een bijbehorend dialoogvenster geopend waarin u het gegevensbereik van de huidige tabel kunt instellen voor weergave in de grafiek. De inhoud van dit dialoogvenster is afhankelijk van het geselecteerde aangepaste grafiektype. De initiële selectie van gegevens voor plotten, aangeboden in dit dialoogvenster, wordt bepaald door de positie van de cursor in de huidige tabel. In elk dialoogvenster van een aangepaste grafiek is het bij het instellen van parameters mogelijk om een ​​bepaald type grafiek te selecteren (binnen het kader van het hoofdtype). De kaartweergave kan ook na het tekenen worden geselecteerd (met behulp van de dialoogvensters Algemene lay-out of Kaartplaatsing, die worden geopend wanneer u dubbelklikt op het achtergrondgebied van het grafische venster of wanneer u de juiste lijn selecteert in de vervolgkeuzelijst Lay-out menu).

    Statistische grafieken. In tegenstelling tot aangepaste grafieken, die een visuele weergave van numerieke gegevens in elke tabel bieden (invoer of uitvoer, zie hierboven), bieden statistische grafieken honderden vooraf gedefinieerde soorten grafische weergaven die analytische samenvattingen van statistische gegevens bevatten. Ze worden opgeroepen vanuit het dialoogvenster Grafiekgalerij, dat wordt geopend met de knop met dezelfde naam op de werkbalk of vanuit het vervolgkeuzemenu Grafische afbeeldingen.


    Bij het maken van dergelijke grafieken worden waarden rechtstreeks uit het gegevensbestand gebruikt, die niet afhankelijk zijn van de inhoud van de huidige tabel, blokselectie en cursorpositie. Tegelijkertijd worden ofwel standaardmethoden voor grafische analyse van de initiële gegevens voorgesteld (verschillende spreidingsgrafieken, histogrammen, grafieken van gemiddelde waarden, bijvoorbeeld medianen), ofwel standaard analytische onderzoeksmethoden (grafieken met normale verdelingsdichtheid, kansgrafieken met een uitgesloten trend, of grafieken van betrouwbaarheidsintervallen voor regressielijnen) ... Bij het maken van statistische grafieken houdt het programma rekening met de selectievoorwaarden en casusgewichten.

    De meest gebruikte soorten statistische grafieken (aangeroepen vanuit het menu) Grafische afbeeldingen, zie vorige paragraaf) worden gepresenteerd in het menu Snelle statistische grafieken... Deze kaartlijsten bieden niet zo'n breed scala aan opties als menu's. Statistische grafieken, maar in tegenstelling tot de laatste, vereenvoudigen en versnellen ze de plotprocedure. Snelle statistische grafieken:

    • aangeroepen vanuit contextmenu's of vanuit de werkbalk van een tabel (meestal hebben ze geen toegang tot vervolgkeuzemenu's of dialoogvensters nodig),
    • vereisen niet dat de gebruiker variabelen selecteert (deze keuze wordt bepaald door de huidige positie van de cursor in de tabel) en tussenliggende instellingen van parameters (het formaat van de overeenkomstige grafieken wordt standaard bepaald).

    Bij het selecteren van item B Snelle statistische grafieken(via de knop op de werkbalk in het contextmenu of in het vervolgkeuzemenu) Grafische afbeeldingen), verschijnt er een menu voor het selecteren van een statistische grafiek voor de huidige variabele van de tabel, dat wil zeggen degene waarnaar de cursor op dat moment wijst.


    Als de cursor niet naar een van de variabelen wijst, dan voordat u een grafiek uit het menu tekent: Snelle statistische grafieken u wordt gevraagd een variabele uit de lijst te selecteren. Bij het maken van dergelijke grafieken houdt STATISTICA rekening met de huidige selectievoorwaarden en case weights.

    Statistische plots blokkeren... Dit soort (aangepaste) grafieken worden opgeroepen vanuit de contextmenu-items Statistieken per kolom blokkeren en Statistieken per rij blokkeren of vanuit een dialoogvenster Galerij van grafieken.

    Met beide opties kunt u een samenvattende statistische plot voor het geselecteerde blok plotten om waarden in rijen (Block Statistics by Rows) of in de kolommen van een tabel (Block Statistics by Columns) te vergelijken. Dit type grafieken is vergelijkbaar met die aangepaste grafieken, die de gegevens van het huidige blok van de tabel weergeven.

    Andere gespecialiseerde afbeeldingen... Naast de standaardset van snelle statistische grafieken, kunt u met sommige tabellen meer gespecialiseerde statistische grafieken maken (bijvoorbeeld tijdreeksen in de module Tijdreeksen, pictogrammen van regressieresiduen, evenals contourplots in de module Clusteranalyse). Zoals eerder vermeld, gespecialiseerde grafieken die niet zijn gekoppeld aan een specifieke tabel met resultaten, maar aan een specifieke methode voor gegevensanalyse (bijvoorbeeld grafieken van benaderende functies in de module Niet-lineaire schatting of gemiddelden in de module ANOVA), worden rechtstreeks vanuit het dialoogvenster met de analyseresultaten aangeroepen (dat wil zeggen, vanuit het venster met de uitvoerparameters van de gebruikte gegevensverwerkingsmethode).

    Een grafiek opstellen voor en na het plotten ervan... Alle wijzigingen aan de parameters van de grafiek in STATISTICA worden uitgevoerd vanuit het actieve grafische venster (nadat de grafiek op het scherm is weergegeven). In de regel is het logisch om eerst een grafiek te bouwen, de standaardwaarden van de parameters te accepteren en vervolgens verschillende wijzigingen aan te brengen. In het zeldzame geval dat het plotten echter te lang duurt (bij het maken van complexe samengestelde afbeeldingen of het verwerken van grote datasets), kunt u ingrijpen om de nodige aanpassingen te maken. U kunt het tekenen met een enkele toetsaanslag of muisklik overal op het scherm onderbreken en het tekenen hervatten nadat u de nodige wijzigingen hebt aangebracht.

    Er zijn twee hoofdmethoden voor het opzetten van een grafiek: aangepaste grafische objecten toevoegen en bewerken, en de structurele elementen van de grafiek wijzigen.

    Worden er verschillende afstemmingsmethoden toegepast op verschillende soorten grafieken?

    Nee. Ongeacht de methode voor het maken van het schema, u kunt alle mogelijkheden van het STATISTICA-systeem gebruiken om het te configureren en te wijzigen. U kunt aan elke grafiek een nieuwe grafiek toevoegen, deze combineren met een andere grafiek, er een gekoppeld of ingesloten object in plaatsen. Bovendien kan de grafiek op elke manier worden gewijzigd, erop worden getekend en kunnen verschillende methoden worden gebruikt om functies aan te passen. Dezelfde instellingsmethoden zijn beschikbaar bij het werken met grafieken die eerder zijn opgeslagen en aangeroepen vanaf een schijfbestand.

    Het opzetten van een statistische grafiek voor en na de constructie ervan. De sectie Een STATISTICA-grafiek aanpassen laat zien dat de meeste aanpassingsopties (honderden verschillende plotopties) direct na het plotten beschikbaar zijn. Om dit te doen, klikt u gewoon op een specifiek element van de grafiek of selecteert u het overeenkomstige item in de dialoogvensters Algemene opmaak of Plaatsing van het schema die worden aangeroepen vanuit het vervolgkeuzemenu Markup.

    De individuele parameters die de gegevensbron definiëren, moeten echter worden ingesteld voordat de grafiek wordt geplot, zoals variabelen, categorisatiemethode, labelwaarden, casenamen, aslabels. In dit voorbeeld moet u, voordat u de grafiek plot, variabelen en methoden, categorisaties selecteren en, indien nodig, de waarden van sommige parameters instellen met behulp van de knop Opties(die hier niet wordt gebruikt).

    Laten we nu teruggaan naar ons voorbeeld. Als u na het maken van de grafiek op een willekeurige plaats op de achtergrond van het grafische venster klikt, verschijnt er een dialoogvenster Algemene opmaak, waarin de parameters van de algemene lay-out van de grafiek worden aangepast.


    In dit venster kunt u het type grafiek wijzigen en de constructie van een kaart met lijnen op het niveau instellen (gebruik het veld Grafiektype:). Bovendien kunt u de parameter Aantal secties wijzigen van de standaardwaarde van 15 x15 bij 25 x 25 (deze parameter bepaalt de nauwkeurigheid van de kaart van de niveaulijnen):

    Klik na het aanbrengen van wijzigingen op Oke en je ziet een nieuwe grafiek:


    Weer terug naar het dialoogvenster Algemene opmaak en selecteer de waarde voor het contourlijntype Zone... Bovendien zullen we in de eerste drie regels van de titel van de grafiek controletekens plaatsen @F, @F en @F, om daar de vergelijkingen te schrijven van de benaderende kwadratische functie voor de eerste afhankelijkheid (het getal 1 in de plaats van de eerste parameter tussen vierkante haken) voor elk van de drie afzonderlijke grafieken (nummers 1,2 en 3 als de tweede parameter):

    Voor de snelste weergave en uitgebreide opmaak van functievergelijkingen is het beter om het dialoogvenster te gebruiken Opties die wordt aangeroepen vanuit het dialoogvenster Statistische grafieken. Klik op Oke en je ziet de gewijzigde grafiek:


    U kunt nu doorgaan met het verkennen van de verschillende manieren om uw planning aan te passen. De gemakkelijkste (en snelste) manier om de parameters van een element te wijzigen, is door erop te dubbelklikken met de muisknop. Bovendien kunt u met een enkele klik met de rechtermuisknop op dit object het bijbehorende contextmenu oproepen.

    Als u bijvoorbeeld met de rechtermuisknop op een van de assen van de plot klikt, wordt het onderstaande contextmenu weergegeven, met een keuze aan instellingsopties voor die as:


    Gebruik in de onderstaande grafiek de werkbalkknop om de verhoudingen van het grafische venster aan te passen, de status van de legenda te wijzigen van vast in zwevend en de legenda te bewerken, opnieuw te ordenen en te verplaatsen.


    Kunnen grafieken automatisch worden vernieuwd als het gegevensbestand verandert?

    Ja, dat kunnen ze. Alle grafieken behouden de koppelingen met de tabel van de brongegevens waarop ze zijn gebouwd. Tegelijkertijd, als de update niet handmatig plaatsvindt en de koppelingen niet worden geannuleerd, wordt de grafiek automatisch bijgewerkt wanneer de initiële gegevens veranderen. Er is een speciaal dialoogvenster voor het beheren van koppelingen Gegevensverbindingen en afbeeldingen. Het wordt aangeroepen vanuit het vervolgkeuzemenu Grafische afbeeldingen.


    Hier kunt u de automatische communicatiemodus instellen, wanneer de grafiek automatisch wordt bijgewerkt wanneer de gegevens waarop deze is gebouwd, veranderen. U kunt de modus ook instellen op Handmatig of de communicatie tijdelijk blokkeren. Bovendien kunt u de koppelingsmodus instellen op het huidige gegevensbestand en dezelfde grafiek of reeks grafieken plotten voor andere gegevensbestanden. De communicatiemethode kan globaal worden gewijzigd met behulp van de vervolgkeuzemenuopdracht Onderhoud.

    STATISTICA ondersteunt ook geneste koppelingen met andere applicaties. U kunt bijvoorbeeld een grafiek koppelen aan gegevens in een Excel 5-spreadsheet met behulp van Dynamic Data Exchange (DDE). Wanneer u op de F9-toets drukt om een ​​Excel-tabel opnieuw te berekenen, worden zowel de gegevens in deze tabel als de bijbehorende grafiek in het STATISTICA-systeem automatisch bijgewerkt. Zie ook de volgende twee punten.

    Grafisch formaat STATISTICA. Grafieken en cijfers kunnen worden opgeslagen in het grafische formaat STATISTICA in een bestand met de extensie * .stg. Gebruik hiervoor de commando's Opslaan en Opslaan als..... uit het vervolgkeuzemenu Bestand... Dit formaat wordt aanbevolen voor het schrijven van een grafisch bestand als u van plan bent het in de toekomst opnieuw te openen in het STATISTICA-systeem of het aan andere toepassingen te koppelen met behulp van OLE-methoden. In tegenstelling tot andere grafische formaten, slaat het STATISTICA-formaat niet alleen de afbeelding zelf op, maar ook de Graph Data Editor met alle gegevens die in de grafiek worden gepresenteerd, alle analytische parameters (passende vergelijkingen, ellipsen, enz.), evenals andere parameters die het mogelijk maken u om vervolgens de analyse van grafische gegevens voort te zetten ... Dit formaat is vooral handig bij het koppelen of insluiten van een schema in een ander STATISTICA-schema. Bestanden die in dit grafische formaat zijn opgeslagen, kunnen in batchmodus worden afgedrukt met het commando Bestanden afdrukken uit het vervolgkeuzemenu Bestand.

    STATISTICA Commandotaal (SCL)

    STATISTICA bevat twee ingebouwde programmeertalen STATISTICA BASIC en SCL (opdrachttaal). Beide talen zijn ontworpen om te werken in de STATISTICA-omgeving en bevatten ingebouwde bewerkingen voor toegang tot brongegevenstabellen, resultaattabellen en grafische functies.

    STATISTICA BASIC is een eenvoudige maar krachtige programmeertaal. Met zijn hulp kunt u een breed scala aan toepassingen maken, variërend van eenvoudige gegevensconversieprogramma's tot complexe gebruikersprocedures voor complexe analyse en informatie-output.

    Deze programmeertaal is geschikt voor het oplossen van grote rekenproblemen, aangezien de verwerkte data-arrays tot 8 dimensies kunnen hebben en er geen beperkingen zijn aan de grootte van de arrays. De gebruiker kan dus al het beschikbare geheugen gebruiken en procedures maken met bewerkingen op grote multidimensionale matrices.

    De ingebouwde STATISTICA BASIC-taal is op elk moment in de analyse beschikbaar, samen met een geïntegreerde omgeving waarmee u programma's kunt schrijven, bewerken, testen, debuggen (pre-run) en uitvoeren.

    De STATISTICA BASIC-taal ondersteunt, net als een normale programmeertaal, circulaire bewerkingen en voorwaardelijke sprongen, functies en subroutines, evenals het werken met dynamische bibliotheken (DLL's). Tegelijkertijd "begrijpt" het de structuur van de gegevensbestanden van het STATISTICA-systeem en stelt het u in staat om interactieve gegevensverwerking in de omgeving van het systeem zelf te organiseren met behulp van aangepaste dialoogvensters. Met behulp van deze taal kan de gebruiker zijn eigen complexe programma's voor gegevensanalyse maken, terwijl hij tegelijkertijd de kant-en-klare berekenings- en grafische algoritmen van het STATISTICA-systeem gebruikt.

    De commandotaal SCL (STATISTICA Command Language) is bedoeld voor het organiseren van batchgegevensverwerking en het maken van uw eigen applicaties op basis van de procedures in het STATISTICA-systeem. Om de gebruiker in staat te stellen zijn eigen berekeningsalgoritmen te implementeren, is er de mogelijkheid om de STATISTICA BASIC- en SCL-talen te integreren.

    Programma's die zijn geschreven in de ingebouwde talen van het STATISTICA-systeem zijn beschikbaar in elke module van het systeem en in elk stadium van gegevensanalyse, terwijl ze zowel met de autotask-knoppen als rechtstreeks vanuit het bewerkingsvenster kunnen worden opgeroepen en uitgevoerd. De gebruiker heeft ook de mogelijkheid om zijn eigen bibliotheken met functies en subroutines te creëren en zo de voorgestelde reeks procedures voor gegevensverwerking en presentatie van resultaten aanzienlijk uit te breiden.

    Invoeren en uitvoeren van SCL programma's. STATISTICA kan in "echte" batchmodus werken als een commandogestuurd systeem met behulp van de ingebouwde SCL (STATISTICA Command Language), beschikbaar in elke systeemmodule vanuit het vervolgkeuzemenu Analyse. U kunt een reeks opdrachten invoeren om specifieke acties uit te voeren en deze vervolgens zo vaak als u wilt in batchmodus uitvoeren.

    Een andere manier van handelen is mogelijk - met behulp van een dialoogvenster Commando meester om snel de vereiste lijst met opdrachten te selecteren en in te voeren.


    Het SCL-framework wordt gebruikt om commandopakketten te schrijven en te debuggen. Het bevat een teksteditor in combinatie met een venster Commando meester(zie afbeelding hierboven - knop) Commando meester op de werkbalk Bevelstaal), taalsyntaxis-helpsysteem met voorbeelden en geïntegreerde programmavalidatietools (beschikbaar via het vervolgkeuzemenu Onderhoud).

    SCL aangepaste extensies... SCL-programma's kunnen niet alleen vooraf gedefinieerde parameters en opdrachten bevatten voor het uitvoeren van aggregatie-, controle- en grafische gegevensuitvoeracties (zie knoppen Hulp: Voorbeelden en Help: syntaxis op de werkbalk), maar ook aangepaste "commando's" gedefinieerd met de tool Toetsen toewijzen (Verzendsleutels)(in overeenstemming met de regels die zijn aangenomen in MS Visual BASIC).

    Programma's die op deze manier zijn geschreven, kunnen bijvoorbeeld bewerkingen uitvoeren met het klembord (Kopiëren plakken), verander de standaard uitgangsparameters in verschillende procedures en voer andere functies uit.

    SCL-programma's kunnen ook programma's en procedures bevatten die zijn geschreven in STATISTICA BASIC (STATISTICA-taal voor het transformeren en manipuleren van gegevens en grafieken, die beschikbaar is vanuit elke module van het pakket). Door de gebruiker gedefinieerde grafische of rekenkundige procedures in STATISTIС A B ASIC kunnen bijvoorbeeld worden uitgevoerd als onderdeel van het SCL-opdrachtpakket.

    Interactieve gebruikersinterface voor SCL-programma's. Ondanks het feit dat de SCL-opdrachttaal niet direct een speciale gebruikersinterface bevat, kunt u voor deze doeleinden toch STATISTICA BASIC-programma's gebruiken die worden aangeroepen vanuit SCL-nprograms, bijvoorbeeld om dialoogvensters te maken waarmee u variabelen kunt selecteren, bestanden gegevens, enz., terwijl het programma draait (zie voorbeelden in de Online Handleiding).

    Uitvoerbare module STATISTICA... De opdrachttaal bevat een speciale Executable-module waarmee u kant-en-klare toepassingen kunt ontwikkelen die worden aangeroepen door te dubbelklikken op het pictogram van de bijbehorende "aangepaste toepassing" op het Windows-bureaublad.

    Deze functie bespaart de gebruiker tijd wanneer dezelfde procedure of reeks analyseprocedures vele malen wordt herhaald, en maakt het ook mogelijk om SCL-programma's te gebruiken door gebruikers die niet bekend zijn met de conventies van het STATISTICA-systeem.


    Om zo'n kant-en-klare toepassing te maken, moet u eerst het SCL-programma zelf schrijven en op de gebruikelijke manier opslaan (bijvoorbeeld in het programma 1.sct-bestand). Vervolgens moet u in het Windows Programmabeheer-venster een pictogram maken voor de uitvoerbare module met de naam Sta_run.exe (deze bevindt zich in de STATISTICA-map op de schijf).

    In het opdrachtveld moet u de naam van het uit te voeren SCL-programma opgeven (bijvoorbeeld d: \ data \ programma1.scl "). Als u nu op dit pictogram klikt, wordt het programma uitgevoerd (in dit geval, Program1.se!), maak een willekeurig aantal aangepaste toepassingen en gebruik het venster Programmabeheer om ze betekenisvolle namen te geven die overeenkomen met de gegevensanalysetaken die deze toepassingen uitvoeren.

    Autotask-knoppen

    De autotask-knoppen zijn een pop-up aanpasbare werkbalk (u kunt deze in- of uitschakelen door op CTRL + M te drukken).


    De knoppen op deze werkbalk kunnen worden toegewezen / opnieuw gedefinieerd met behulp van de knop Maatwerk... (of op de overeenkomstige knop drukken terwijl u de CTRL-toets ingedrukt houdt). In het dialoogvenster dat wordt geopend, kunt u namen toewijzen aan bestaande en nieuwe knoppen.

    Laten we verder gaan met een meer systematische presentatie.

    Vaak wordt het bij het uitvoeren van een complexe taak nodig om dezelfde reeks acties uit te voeren, bijvoorbeeld het openen van eerder opgeslagen grafieken, gegevens of programmalijsten. De constante behoefte om activiteiten uit te voeren die niet relevant zijn voor de hoofdtaak, kan tijdrovend of zelfs vervelend zijn. Het STATISTICA-systeem biedt functies die de gebruiker behoeden voor eentonige handelingen en bijdragen aan het creëren van een comfortabele werkomgeving.

    De autotask-knoppen zijn een aanpasbaar paneel dat u, indien nodig, gemakkelijk van het scherm kunt verbergen of opnieuw kunt herstellen (u kunt dit paneel herstellen of verbergen met de toetsencombinatie CTRL + M). Op het paneel Autotask-knoppen druk op de knop Instelling ... Er wordt een venster geopend voor het configureren van autotask-knoppen. In het centrale deel van het venster bevindt zich een kolom met knoppen waarmee u:

    • Wijzig of stel een knop in. Door op deze knop te klikken, kunt u de volgorde van toetsaanslagen op het toetsenbord instellen. Om zo'n reeks te organiseren, drukt u gewoon op de knop Opnemen aan de rechterkant van het dialoogvenster. Vanaf dit moment begint het systeem automatisch uw acties te onthouden en te vertalen naar de commandotaal. Door bijvoorbeeld de Alt-toets op het toetsenbord in te drukken, komt u in het hoofdmenu, waar u met de pijltjes en de Enter-toets kunt navigeren. Met de Tab-toets kunt u vrij bewegen in dialoogvensters, enz. Druk op CTRL + F3 om de opname te beëindigen. Onderaan het venster Knoppen voor automatische taken configureren de knoppen voor het navigeren door de vensters en hun bijbehorende syntaxis zullen worden beschreven.
    • Knop verwijderen. U kunt op elk moment de knop verwijderen die u niet meer nodig heeft. Specificeer een reeks functies of bewerkingen in de STATISTICA Command Language (SCL).
    • Gebruik procedures die zijn geschreven in de STATISTICA BASIC-taal van computationele aard, gegevenstransformaties, bewerkingen voor gegevensmanipulatie, grafische procedures, evenals procedures die zijn geschreven in een andere programmeertaal die vanuit STATISTICA BASIC wordt genoemd.
    • Open gegevensbestanden en eventuele ondersteunende bestanden van het STATISTICA-systeem.
    • Maak en bewerk macro's (reeksen toetsaanslagen) die overeenkomen met vaak uitgevoerde procedures, taken of instellingen. Dergelijke bewerkbare commando's kunnen in tekstvorm worden ingevoerd of bijvoorbeeld als reeksen muisbewegingen.

    Elk van de hierboven beschreven vensters biedt de mogelijkheid om sneltoetsen te maken. U kunt een combinatie van de CTRL-toets en een willekeurige letter van A tot Z of cijfers van 0 tot 9 toewijzen. Na het opslaan van deze instelling hoeft u slechts een bepaalde combinatie van toetsen in te drukken, wat gelijk staat aan het indrukken van de autotask-knop.

    De werkbalk kan globaal of lokaal zijn en grote bibliotheken met aangepaste taken en procedures bevatten. De lokale werkbalk is gekoppeld aan een specifieke module of project. De naam van het momenteel geopende paneel wordt gemarkeerd in de titelbalk van het dialoogvenster.

    Aangepaste werkbalk Autotask-knoppen kan vervolgens worden opgeslagen met behulp van de opdrachten in het dialoogvenster Maatwerk....


    Werkbalk Autotask-knoppen kan worden gebruikt als een gebruiksvriendelijke interface voor aangepaste uitbreidingen van standaardprocedures.

    De grootte van de werkbalken kan worden gewijzigd met de muis:

    Het paneel kan worden vergrendeld door het naar de rand van het STATISTICA-toepassingsvenster te verplaatsen, zoals weergegeven in de volgende afbeelding.


    Zoals opgemerkt, zijn de werkbalkknoppen Autotask-knoppen kan worden aangepast of opnieuw worden toegewezen in het dialoogvenster Knoppen voor automatische taken configureren(die opent met de knop) Maatwerk... op de werkbalk). Bovendien kunnen individuele knoppen direct in het bijbehorende instellingenvenster worden bewerkt en/of opnieuw worden toegewezen; om dit te doen, moet je met de muis op deze knop klikken terwijl je de CTRL-toets ingedrukt houdt


    Dit opent een venster voor het instellen van deze specifieke knop.

    Door het laatste item van het contextmenu te selecteren dat verschijnt wanneer u ergens op de werkbalk met de rechtermuisknop klikt, kunt u snel schakelen tussen verschillende vooraf opgeslagen werkbalken Autotask-knoppen.


    Een blik in de toekomst

    STATISTICA evolueert voortdurend en opent nieuwe mogelijkheden voor gebruikers. Kortom, de ontwikkeling van het systeem vindt plaats in de geest van de ontwikkeling van moderne Windows-technologieën. Flexibel maatwerk voor specifieke projecttaken, een breed scala aan statistische opties beschikbaar voor de gebruiker vanuit andere applicaties, wereldwijde integratie met andere applicaties, bijvoorbeeld met behulp van VB, C++, Java, optimalisatie voor web- en multimediatoepassingen - de directe vooruitzichten van STATISTICA. Het wordt mogelijk om verschillende objecten in tabellen met gegevens (multimedia-spreadsheets) in te bedden: geluid, foto, enz.

    Eerste stappen in het STATISTICA-systeem

    Onze kennismaking met het STATISTICA-systeem moet natuurlijk beginnen met het invoeren van gegevens. U zult zien hoe gemakkelijk het is om een ​​grote verscheidenheid aan gegevens in STATISTICA in te voeren. Er wordt aangenomen dat het STATISTICA-systeem op uw computer is geïnstalleerd en dat u de stappen die achtereenvolgens worden beschreven, herhaalt.

    Laten we een medisch voorbeeld nemen als een specifiek gebied.

    Zoals u al weet, zijn de brongegevens in het STATISTICA-systeem georganiseerd in de vorm van tabellen. Als je ervaring hebt met spreadsheets (zoals MS Excel), raak je snel gewend aan STATISTICA-spreadsheets. Merk op dat de STATISTICA-gegevensstructuur in tabelvorm u in staat stelt de meeste echte gegevens op een natuurlijke manier weer te geven.

    Een spreadsheet bestaat uit rijen en kolommen. De kolommen van de STATISTICA-tabel heten Variabelen - Variabelen en de lijnen Cases - Observaties.

    In de geneeskunde zijn observaties bijvoorbeeld patiënten, variabelen zijn geslacht, leeftijd, datum van opname in het ziekenhuis, datum van diagnose, datum van operatie, overplaatsing naar een ander ziekenhuis, ontslag, enz. Je kunt zo'n tabel zien als een pagina van een doktersschrift, waarbij de regels bijvoorbeeld de namen van patiënten zijn, kolommen kenmerken (variabelen die het verloop van de ziekte beschrijven).

    Ga als volgt te werk om een ​​tabel met gegevens te maken:

    1. Start het STATISTICA-programma.

    2. Er wordt een menu geopend Statistische modules(STATISTICA-moduleschakelaar).

    3. Selecteer een module uit het menu en klik erop.

    4. Je bent nu in de module Basisstatistieken en tabellen, waarin u een willekeurige statistische procedure kunt kiezen die in deze module is opgenomen. Maar aangezien je een ander doel hebt, klik je gewoon op de knop Uitgang:(Annuleren).

    U bevindt zich dus in het werkvenster van de module Basisstatistieken en tabellen STATISTICA systemen. Verplaats in het hoofdwerkvenster van het systeem de muiscursor naar de menubalk Bestand en klik met de linkermuisknop. Selecteer in het vervolgkeuzemenu de opdracht Gegevens aanmaken. Er verschijnt onmiddellijk een venster op het computerscherm. Gegevenscreatie(zie onderstaande figuur).

    In dit venster kunt u de naam van het bestand invoeren, bijvoorbeeld medicijn 1 .sta (het bestand kan ook in het Russisch worden genoemd, maar om een ​​aantal redenen is het handiger om Engelse namen te gebruiken).

    Plaats nu uw muiscursor in het veld Bestandsnaam - Naam bestand en typ de gewenste naam in vanaf het toetsenbord.


    Na het indrukken van de toets Binnenkomen op het toetsenbord of de knoppen Opslaan het programma maakt een lege tabel met 10 rijen en 10 kolommen.


    U kunt in deze tabel eenvoudig zowel het aantal rijen als het aantal kolommen vergroten of verkleinen. Maak zoveel rijen en kolommen in de tabel als nodig is. Gebruik hiervoor de knoppen op de werkbalk.

    Klik bijvoorbeeld op de knop Observaties... Na het indrukken van de knop verschijnt een menu op het scherm met de volgende keuze voor tafelobservaties: Toevoegen, Verplaatsen, Kopiëren, Verwijderen, Zaaknamen invoeren... Selecteer bijvoorbeeld item Toevoegen door te dubbelklikken op de linkermuisknop. Er wordt een venster geopend waarin u het aantal gevallen kunt instellen dat aan de tabel moet worden toegevoegd:

    Klik op Oke, en het aantal rijen (gevallen) in de tabel zal met 2 toenemen, dat wil zeggen, het wordt gelijk aan 12. Wijzig het aantal variabelen in de tabel op dezelfde manier. In dit geval zijn 11 variabelen nodig. Klik op de knop Variabelen op de werkbalk. Gebruik de muiscursor om het item in het vervolgkeuzemenu te selecteren Toevoegen... Er verschijnt een venster op het scherm waarin u de onderstaande instellingen kunt maken.

    Druk nogmaals op de knop Observaties en selecteer het menu-item Namen... Er verschijnt een dialoogvenster op het scherm waarin u kunt definiëren hoeveel tekens in de tabel worden gereserveerd voor casenamen. U kunt het veld voor zaaknamen ook uitbreiden met de muis.

    Je hebt dus de eerste stap gezet om je doel te bereiken - je hebt een spreadsheet gemaakt met 11 kolommen en 12 rijen, evenals een plaats om de namen van zaken in te voeren (zie afbeelding).


    Nu moet je de naam van de tabel (de titel) en de namen van de variabelen invoeren. Je werkt met muis en toetsenbord. Onthoud het basisprincipe: door te dubbelklikken op koptekstvelden opent u dialoogvensters waarin u titels kunt invoeren, variabelen kunt beschrijven, enz. Voer een tabeltitel in. Dubbelklik hiervoor op de bovenste regel van de tabel, de lege regel boven de variabelen. Voer in het venster dat verschijnt de tabeltitel in.


    Typ een titel vanaf het toetsenbord, druk op Oke... De ingevoerde tekst verschijnt in de tabelkop. In veld Bestandsinformatie en notities u kunt aanvullende informatie opschrijven die handig is bij het werken met het bestand.

    De namen van variabelen en gevallen worden op dezelfde manier bewerkt. Als u bijvoorbeeld namen wilt invoeren, moet u dubbelklikken in het veld Observatie naam en voer in het venster dat verschijnt de namen van de patiënten in:

    Om een ​​variabele te beschrijven, moet u dubbelklikken op de naam - bijvoorbeeld nadat u op de titel hebt geklikt variabele1 (VAR1), wordt een venster geopend waarin u de naam kunt instellen (of hernoemen), het variabele formaat, label, link, enz.

    Vul nu de gemaakte tabel met gegevens. Gegevens worden rechtstreeks vanaf het toetsenbord ingevoerd. Exportmogelijkheden naar bijvoorbeeld MS Word komen we later nog tegen. Als u numerieke gegevens moet invoeren, gebruikt u het toetsenbord en de pijltoetsen om de cursor te verplaatsen. Plaats de cursor op de gewenste cel in de tabel en voer numerieke gegevens in. Tekstwaarden worden anders ingevuld. Verplaats de cursor naar de variabele cel met tekstwaarden en dubbelklik. De code 9999 verschijnt in de cel - dit is de code van de ontbrekende waarden. Wis de code met de DEL-toets op je toetsenbord. Voer vervolgens de gewenste tekstwaarde in. Als resultaat kunt u de volgende tabel krijgen:


    U hebt dus geleerd hoe u tabellen maakt en er gegevens in invoert. Door de beschreven acties meerdere keren te herhalen met andere gegevens, consolideert u de verworven vaardigheden stevig.

    Aangezien het STATISTICA-systeem een ​​normale Windows-toepassing is, kunt u de in het STATISTICA-systeem verkregen gegevens snel en eenvoudig importeren in een andere Windows-toepassing, zoals MS Word.

    De beste manier om dit te doen is als volgt: druk tegelijkertijd op de ALT- en F3-knoppen. In plaats van de muiscursor verschijnt het "zicht"-pictogram op het scherm. Plaats met de muis het dradenkruis in de linkerbovenhoek van de tafel. Druk vervolgens op de linkermuisknop, fixeer het dradenkruis en verplaats het dradenkruis, terwijl u de muisknop ingedrukt houdt, naar een nieuwe plaats in de tabel. Het geselecteerde deel van de tafel wordt gemarkeerd met een rechthoekig frame. Nadat u de muisknop loslaat, wordt het gemarkeerde deel van de tabel op het klembord geplaatst. Als u nu het gewenste Word-document opent en een combinatie van de CTRL- en V-knoppen op het toetsenbord typt, wordt het geselecteerde segment van de tabel in het document gekopieerd.

    Opmerkingen. Je werkte in een module Basisstatistieken en tabellen, op dezelfde manier kunt u gegevens invoeren in elke module van het STATISTICA-systeem. In termen van algemene gegevensbeheermogelijkheden zijn de modules van het systeem hetzelfde.

    Het STATISTICA-systeem heeft een speciale module Gegevensbeheer(Gegevensbeheer), dat geavanceerde functies bevat waarmee u snel een spreadsheet kunt maken, twee tabellen kunt samenvoegen, een deel van de tabel kunt uitknippen, gevallen kunt sorteren op elk criterium: bijvoorbeeld de namen van patiënten in alfabetische volgorde rangschikken of ze op leeftijd rangschikken , enz. (zie onderstaande afbeelding).

    De oefening. Sorteer de medicinel.sta-gegevens op leeftijd en stad van de patiënt. Gebruik de module Gegevensbeheer en optie Observaties sorteren.

    Nog een voorbeeld

    Start de module vanuit de STATISTICA-modulekiezer Basisstatistieken en tabellen. Selecteer hiervoor de module Basisstatistieken en tabellen in het menu en klik erop. De module wordt geselecteerd uit de lijst met modules. Beweeg vervolgens de muiscursor over de knop Overschakelen naar en klik erop. Het STATISTICA-systeem wordt gestart en het werkvenster van de module Basisstatistieken en tabellen verschijnt op het scherm. In deze module gaan we aan de slag.

    In de module Basisstatistieken en tabellen maak een gegevensbestand aan zoals weergegeven in de afbeelding.

    Het dossier bevat de resultaten van een enquête onder 10 vrouwen (gegevens zijn model) met betrekking tot hun burgerlijke staat en de mate van angst. Eerste variabele SEM_FLOOR beschrijft de burgerlijke staat van vrouwen. Deze variabele heeft twee waarden: P_familie- volledige familie, N_familie- onvolledig gezin. tweede variabele, ONGERUSTHEID, beschrijft de zelfgerapporteerde persoonlijke angst van een vrouw. Het heeft twee betekenissen: laag, hoog. Het is bekend dat persoonlijke angst wordt gekenmerkt door een aanhoudende neiging om een ​​levenssituatie als bedreigend (met een geheime dreiging) te ervaren. Je ziet dat de eerste geïnterviewde vrouw - observatie nummer 1 (de eerste regel in de tabel) - een compleet gezin heeft en haar gemoedstoestand kenmerkt als angstig. De tweede geïnterviewde vrouw - observatie nummer 2 (tweede regel van de tabel) - heeft een onvolledig gezin en schat het niveau van haar angst in als laag, enz.

    Noem dit bestand women1sta.

    Merk op dat de variabelen in dit bestand tekstwaarden aannemen, wat typisch is voor opiniepeilingen.

    Vraag advies om uw tekstinvoer efficiënter te organiseren. Variabelen nemen tekstwaarden aan en als u elke keer tekst in de tabel invoert, duurt het te lang. Voor het gemak zijn numerieke waarden beter en schakel vervolgens over naar de tekstmodus door op de knop op de werkbalk te klikken. Het is handig om de waarden van variabelen te coderen. Laten we laten zien hoe dit wordt gedaan. Laten we beginnen met een variabele SEM_POL. Dubbelklik met de linkermuisknop op de titel en er verschijnt een venster op het scherm Tekstwaardemanager - SEM_FLOOR.

    In dit venster, in de kolom Tekst typ in de eerste regel P_familie, en in de kolom Nummer type 1. Dit zal de tekstwaarde veroorzaken P_familie code 1 wordt toegewezen. Op de tweede regel Tekstwaardemanager bellen N_familie, en in de kolom Nummer type 2 - tekstwaarde N_familie code 2 wordt toegewezen en druk vervolgens op de knop Oke.


    Zet nu de waarden 1 in die variabele cellen SEM_FLOORP_familie.

    Voer de waarden 2 in die cellen van de variabele in SEM_FLOOR waar de tekstwaarde moet zijn N_familie.

    Nu is het voldoende om op de knop op de STATISTICA-werkbalk te klikken om de gewenste tekstwaarden te krijgen.

    Voer op dezelfde manier tekstwaarden in de variabele cel in ONGERUSTHEID

    Dus je hebt het bestand women1.sta gemaakt. Laten we nu een contingentietabel maken op basis van dit brongegevensbestand. Dit is heel eenvoudig te doen in STATISTICA.

    Stap 1 AnalyseStart paneel.

    U ziet de verschillende soorten analyses die in de module beschikbaar zijn. Selecteer analyse: Tabellen en koppen en druk op de knop Oke.

    Er verschijnt een venster op het scherm Definieer tabellen.

    Stap 2. Eerste in de rij Analyse selecteer T onvoorziene tabellen(optie is mogelijk) Tabellen met vlaggen en koppen).


    Stap 3. Druk dan op de knop Tafels dekken... Selecteer in het venster dat verschijnt de variabelen die in de tabel worden getabelleerd. Deze variabelen bepalen de indeling van de brongegevens in groepen, daarom worden ze vaak groeperingsvariabelen genoemd. In dit geval moet u de waarden van de variabelen in tabelvorm brengen SEM_FLOOR en ONGERUSTHEID.

    Selecteer ze daarom zoals weergegeven in de onderstaande afbeelding.


    Merk op dat er in totaal maximaal 6 lijsten met groeperingsvariabelen kunnen worden geselecteerd, wat het mogelijk maakt om extreem complexe tabellen te bouwen met veel meer variabelen dan in dit voorbeeld. Het zijn deze tabellen die vaak verschijnen tijdens massale enquêtes, en je moet ze kunnen bouwen.

    Druk na het selecteren van de variabelen op de knop Oke... U keert terug naar het dialoogvenster dat in de afbeelding wordt weergegeven. Merk op dat het venster een beetje is veranderd: het cijfer 1 verscheen naast het aantal tabellen, omdat u variabelen selecteerde en het systeem vroeg om één tabel te bouwen.

    Stap 4... Klik op Binnenkomen op het toetsenbord of de knop Oke

    Het systeem voert berekeningen uit en biedt aan om het resultaat in het venster te bekijken Kruistabelresultaten.


    Stap 5. In het raam Kruistabelresultaten druk op de knop Overzichtstabellen bekijken... De volgende onvoorziene tabel verschijnt op het scherm:

    U kunt zien dat variabelen in deze tabel zijn getabelleerd SEM_FLOOR en ONGERUSTHEID... Het snijpunt van rijen en kolommen is de absolute waarde berekend uit het originele womenl .sta-gegevensbestand.

    We hebben de waarden van twee variabelen samen getabelleerd, SEM_FLOOR en ONGERUSTHEID, en deze actie wordt vaak kruistabel genoemd (van het Engelse kruis - naar kruis).

    Uit de geconstrueerde tabel, in het jargon de contingentietabel genoemd, is te zien dat drie vrouwen een compleet gezin hebben en weinig angst, twee vrouwen een onvolledig gezin en weinig angst, enz. Als u geïnteresseerd bent in de afzonderlijke tabel van elke variabele, kijk naar de uiterst rechtse kolom en de onderste rij van de tabel. Je zult zien dat van de ondervraagde vrouwen vijf een compleet gezin hadden en vijf een incompleet gezin; vijf vrouwen hadden een hoge mate van angst (zie de uiterst rechtse kolom), vijf hadden een lage mate van angst (zie onderste rij).

    Vaak is het nodig om naast de absolute waarden ook percentages in de tabel op te geven. Met het STATISTICA-systeem kunt u de vereiste percentages selecteren: bijvoorbeeld alleen percentages op een rij, of percentages op een kolom, of percentages van het totaal, of beide.

    Kolompercentages zijn percentages berekend ten opzichte van de som van de frequenties in de kolom. Rijpercentage is het berekende percentage ten opzichte van het totaal van de rijfrequenties. Het percentage van het totaal wordt berekend ten opzichte van de som van de frequenties in de tabel. Laten we eens kijken hoe dit wordt gedaan.

    Je keert weer terug naar het venster Kruistabelresultaten.

    Stap 7... In het raam Kruistabelresultaten let op de opties aan de rechterkant, gecombineerd tot een groep Tafels.

    Selecteer bijvoorbeeld de optie Percentage van het totaal... Beweeg de muiscursor over het bijbehorende vierkant en klik. In het raam Kruistabelresultaten druk op de knop Overzichtstabellen bekijken... De volgende tabel verschijnt op het scherm:

    Hier verschenen naast de absolute waarden relatieve waarden - percentages berekend op basis van het totale aantal vrouwen, dat wil zeggen vanaf 10.

    Dus, uit de tabel kun je zien (controleer!) Dat:

    • 30% van de vrouwen heeft een volledig gezin en weinig angst (eerste cel van de tabel),
    • 20% van de vrouwen heeft een volledig gezin en een hoge mate van angst (tweede cel van de tabel),
    • 20% van de vrouwen heeft een alleenstaand gezin en weinig angst,
    • 30% van de vrouwen heeft een alleenstaand gezin en een hoge mate van angst.

    De geconstrueerde tabel kan worden bewerkt, het uiterlijk, de labels, enz. kunnen worden gewijzigd.

    Stap 8. Bewerken van de tabel.

    Dubbelklik bijvoorbeeld op het veld Totaal % in de geconstrueerde tafel. In het venster dat verschijnt Rijnaam resultaattabel in plaats van Totaal % binnenkomen %.

    Je krijgt een tabel zoals deze:

    Stap 9. Aparte tabellen maken met percentages.

    Ga terug naar het raam Kruistabelresultaten en let op de optie Toon geselecteerd% in aparte tabellen.

    Maak de volgende instellingen: selecteer optie Percentage van het totaal en optie Toon geselecteerd% in aparte tabellen. Druk dan op de knop


    U ziet twee tabellen, waarvan de ene alleen absolute waarden bevat en de andere percentages die zijn berekend op basis van het totale aantal respondenten.


    Stap 10. Een automatisch rapport maken.


    STATISTICA heeft een handige rapportagetool waarmee u al uw resultaten in rtf-formaat kunt presenteren; vervolgens kan het rapport naar de printer worden uitgevoerd, bewerkt en prachtig worden afgedrukt.

    Doe het volgende: ga naar het menu Beeld en selecteer de optie Tekst / uitvoervenster... Selecteer uit de geconstrueerde tabellen (ze bevinden zich in het werkvenster van het systeem) degene die u voor het rapport wilt opslaan. Klik erop met de muis. Ga opnieuw naar het menu Bestand en selecteer de optie Zegel... De gemarkeerde resultatentabel wordt afgedrukt.

    In dit venster kunt u bijvoorbeeld de tabel bewerken en voorbereiden in het formaat dat nodig is voor een onderzoeksrapport of artikel.


    Houd er rekening mee dat tijdens het werk nooit een programmeertaal is gebruikt, alle acties interactief zijn en dit is een groot voordeel van het STATISTICA-systeem. Het is net zo eenvoudig om erin te werken als bijvoorbeeld in de teksteditor MS Word. Tot slot krijgt u een oefening aangeboden die de verworven vaardigheden zal consolideren.

    Voorbeeld. Maak een bestand women2.sta in STATISTICA. Er worden meer realistische schalen gebruikt om de variabelewaarden te schalen. De burgerlijke staatsschaal van een vrouw: alleenstaand, incompleet gezin, compleet gezin. Angstschaal voor vrouwen: laag, matig, hoog.

    Grafische analyse van noodtabellen

    Met kruistabellen kunt u gegevens compact beschrijven. Ze zijn handig en vereisen een minimum aan opmerkingen, daarom zijn ze populair bij artsen, sociologen en marketeers. Zelfs de meest complexe contingentietabellen zijn zeer eenvoudig in te bouwen in het STATISTICA-systeem.

    Hier zullen we kijken hoe we de geconstrueerde tabellen kunnen visualiseren, dat wil zeggen, we zullen kennis maken met de STATISTICA-tools waarmee u tabellen grafisch kunt analyseren. Visueel is het veel gemakkelijker om de patronen in de tabellen te zien. De voorbeelden gebruiken een kleine hoeveelheid gegevens zodat u de basistechnieken duidelijk kunt weergeven. Stel je voor in wat voor een lastige situatie je je bevindt als je te maken hebt met enorme tafels, en het zijn deze tafels die in de praktijk ontstaan. "Volg ons!" - blijft nog steeds ons hoofdmotto.

    Het STATISTICA-systeem draait dus op de computer, u werkt in de module Basisstatistieken en tabellen (in de Engelse versie van STATISTICA heet de module Basisstatistieken en tabellen Basisstatistieken en tabellen ").

    Voorbeeld (vervolg)

    Het women1.sta-gegevensbestand waarmee u werkt, is geopend in het werkvenster. Bedenk dat dit bestand de resultaten bevat van een enquête onder 10 vrouwen (gegevens zijn model) met betrekking tot hun burgerlijke staat en mate van angst.

    Eerste variabele CEM_ПOJI- de burgerlijke staat van vrouwen. Deze variabele heeft twee waarden: P_familie- volledige familie, N_familie- onvolledig gezin.

    Tweede variabele ONGERUSTHEID- zelfbeoordeling van de persoonlijke angst van een vrouw. Het heeft twee betekenissen: laag, hoog. Het is bekend dat persoonlijke angst wordt gekenmerkt door een stabiele persoonlijkheidsneiging om een ​​levenssituatie als bedreigend te ervaren. In dit vereenvoudigde voorbeeld hebben we twee graden van angst gebruikt: laag en hoog.

    Je ziet dat de eerste geïnterviewde vrouw - observatie nummer 1 (de eerste regel in de tabel) - een compleet gezin heeft en haar toestand als zorgwekkend omschrijft. De tweede geïnterviewde vrouw - observatie nummer 2 (tweede regel van de tabel) - heeft een onvolledig gezin en schat het niveau van angst in als laag, enz.

    Stap 1. Verplaats de muiscursor naar het item Analyse. Klik erop met de muis. Maak in het menu dat verschijnt een keuze: Startpaneel.

    Selecteer analyse: Tabellen en koppen en druk op de knop Oke.

    Gebruik de opties van het venster voor het specificeren van de tabel, tabelleer de variabelen SEM_FLOOR en ONGERUSTHEID.


    Stap 2. Nadat het systeem de tafel heeft opgebouwd, kijk je goed naar het raam Kruistabelresultaten.

    Let op de knoppen in de rechter benedenhoek van het dialoogvenster Kruistabelresultaten.


    Stap 3... In het dialoogvenster Kruistabelresultaten druk op de knop Gecategoriseerde histogrammen:


    De betekenis van deze histogrammen is als volgt: de geïnterviewde vrouwen zijn verdeeld in twee groepen (categorieën): vrouwen uit een compleet gezin en vrouwen uit een incompleet gezin. Een typisch histogram voor deze variabelen ziet er als volgt uit:

    Hier kunt u duidelijk zien wat het verschil is tussen gecategoriseerde histogrammen en reguliere histogrammen. Op een regulier histogram is het aantal vrouwen met hoge en lage angst hetzelfde. Op het gecategoriseerde histogram is het aantal vrouwen met een hoge mate van angst in eenoudergezinnen hoger dan in volledige gezinnen. Het angstniveau van vrouwen in eenoudergezinnen is lager dan het angstniveau in eenoudergezinnen.

    Vervolg van het voorbeeld

    Denk aan het databestand women2.sta. Om de waarden van de variabelen te schalen, hebben we meer realistische schalen gebruikt: alleenstaande vrouw, eenoudergezin, compleet gezin. Angstschaal voor vrouwen: laag, matig, hoog.

    Stap 1... Beweeg de muiscursor over het item Analyse... Klik erop met de muis. Maak in het menu dat verschijnt een keuze: Start paneel.

    Selecteer alstublieft Tabellen en koppen en druk op de knop Oke.

    Stap 2. In lijn Analyse Kiezen Tafels vervoeging (optie Tabellen met vlaggen en koppen).


    Druk dan op de knop Tafels dekken... Selecteer in het venster dat verschijnt de variabelen die in de tabel zullen worden getabelleerd (zie hierboven voor details). In dit geval is het noodzakelijk om de waarden van de variabelen in tabelvorm te brengen SEM_FLOOR en ONGERUSTHEID.

    Klik op de knop Codes en selecteer de codes (waarden) van de getabelleerde kwaliteitsattributen. In dit voorbeeld is het aantal variabele waarden toegenomen doordat er een nauwkeuriger meetschaal wordt gebruikt.

    Als u wilt dat alle variabelewaarden worden getabelleerd, klikt u op de knop Kies ze allemaal in de rechter benedenhoek.


    Merk op dat elke set codes in het algemeen kan worden geselecteerd. Variabele codes kunnen worden bekeken door op de knop te klikken Info.

    Bijvoorbeeld, de variabele SEM_FLOOR neemt de volgende waarden aan:

    Stap 3... Klik op Binnenkomen op het toetsenbord of de knop Oke in de rechterbovenhoek van het dialoogvenster.

    STATISTICA voert berekeningen uit, tabelleert gegevens en presenteert het resultaat in een venster Kruistabelresultaten(zie figuur).


    Stap 4... In het raam Kruistabelresultaten druk op de knop Overzichtstabellen bekijken. Er verschijnt een tabel op het scherm:



    De betekenis van de histogrammen is als volgt: vrouwen zijn onderverdeeld in 3 groepen of categorieën: vrouwen uit een compleet gezin, vrouwen uit een onvolledig gezin, alleenstaande vrouwen (vergelijk met het vorige voorbeeld). Voor elke groep wordt een apart histogram gemaakt en al deze histogrammen worden verzameld in één grafiek, waardoor u de groepen visueel kunt vergelijken.

    Stap 6. In het dialoogvenster Kruistabelresultaten druk op de knop 3M histogrammen.

    Er verschijnt een 3D-histogram op het scherm.


    De betekenis van dit histogram is als volgt: er worden allerlei combinaties van waarden van twee variabelen samengesteld: burgerlijke staat en mate van angst, en er wordt berekend hoe vaak elke combinatie voorkomt.

    Het driedimensionale histogram geeft de kruistabel zeer duidelijk weer. Je zet de tabel op een vlak en zet in elke cel een kolom waarvan de hoogte gelijk is aan het aantal waarnemingen in de cel van de tabel.

    Als u niet tevreden bent met de weergave van het geconstrueerde driedimensionale histogram, kunt u dit wijzigen met behulp van de systeemtools. STATISTICA biedt een geweldige grafiektool. Ze kunnen bijvoorbeeld worden gedraaid.

    Klik op de knop Rotatie bevindt zich op de werkbalk.

    Op het scherm verschijnt een venster waarin u kunt draaien en het gewenste perspectief kunt selecteren.

    Gebruik de schuifbalk om de grafiek te roteren. Experimenteer er een beetje mee. Gebruik bijvoorbeeld eerst de muis om de schuifcursor helemaal naar links te verplaatsen. U krijgt de volgende afbeelding te zien:

    Verplaats nu de scroll-cursor naar rechts:

    Elke keer dat de cursor beweegt, roteert de grafiek. Kies de optie die bij je past. Klik op de knop Oke... De gewenste grafiek verschijnt op het scherm.

    Stap 7. Frequentie-interacties plotten. In het raam Kruistabelresultaten druk op de knop Frequentie interactie verkeer... Er verschijnt een grafiek van interacties op het scherm:


    De betekenis van deze grafiek is eenvoudig: hij laat zien hoe de frequenties van waarnemingen van verschillende groepen op elkaar inwerken of zich tot elkaar verhouden.

    Alle uitgezette grafieken laten zien dat vrouwen uit verschillende families verschillen in de mate van angst. Statistische tests laten zien of dit verschil significant is.