Care este diferența dintre informații și date? Concepte de informaţie date de diverse ştiinţe

Chiar la începutul acestui capitol, este necesar să se sublinieze diferențele dintre conceptele de date și informații. Există o diferență între ele și una destul de semnificativă. Conform teoriei informației, datele ar trebui înțelese ca toate acele informații care sunt colectate și, cel mai important, supuse unei prelucrări speciale pentru a extrage din acestea (inclusiv prin calcule) doar acele informații care vor fi necesare și utile pentru rezolvarea unei anumite probleme. . sarcină specifică. Aceste date prelucrate vor constitui informații. Și informația brută se numește de obicei date. Astfel - o astfel de analogie este destul de potrivită aici - datele pot fi asemănate cu un fel de minereu, iar informațiile - extrase din el substanțe utile. Datele sunt întotdeauna asociate cu un exces de informații, în timp ce informațiile sunt întotdeauna asociate cu suficiența necesară. Informația, cu alte cuvinte, este ceea ce contribuie la creșterea cunoașterii, poartă întotdeauna pecetea noutății și reprezintă informații noi. Dar dacă ne concentrăm pe cercetarea de piață, informația nu este orice informație nouă. În cele din urmă, este vorba de informații noi care sunt percepute și evaluate de serviciile relevante (specialiști) pentru a efectua acțiuni profesionale specifice.

Transferul de date și apariția informațiilor

Numeroase transformări ale datelor pe calea transformării lor în informaţie pot fi urmărite după schema propusă de profesorul E.G. Yasin (Fig. 5.1).

Conform acestei scheme, o parte din datele pe drumul către destinatar se pierd inițial în canalele fizice ale transmisiei sale sub forma așa-numitului zgomot fizic (de exemplu, atunci când se efectuează un sondaj în cercetarea de marketing, unele chestionare s-au transformat să fie completate incorect și să fie eliminate de la procesarea ulterioară). Este posibil ca datele care ajung la destinatar (primite) să nu fie toate înțelese și acceptate de acesta din cauza, de exemplu, nivel insuficient cunoştinţe. Datele neînțelese și nepercepute trec prin conștiința destinatarului sub formă de zgomot semantic. Și, în sfârșit, unele dintre datele percepute de destinatar pot fi pur și simplu ignorate din cauza faptului că se dovedesc a fi redundante sau pur și simplu nepotrivite sarcinilor în curs de rezolvare. Sub formă de zgomot pragmatic, această parte a mesajului trece și prin conștiința destinatarului. Partea rămasă a datelor reprezintă informațiile reale care pot fi utilizate în rezolvarea problemelor practice. Este clar că în etapa de evaluare, conform schemei lui Yasin, are loc prelucrarea datelor, sunt efectuate procedurile de calcul necesare, comparațiile etc.

În practică, conceptele date și informații sunt adesea identificate între ele, de exemplu. înlocuiți unul cu celălalt, ceea ce nu contribuie la îmbunătățirea înțelegerii reciproce între, să zicem, cercetătorii de piață și clienții unor astfel de cercetări atunci când încheie contracte între aceștia pentru a efectua cercetări de marketing. Dar uneori astfel de identificări sunt destul de acceptabile. În această carte, conceptul de informație va fi folosit mult mai des decât conceptul de date, deși uneori autorul va folosi și conceptul de date. Explicația aici este simplă: totul este despre tradiții consacrate. În marketing, când se vorbește despre rațiunea deciziilor, termenul de informare este folosit mai des, chiar dacă despre care vorbim despre alegerea justificării pentru aceasta informatiile necesare(adică informația în sine) din matricele lor mari (adică din matricele de date). Iar termenul de date este folosit în principal în timpul colectării inițiale a oricărei informații. Nu există o mare contradicție cu teoria informației aici și, prin urmare, tradiția stabilită nu este încălcată.

Datele și informațiile sunt adesea echivalate, dar există o diferență semnificativă între cei doi termeni:

Informaţii- cunoștințe referitoare la concepte și obiecte (fapte, evenimente, lucruri, procese, idei) în creierul uman;

Date- prezentarea informațiilor prelucrate adecvate pentru transmitere, interpretare sau prelucrare ( fisiere de calculator, documente pe hârtie, înregistrări în sistemul informațional).

Diferența dintre informații și date este aceea că:

1) datele sunt informații fixe despre evenimente și fenomene care sunt stocate pe anumite medii, iar informațiile apar ca urmare a prelucrării datelor la rezolvarea unor probleme specifice.

De exemplu, diferite date sunt stocate în baze de date, iar la o anumită cerere, sistemul de management al bazei de date oferă informațiile necesare.

2) datele sunt purtători de informații, nu informațiile în sine.

3) Datele se transformă în informații doar atunci când o persoană devine interesată de acestea. O persoană extrage informații din date, le evaluează, le analizează și, pe baza rezultatelor analizei, ia o decizie sau alta.

Datele se transformă în informații în mai multe moduri:

Contextualizare: știm pentru ce sunt datele;

Numărarea: Prelucrăm datele matematic;

Corectare: corectăm erorile și eliminăm omisiunile;

Comprimare: Comprimăm, concentrăm, agregăm datele.

Astfel, dacă este posibilă utilizarea datelor pentru a reduce incertitudinea cunoștințelor despre un subiect, atunci datele se transformă în informații. Prin urmare, se poate susține că informațiile sunt datele utilizate.

4) Informațiile pot fi măsurate. Măsura de măsurare a conținutului informației este asociată cu o modificare a gradului de ignoranță a destinatarului și se bazează pe metodele teoriei informației.

2. Domeniul de subiect- asta face parte lumea reală, datele despre care dorim să reflectăm în baza de date. Tematica este infinită și conține atât concepte și date esențial importante, cât și date nesemnificative sau nesemnificative. Astfel, importanța datelor depinde de alegere domeniul subiectului.

Model de domeniu. Un model de domeniu este cunoștințele noastre despre un domeniu. Cunoașterea poate fi fie sub formă de cunoștințe informale în creierul expertului, fie exprimată formal folosind anumite mijloace. Experiența arată că metoda textului reprezentarea unui model de domeniu este extrem de ineficientă. Mult mai informative și mai utile la dezvoltarea bazelor de date sunt descrierile domeniului subiectului realizate folosind notații grafice specializate. Disponibil număr mare metode de descriere a domeniului subiectului. Cea mai cunoscută metodă este analiza structurala SADT și IDEF0 pe baza acestuia, diagrame de flux de date Gein-Sarson, tehnici UML de analiză orientată pe obiecte etc. Modelul de domeniu descrie mai degrabă procesele care au loc în domeniu și datele utilizate de aceste procese. Succesul dezvoltării ulterioare a aplicațiilor depinde de cât de corect este modelată domeniul subiectului.

3. Baza de date- un set de materiale independente prezentate într-o formă obiectivă (articole, calcule, reglementări, hotărâri judecătoreștiși alte materiale similare), sistematizate în așa fel încât aceste materiale să poată fi găsite și prelucrate prin mijloace electronice calculator(CALCULATOR).

Mulți experți subliniază o greșeală comună, care este utilizare incorectă termenul „bază de date” în loc de termenul „sistem de management al bazelor de date” și indică necesitatea de a face distincția între aceste concepte.

  • · Informaţii- cunoștințe referitoare la concepte și obiecte (fapte, evenimente, lucruri, procese, idei) din creierul uman;
  • · Date- prezentarea informațiilor prelucrate adecvate pentru transmitere, interpretare sau prelucrare (fișiere informatice, documente pe hârtie, înregistrări într-un sistem informațional).
  • 1. Datele și informațiile sunt strâns legate între ele.
  • 2. Datele sunt fixe; ele există de fapt în fiecare unitate de timp. Informațiile apar numai atunci când aceste date sunt prelucrate.
  • 3. Datele după transformare devin informație. Informații verificate în mod repetat - cunoștințe.
  • 4. Informația, spre deosebire de date, este o substanță măsurabilă.

Modelarea procesului de luare a deciziilor de management ne permite să facem un pas semnificativ către estimări cantitativeși analiza cantitativă a rezultatelor deciziilor luate. Crearea și utilizarea modelelor procesului decizional permite evaluarea cantitativă chiar și a situațiilor de management evaluate calitativ folosind scale verbal-numerice special introduse.

Utilizarea modelării procesului de luare a deciziilor manageriale ne permite să-l ridicăm la un nivel de calitate mai înalt. nou nivel, dezvoltați și implementați în practica de luare a deciziilor de management tehnologii moderne. Exact uz profesional modelele procesului decizional permit conducătorului unei organizații să-și controleze intuiția și să asigure un grad mai mare de consistență, consistență și fiabilitate a deciziilor de management luate. Dar, pe de altă parte, utilizarea modelelor face posibilă realizarea mai deplină a intuiției, experienței și cunoștințelor decidentului. Este necesar să înțelegeți că modelul vă permite să găsiți o soluție rațională doar pentru acea versiune simplificată a situației de luare a deciziilor care este utilizată în model.

Sunt trei tip de bază modele: fizice, analogice și matematice

Fizic(descriptiv sau portret) - înfățișează un obiect sau o situație, arătând cum arată. De exemplu: copii de mașini, avioane, desene reduse ale unei fabrici etc.

Analogic- imaginea unui obiect sau a unei situații prin alte mijloace De exemplu: un lac pe o hartă - albastru organigrama; grafice ale raportului diverșilor indicatori ai activității întreprinderii

Matematic(simbolic) - utilizarea simbolurilor pentru a caracteriza un obiect sub formă de ecuații matematice

Pe baza acestora modele de bază sunt în curs de dezvoltare diverse tipuri modele şi metode de luare a deciziilor de management. Să ne uităm la cele mai comune

Teoria jocurilor- utilizat pentru evaluarea impactului decizie luată asupra competitorilor. În afaceri modele de jocuri sunt utilizate pentru a prezice reacția concurenților la modificările prețurilor, vânzărilor, produse noi Acest model rustic este destul de rar.

Teoria stării de așteptare sau serviciul optim- utilizate pentru determinarea numărului optim de canale de servicii pentru consumatori în raport cu nevoile acestora. Problema fundamentală este echilibrarea costurilor canale suplimentare pierderi de întreținere și service la un nivel mai mic decât cel optim.

Model de management al stocurilor- sunt utilizate pentru a determina timpul de plasare a comenzilor pentru resurse și cantitățile acestora, precum și masa produselor finite din depozite Scopul modelului este de a minimiza pierderile din lipsuri sau surplus de stocuri.

Model programare liniară - utilizat pentru a determina modalitatea optimă de alocare a resurselor limitate în prezența nevoilor concurente (planificarea diferențierii serviciilor, distribuția lucrătorilor etc.)

Modelare prin simulare- imitarea unui proces sau model specific, utilizarea experimentală a acestuia pentru a determina schimbări în situația reală

Analiza economică- evaluarea costurilor, profiturilor și rentabilității unei întreprinderi utilizează adesea metoda pragului de rentabilitate, adică determinând momentul de la care întreprinderea ajunge la rentabilitate

5.1. Diferențele dintre cunoștințe și date

O trăsătură caracteristică sisteme inteligente este disponibilitatea cunoștințelor necesare pentru rezolvarea problemelor dintr-o anumită disciplină. Acest lucru ridică o întrebare firească: ce este cunoștințele și prin ce diferă acestea de datele obișnuite procesate de un computer?

Datele sunt informații de natură faptică care descriu obiecte, procese și fenomene din domeniul subiectului, precum și proprietățile acestora. În procesele de prelucrare informatică, datele trec prin următoarele etape de transformare:

Forma inițială a existenței datelor (rezultate ale observațiilor și măsurătorilor, tabele, cărți de referință, diagrame, grafice etc.);

Prezentarea în limbi speciale a descrierii datelor destinate introducerii și procesării datelor inițiale într-un computer;

Baze de date pe medii de stocare computerizate.

Cunoașterea este o categorie de informații mai complexă în comparație cu datele. Cunoașterea descrie nu numai faptele individuale, ci și relațiile dintre ele, motiv pentru care cunoștințele sunt uneori numite date structurate. Cunoștințele pot fi obținute pe baza prelucrării datelor empirice. Ele sunt rezultatul activității mentale a unei persoane care vizează generalizarea experienței sale dobândite ca urmare a activității practice.

Pentru a oferi IIS cunoștințe, acestea trebuie prezentate într-o anumită formă. Există două modalități principale de a transmite cunoștințe sisteme software. Primul este de a pune cunoștințele într-un program scris într-un limbaj de programare obișnuit. Un astfel de sistem va reprezenta un singur codul programului, în care cunoștințele nu sunt plasate într-o categorie separată. În ciuda faptului că problema principală va fi rezolvată, în acest caz este dificil să se evalueze rolul cunoștințelor și să se înțeleagă modul în care acestea sunt utilizate în procesul de rezolvare a problemelor. Modificarea și întreținerea nu sunt ușoare programe similare, iar problema refacerii cunoștințelor poate deveni insolubilă.

A doua metodă se bazează pe conceptul de baze de date și constă în plasarea cunoștințelor într-o categorie separată, i.e. cunoștințele sunt prezentate într-un format specific și plasate în baza de cunoștințe. Baza de cunoștințe este ușor de actualizat și modificat. Este o parte autonomă a unui sistem inteligent, deși mecanismul de inferență logică implementat în blocul logic, precum și mijloacele de dialog, impun anumite restricții asupra structurii bazei de cunoștințe și operațiunilor cu aceasta. Această metodă este adoptată în IIS modern.

De remarcat că pentru a introduce cunoștințe într-un computer, acesta trebuie să fie reprezentat de anumite structuri de date corespunzătoare mediului ales pentru dezvoltarea unui sistem inteligent. În consecință, la dezvoltarea unui sistem informațional informațional, cunoștințele sunt mai întâi acumulate și prezentate, iar în această etapă este necesară participarea umană, iar apoi cunoștințele sunt reprezentate de anumite structuri de date care sunt convenabile pentru stocarea și procesarea într-un computer. Cunoștințele în MIS există în următoarele forme:

Cunoștințe inițiale (reguli derivate din experiența practică, dependențe matematice și empirice care reflectă conexiuni reciproce între fapte; modele și tendințe care descriu schimbările în fapte în timp; funcții, diagrame, grafice etc.);

Descrierea cunoștințelor inițiale folosind modelul de reprezentare a cunoștințelor selectat (set de formule logice sau reguli de producție, web semantic, rame etc.);

Reprezentarea cunoștințelor prin structuri de date care sunt destinate stocării și prelucrării pe un computer;

Baze de cunoștințe despre mediile de stocare pentru computer.

Ce este cunoașterea? Să dăm câteva definiții.

Din dicţionar explicativ S.I.Ozhegova: 1) „Cunoașterea - înțelegerea realității prin conștiință, știință”; 2) „Cunoașterea este totalitatea informațiilor, cunoștințe în orice domeniu.”

Definiția termenului „cunoaștere” include de cele mai multe ori elemente filozofice. De exemplu, cunoașterea este un rezultat testat în practică al cunoașterii realității, reflectarea corectă a acesteia în mintea umană.

Cunoașterea este rezultatul obținut prin înțelegerea lumii înconjurătoare și a obiectelor acesteia. În cele mai simple situații, cunoașterea este considerată ca o declarație de fapte și descrierea acestora.

Cercetătorii AI oferă definiții mai specifice ale cunoștințelor.

„Cunoașterea reprezintă legile unui domeniu (principii, conexiuni, legi) obținute ca urmare a activităților practice și experiență profesională, permițând specialiștilor să stabilească și să rezolve probleme în acest domeniu.”

„Cunoștințele sunt date bine structurate sau date despre date sau metadate.”

„Cunoașterea este informații oficializate la care se face referire sau se utilizează în procesul de inferență logică.”

În domeniul sistemelor AI și al inginerii cunoașterii, definiția cunoștințelor este legată de inferența logică: cunoașterea este informație pe baza căreia este implementat procesul de inferență logică, adică. Pe baza acestor informații, se pot trage diverse concluzii din datele disponibile în sistem folosind inferența logică. Mecanismul de inferență vă permite să legați fragmente individuale împreună și apoi să trageți o concluzie bazată pe această secvență de fragmente înrudite.

Cunoașterea este informație formalizată la care se face referire sau se utilizează în procesul de inferență logică (Fig. 5.1.).


Orez. 5.1. Procesul de inferență în IS

Prin cunoaștere înțelegem un set de fapte și reguli. Conceptul de regulă reprezentând o cunoaștere are forma:

Dacă<условие>Că<действие>.

Această definiție este caz special definiția anterioară.

Cu toate acestea, se recunoaște că trăsăturile calitative distinctive ale cunoașterii se datorează prezenței unor mari oportunități în direcția structurării și interconectării unităților constitutive, interpretabilității acestora, prezenței metricilor, integrității funcționale și activității.

Există multe clasificări ale cunoștințelor. De regulă, cu ajutorul clasificărilor, se sistematizează cunoștințele unor domenii specifice. La un nivel abstract de considerație, putem vorbi despre caracteristicile după care sunt împărțite cunoștințele, și nu despre clasificări. Prin natura sa, cunoștințele pot fi împărțite în declarative și procedurale.

Cunoașterea declarativă este o descriere a faptelor și fenomenelor, înregistrează prezența sau absența unor astfel de fapte și include, de asemenea, descrieri ale conexiunilor și modelelor de bază în care sunt incluse aceste fapte și fenomene.

Cunoștințele procedurale sunt o descriere a acțiunilor care sunt posibile atunci când manipulăm fapte și fenomene pentru a atinge obiectivele propuse.

Pentru a descrie cunoștințele la nivel abstract, dezvoltate limbi speciale- limbi pentru descrierea cunoștințelor. Aceste limbi sunt, de asemenea, împărțite în limbi procedurale și declarative. Toate limbajele de descriere a cunoștințelor orientate spre utilizarea computerelor tradiționale cu arhitectură von Neumann sunt limbaje procedurale. Dezvoltarea unor limbaje declarative care sunt convenabile pentru reprezentarea cunoștințelor este o problemă presantă astăzi.

Conform metodei de dobândire a cunoștințelor, aceasta poate fi împărțită în fapte și euristici (reguli care vă permit să faceți o alegere în absența unei justificări teoretice precise). Prima categorie de cunoștințe indică, de obicei, circumstanțe bine-cunoscute într-un domeniu dat. A doua categorie de cunoștințe se bazează pe propria experiență un expert care lucrează într-un domeniu specific, acumulat ca urmare a multor ani de practică.

Pe baza tipului de reprezentare, cunoștințele sunt împărțite în fapte și reguli modele de rețea. Regulile sau produsele sunt cunoștințe de tip „DACĂ A, ATUNCI B”.

Pe lângă fapte și reguli, există și metacunoștințe - cunoștințe despre cunoaștere. Ele sunt necesare pentru managementul cunoștințelor și pentru organizarea eficientă a procedurilor de inferență logică.

Forma de reprezentare a cunoștințelor are un impact semnificativ asupra caracteristicilor sistemelor informaționale. Bazele de cunoștințe sunt modele ale cunoașterii umane. Cu toate acestea, toate cunoștințele pe care o persoană le atrage în procesul de decizie sarcini complexe, nu poate fi modelat. Prin urmare, în sistemele inteligente este necesar să se separe în mod clar cunoștințele în cele care sunt destinate a fi procesate de un computer și cunoștințele utilizate de oameni. Evident, pentru a rezolva probleme complexe, baza de cunoștințe trebuie să aibă un volum suficient de mare și, prin urmare, inevitabil apar probleme de gestionare a unei astfel de baze de date. Prin urmare, atunci când se alege un model de reprezentare a cunoștințelor, ar trebui să se țină seama de factori precum uniformitatea reprezentării și ușurința de înțelegere. Omogenitatea prezentării conduce la o simplificare a mecanismului de management al cunoștințelor. Ușurința de înțelegere este importantă pentru utilizatorii de sisteme inteligente și experții ale căror cunoștințe sunt încorporate în sistemul informațional. Dacă forma de reprezentare a cunoștințelor este greu de înțeles, atunci procesele de dobândire și interpretare a cunoștințelor devin mai complicate. Trebuie remarcat faptul că este destul de dificil să îndepliniți simultan aceste cerințe, în special în sisteme mari, unde structurarea și reprezentarea modulară a cunoștințelor devine inevitabilă.

Rezolvarea problemelor de inginerie a cunoștințelor pune problema conversiei informațiilor primite de la experți sub formă de fapte și reguli de utilizare a acestora într-o formă care poate fi implementată eficient prin prelucrarea automată a acestor informații. În acest scop, au fost create și utilizate diverse modele de reprezentare a cunoștințelor în sistemele existente.

LA modele clasice reprezentările de cunoștințe includ modele logice, de producție, cadru și rețele semantice.

Fiecare model are propriul limbaj de reprezentare a cunoștințelor. Cu toate acestea, în practică, este rareori posibil să se gestioneze în cadrul unui model atunci când se dezvoltă un sistem informațional informațional, cu excepția celor mai simple cazuri, astfel încât reprezentarea cunoștințelor se dovedește a fi complexă. În plus față de reprezentarea combinată folosind diverse modele, utilizate în mod obișnuit mijloace speciale, permițând să reflecte trăsăturile cunoștințelor specifice despre domeniul de studiu, precum și diverse moduri eliminând și ținând seama de vagitatea și incompletitudinea cunoștințelor.

Informaţii- acestea sunt informații despre obiecte și fenomene mediu, parametrii, proprietățile și stările acestora, care reduc gradul de incertitudine și cunoașterea incompletă a acestora.

Datele sunt o colecție de informații înregistrate pe un anumit suport într-o formă adecvată pentru stocarea, transmiterea și prelucrarea permanentă. Transformarea și prelucrarea datelor vă permit să obțineți informații. Deveniți informații atunci când sunt utilizate

2.Proprietățile informațiilor: obiectivitate, fiabilitate, completitudine, relevanță, adecvare, accesibilitate.

Proprietățile informațiilor:

  1. Obiectivitatea informației. Obiectiv – existent în afara și independent de conștiința umană. Informația este o reflectare a lumii obiective externe. Informația este obiectivă dacă nu depinde de metodele de înregistrare, de opinia cuiva sau de judecata. Exemplu. Mesajul „E cald afară” poartă informații subiective, în timp ce mesajul „Afară sunt 22°C” poartă informații obiective. Informațiile obiective pot fi obținute folosind senzori de lucru, instrumente de măsurare. Reflectate în conștiința unei persoane, informațiile pot fi distorsionate în funcție de opinie, judecată, experiență, cunoștințe despre un anumit subiect și, astfel, încetează să mai fie obiective.
  2. Fiabilitatea informațiilor. Informația este de încredere dacă reflectă starea reală a lucrurilor. Informațiile obiective sunt întotdeauna de încredere, dar informațiile de încredere pot fi atât obiective, cât și subiective. Informațiile de încredere ne ajută să acceptăm decizia corectă. Informațiile pot fi inexacte din următoarele motive:
  • denaturarea intenționată sau neintenționată a unei proprietăți subiective;
  • distorsiune ca urmare a interferenței și a mijloacelor insuficient de precise de fixare a acesteia.
  • Completitudinea informațiilor. Informațiile pot fi numite complete dacă sunt suficiente pentru înțelegerea și luarea deciziilor. Informațiile incomplete pot duce la o concluzie sau o decizie eronată.
  • Relevanța informațiilor este gradul de conformitate a informațiilor momentul actual timp Numai informațiile primite în timp util pot fi utile.
  • Adecvarea informațiilor - acesta este gradul de corespondență cu starea obiectivă reală a materiei. Informații inadecvate pot fi generate la creare informații noi bazate pe date incomplete sau nesigure. Cu toate acestea, atât datele complete, cât și cele de încredere pot duce la crearea de informații inadecvate dacă li se aplică metode inadecvate.
  • Disponibilitatea informațiilor - măsura posibilității de a obține cutare sau cutare informație. Gradul de disponibilitate a informațiilor este influențat simultan atât de disponibilitatea datelor, cât și de disponibilitatea metodelor adecvate de interpretare a acestora. Lipsa accesului la date sau lipsa unor metode adecvate de prelucrare a datelor conduc la același rezultat: informațiile sunt inaccesibile.


  •