Sự khác biệt giữa dữ liệu và thông tin là gì. Sự khác biệt giữa thông tin và dữ liệu

Có nhiều định nghĩa và quan điểm về khái niệm "thông tin". Vì vậy, chẳng hạn, định nghĩa triết học chung nhất như sau: "Thông tin là sự phản ánh thế giới hiện thực. Thông tin là tính đa dạng được phản ánh, tức là vi phạm tính đồng nhất. Thông tin là một trong những thuộc tính phổ quát chính của vật chất." Theo cách hiểu hẹp, thực tế, định nghĩa về khái niệm “thông tin” được trình bày như sau: “Thông tin là tất cả những thông tin là đối tượng lưu trữ, truyền tải và biến đổi”.

Tác giả của lý thuyết thông tin, K. Shannon (1916), đã định nghĩa khái niệm thông tin là truyền thông, liên lạc, trong quá trình đó sự không chắc chắn được loại bỏ. Shannon đã đề xuất vào cuối những năm 1940 một đơn vị đo lường thông tin - một chút. Mỗi tín hiệu trong lý thuyết được gán một xác suất tiên nghiệm về sự xuất hiện của nó. Xác suất xuất hiện của một tín hiệu cụ thể càng thấp, thì tín hiệu đó càng mang nhiều thông tin cho người tiêu dùng (tức là tin tức càng bất ngờ, càng nhiều thông tin).

Thông tin bằng 0 khi chỉ có thể có một sự kiện. Khi số lượng sự kiện tăng lên, nó sẽ tăng và đạt giá trị lớn nhất khi các sự kiện có khả năng xảy ra như nhau. Với sự hiểu biết này, thông tin là kết quả của sự lựa chọn từ một tập hợp các lựa chọn thay thế có thể có. Tuy nhiên, lý thuyết toán học về thông tin không bao hàm hết mức độ phong phú của nội dung thông tin, vì nó không tính đến mặt nội dung của thông điệp.

Phát triển hơn nữa toán học cách tiếp cận khái niệm "thông tin" được ghi nhận trong các công trình của các nhà logic học (R. Carnap, I. Bar-Hillel) và các nhà toán học (AN Kolmogorov). Trong các lý thuyết này, khái niệm thông tin không gắn liền với hình thức hoặc nội dung của các thông điệp được truyền qua một kênh truyền thông. Khái niệm "thông tin" trong trường hợp nàyđược định nghĩa là một đại lượng trừu tượng không tồn tại trong thực tế vật lý, cũng như không có số ảo hoặc một điểm không có kích thước tuyến tính.

TỪ điều khiển học quan điểm thông tin (các quá trình thông tin) nằm trong tất cả các hệ thống tự quản (kỹ thuật, sinh học, xã hội). Đồng thời, một phần của điều khiển học định nghĩa thông tin là nội dung của một tín hiệu, một thông điệp được hệ thống điều khiển học từ thế giới bên ngoài nhận được. Ở đây tín hiệu được xác định với thông tin, chúng được coi như là từ đồng nghĩa. Một phần khác của điều khiển học diễn giải thông tin là thước đo mức độ phức tạp của cấu trúc, thước đo của tổ chức. Đây là cách khái niệm "thông tin" được định nghĩa bởi nhà khoa học người Mỹ B. Wiener, người đã hình thành các định hướng chính của điều khiển học, tác giả của các công trình về phân tích toán học, lý thuyết xác suất, mạng điện và công nghệ máy tính: thông tin là một định nghĩa của nội dung nhận được từ thế giới bên ngoài.

TRONG vật lý học thông tin đóng vai trò như một thước đo của sự đa dạng. Tính trật tự (tổ chức) của hệ thống của một đối tượng càng cao thì nó càng chứa nhiều thông tin "liên quan". Từ đó rút ra kết luận rằng thông tin là một phạm trù khoa học tự nhiên cơ bản, nằm bên cạnh các phạm trù như "chất" và "năng lượng", nó là thuộc tính tổng hợp của vật chất và do đó đã tồn tại và sẽ tồn tại mãi mãi. Vì vậy, ví dụ, nhà vật lý người Pháp L. Brillouin (1889-1969), người sáng lập lý thuyết vùng của chất rắn, tác giả của các công trình về cơ học lượng tử, từ học, vật lý phóng xạ, triết học khoa học tự nhiên, lý thuyết thông tin, định nghĩa thông tin là sự phủ định của entropy (entropy là thước đo độ không đảm bảo đo có tính đến xác suất xuất hiện và tính thông tin của một số thông điệp nhất định).

Kể từ những năm 1950 và 1960, thuật ngữ của lý thuyết thông tin đã được sử dụng trong sinh lý học(D. Ađam). Một sự tương đồng chặt chẽ đã được tìm thấy giữa kiểm soát và giao tiếp trong một cơ thể sống và trong các thiết bị công nghệ thông tin. Do sự ra đời của khái niệm "thông tin cảm giác" (tức là các tín hiệu quang học, âm thanh, cảm ứng, nhiệt và các tín hiệu khác đến cơ thể từ bên ngoài hoặc được tạo ra bên trong nó, được chuyển thành các xung động có bản chất điện hoặc hóa học. , được truyền qua các mạch thần kinh đến hệ thần kinh trung ương và từ nó đến các cơ quan tác động tương ứng), các khả năng mới đã xuất hiện để mô tả và giải thích các quá trình sinh lý của sự cáu kỉnh, nhạy cảm, nhận thức về môi trường của các cơ quan cảm giác và hoạt động của hệ thần kinh.

Như là một phần của di truyền học khái niệm thông tin di truyền được hình thành - như một chương trình (mã) để sinh tổng hợp protein, được biểu diễn vật chất bằng các chuỗi DNA cao phân tử. Thông tin di truyền chủ yếu chứa trong nhiễm sắc thể, nơi nó được mã hóa theo một trình tự nhất định của các nucleide trong phân tử DNA. Thông tin này được thực hiện trong quá trình phát triển của một cá nhân (quá trình hình thành).

Như vậy, hệ thống hóa những điều trên, chúng ta có thể kết luận rằng đối với kỹ sư, nhà sinh học, nhà di truyền học, nhà tâm lý học khái niệm "thông tin" được xác định bằng các tín hiệu, xung động, mã được quan sát trong các hệ thống kỹ thuật và sinh học. Kỹ thuật viên vô tuyến điện, kỹ thuật viên từ xa, lập trình viên Thông tin được hiểu là chất lỏng hoạt động có thể được xử lý, vận chuyển, giống như điện năng trong kỹ thuật điện hoặc chất lỏng trong thủy lực. Cơ quan làm việc này bao gồm các tín hiệu rời rạc hoặc liên tục được sắp xếp, mà công nghệ thông tin xử lý.

TỪ hợp pháp theo quan điểm, thông tin được định nghĩa là "một tập hợp nhất định các thông điệp khác nhau về các sự kiện xảy ra trong hệ thống pháp luật của xã hội, các hệ thống con và yếu tố của nó và trong môi trường bên ngoài của các hình thức thông tin pháp lý này, về những thay đổi trong các đặc điểm của hình thức thông tin và môi trường bên ngoài, hoặc như một thước đo tổ chức các yếu tố kinh tế xã hội, chính trị, luật pháp, không gian và thời gian của đối tượng. cho chúng tôi. "

Thông tin từ thuộc kinh tế- Đây là nguồn lực chiến lược, một trong những nguồn lực chính để tăng năng suất của doanh nghiệp. Thông tin là cơ sở của sự vận động của một doanh nhân bằng cả vật chất và sức lực, vì nó là thông tin cho phép bạn thiết lập các mục tiêu và mục tiêu chiến lược của doanh nghiệp và sử dụng các cơ hội mở ra; đưa ra các quyết định quản lý kịp thời và sáng suốt; phối hợp hành động của các bộ phận khác nhau, hướng nỗ lực của họ để đạt được các mục tiêu chung. Ví dụ, nhà tiếp thị R.D. Basel, D.F. Cox, R.V. Brown định nghĩa khái niệm "thông tin" như sau: "thông tin bao gồm tất cả các sự kiện khách quan và tất cả các giả định ảnh hưởng đến nhận thức của người ra quyết định về bản chất và mức độ không chắc chắn liên quan đến một vấn đề hoặc cơ hội nhất định (trong quá trình quản lý). điều đó có khả năng sẽ làm giảm mức độ không chắc chắn, cho dù đó là sự kiện, ước tính, dự báo, kết nối tổng quát hoặc tin đồn, đều nên được coi là thông tin.

TRONG sự quản lý thông tin được hiểu là thông tin về đối tượng điều khiển, các hiện tượng môi trường, các thông số, tính chất và trạng thái của chúng tại một thời điểm cụ thể. Thông tin là đối tượng của công việc quản lý, là phương tiện để chứng minh các quyết định của người quản lý, nếu không có quá trình ảnh hưởng của hệ thống con kiểm soát đối với hệ thống được kiểm soát và sự tương tác của chúng là không thể. Theo nghĩa này, thông tin là cơ sở nền tảng của quá trình quản lý.

Tầm quan trọng của thông tin đối với việc kinh doanh xác định D.I. Blumenau và A.V. Sokolov: "thông tin là sản phẩm của tri thức khoa học, là phương tiện nghiên cứu thực tế trong khuôn khổ cho phép của phương pháp luận của một trong những cách tiếp cận thông tin để nghiên cứu các đối tượng có bản chất khác nhau (sinh học, kỹ thuật, xã hội). Cách tiếp cận liên quan đến mô tả và xem xét các đối tượng này dưới dạng một hệ thống bao gồm nguồn, kênh và bộ thu các hành động kiểm soát cho phép giải thích ý nghĩa của chúng. Nếu bạn cố gắng kết hợp các phương pháp được đề xuất, bạn sẽ nhận được những điều sau:

Dữ liệu mang thông tin về các sự kiện đã diễn ra trong thế giới vật chất, vì chúng là sự ghi lại các tín hiệu phát sinh do các sự kiện này. Tuy nhiên, dữ liệu không giống như thông tin. Dữ liệu có trở thành thông tin hay không phụ thuộc vào việc phương pháp biến đổi dữ liệu thành các khái niệm đã biết có được biết đến hay không. Nghĩa là, để trích xuất thông tin từ dữ liệu, cần phải lựa chọn một phương pháp thích hợp để thu được thông tin tương ứng với hình thức của dữ liệu. Dữ liệu cấu thành thông tin có các thuộc tính xác định rõ ràng một phương pháp thích hợp để thu được thông tin này. Hơn nữa, cần phải tính đến thực tế là thông tin không phải là một đối tượng tĩnh - nó thay đổi động và chỉ tồn tại tại thời điểm tương tác giữa dữ liệu và phương thức. Tại tất cả các thời điểm khác, nó ở trạng thái dữ liệu. Thông tin chỉ tồn tại tại thời điểm của quá trình thông tin. Phần còn lại của thời gian nó được chứa dưới dạng dữ liệu.

Cùng một dữ liệu có thể trình bày các thông tin khác nhau tại thời điểm tiêu thụ, tùy thuộc vào mức độ đầy đủ của các phương pháp tương tác với chúng.

Theo bản chất của nó, dữ liệu là khách quan, vì nó là kết quả của việc đăng ký các tín hiệu hiện có một cách khách quan gây ra bởi những thay đổi trong các cơ quan hoặc trường vật chất. Phương pháp là chủ quan. Phương pháp nhân tạo dựa trên các thuật toán (các chuỗi lệnh có thứ tự) do con người (chủ thể) biên soạn và chuẩn bị. Các phương pháp tự nhiên dựa trên các thuộc tính sinh học của các chủ thể của quá trình thông tin. Như vậy, thông tin nảy sinh và tồn tại đồng thời có sự tác động qua lại biện chứng của dữ liệu khách quan và phương pháp chủ quan.

Chuyển sang việc xem xét các cách tiếp cận định nghĩa khái niệm "tri thức", có thể phân biệt các cách giải thích sau đây. Hiểu biết- cái này:

  • * loại thông tin phản ánh kiến ​​thức, kinh nghiệm và nhận thức của một người - một chuyên gia (chuyên gia) trong một lĩnh vực chủ đề cụ thể;
  • * tập hợp tất cả các tình huống hiện tại trong các đối tượng của một loại nhất định và các cách để chuyển từ mô tả đối tượng này sang mô tả đối tượng khác;
  • * nhận thức và giải thích thông tin nhất định, có tính đến các cách sử dụng tốt nhất của nó để đạt được các mục tiêu cụ thể, các đặc điểm của tri thức là: khả năng diễn giải bên trong, khả năng cấu trúc, tính liên kết và hoạt động.

Dựa trên cách hiểu ở trên về các khái niệm đang xem xét, chúng ta có thể nêu một thực tế là tri thức là thông tin, nhưng không phải mọi thông tin đều là tri thức. Thông tin đóng vai trò là tri thức được xa lánh khỏi người mang nó và được xã hội hóa để sử dụng chung. Nói cách khác, thông tin là một dạng tri thức được biến đổi để đảm bảo tính phổ biến và hoạt động xã hội của nó. Tiếp nhận thông tin, người dùng biến nó thông qua sự đồng hóa trí tuệ thành kiến ​​thức cá nhân của mình. Ở đây chúng ta đang giải quyết cái gọi là quá trình nhận thức-thông tin gắn liền với việc biểu diễn tri thức cá nhân dưới dạng thông tin và việc tái tạo lại tri thức này dựa trên thông tin.

tham gia vào việc chuyển đổi thông tin thành kiến ​​thức toàn bộ dòng các mô hình điều chỉnh hoạt động của não và các quá trình tinh thần khác nhau, cũng như các quy tắc khác nhau, bao gồm cả kiến ​​thức về hệ thống quan hệ xã hội - bối cảnh văn hóa của một thời đại nhất định. Nhờ đó, tri thức trở thành tài sản của xã hội, chứ không chỉ của từng cá nhân. Có một khoảng cách giữa thông tin và kiến ​​thức. Một người phải xử lý thông tin một cách sáng tạo để có được kiến ​​thức mới.

Do đó, với những điều trên, người ta có thể đầu ra rằng các sự kiện nhận thức cố định về thế giới xung quanh là dữ liệu. Khi sử dụng dữ liệu trong quá trình giải quyết các vấn đề cụ thể - xuất hiện thông tin. Kết quả giải quyết vấn đề, thông tin xác thực, đã được xác minh ( Sự thông minh), được khái quát dưới dạng luật, lý thuyết, tập hợp các quan điểm và ý tưởng, là hiểu biết.

5.1. Sự khác biệt giữa kiến ​​thức và dữ liệu

Một tính năng đặc trưng của các hệ thống thông minh là sự sẵn có của kiến ​​thức cần thiết để giải quyết các vấn đề trong một lĩnh vực chủ đề cụ thể. Trong trường hợp này, một câu hỏi tự nhiên được đặt ra, kiến ​​thức là gì và nó khác với dữ liệu thông thường do máy tính xử lý như thế nào.

Dữ liệu là thông tin có bản chất thực tế mô tả các đối tượng, quá trình và hiện tượng của lĩnh vực chủ thể, cũng như các thuộc tính của chúng. Trong quá trình xử lý của máy tính, dữ liệu trải qua các giai đoạn biến đổi sau:

Dạng tồn tại ban đầu của dữ liệu (kết quả quan sát và đo lường, bảng, thư mục, biểu đồ, đồ thị, v.v.);

Trình bày bằng ngôn ngữ đặc biệt của mô tả dữ liệu dành cho đầu vào và xử lý dữ liệu ban đầu trong máy tính;

Cơ sở dữ liệu trên phương tiện lưu trữ của máy.

Tri thức là một phạm trù thông tin phức tạp hơn dữ liệu. Kiến thức không chỉ mô tả các dữ kiện riêng lẻ mà còn mô tả các mối quan hệ giữa chúng, vì vậy kiến ​​thức đôi khi được gọi là dữ liệu có cấu trúc. Kiến thức có thể thu được thông qua việc xử lý dữ liệu thực nghiệm. Chúng là kết quả của hoạt động tinh thần của một người nhằm mục đích khái quát hóa kinh nghiệm của anh ta có được do kết quả của các hoạt động thực tiễn.

Để cung cấp kiến ​​thức cho IIS, chúng phải được trình bày dưới một hình thức nhất định. Có hai cách chính để truyền đạt kiến ​​thức cho hệ thống phần mềm. Đầu tiên là đưa kiến ​​thức vào một chương trình được viết bằng ngôn ngữ lập trình thông thường. Một hệ thống như vậy sẽ là một mã chương trình duy nhất trong đó kiến ​​thức không được xếp vào một danh mục riêng biệt. Mặc dù thực tế là nhiệm vụ chính sẽ được giải quyết, nhưng trong trường hợp này, rất khó để đánh giá vai trò của kiến ​​thức và hiểu nó được sử dụng như thế nào trong quá trình giải quyết vấn đề. Không dễ dàng gì để sửa đổi và duy trì những chương trình như vậy, và vấn đề bổ sung kiến ​​thức có thể trở nên khó giải quyết.

Phương pháp thứ hai dựa trên khái niệm cơ sở dữ liệu và bao gồm việc đặt kiến ​​thức vào một loại riêng biệt, tức là kiến thức được trình bày theo một định dạng nhất định và được đặt trong cơ sở tri thức. Nền tảng kiến ​​thức dễ dàng được cập nhật và sửa đổi. Nó là một phần tự trị của hệ thống thông minh, mặc dù cơ chế suy luận được thực hiện trong khối logic, cũng như phương tiện thực hiện đối thoại, áp đặt những hạn chế nhất định đối với cấu trúc của cơ sở tri thức và các hoạt động với nó. Phương pháp này được áp dụng trong IIS hiện đại.

Cần lưu ý rằng để đưa tri thức vào máy tính, nó phải được biểu diễn bằng những cấu trúc dữ liệu nhất định tương ứng với môi trường phát triển đã chọn của một hệ thống thông minh. Do đó, trong quá trình phát triển của IIS, kiến ​​thức đầu tiên được tích lũy và biểu diễn, và ở giai đoạn này, sự tham gia của con người là bắt buộc, và sau đó kiến ​​thức được biểu diễn bằng các cấu trúc dữ liệu nhất định thuận tiện cho việc lưu trữ và xử lý trong máy tính. Kiến thức trong IIS tồn tại ở các dạng sau:

Kiến thức ban đầu (các quy tắc rút ra từ kinh nghiệm thực tế, các mối quan hệ toán học và thực nghiệm phản ánh mối quan hệ lẫn nhau giữa các dữ kiện; các mẫu và xu hướng mô tả sự thay đổi của các dữ kiện theo thời gian; hàm số, sơ đồ, đồ thị, v.v.);

Mô tả kiến ​​thức ban đầu bằng mô hình biểu diễn tri thức đã chọn (tập hợp các công thức logic hoặc quy tắc sản xuất, mạng ngữ nghĩa, khung, v.v.);

Biểu diễn tri thức bằng cấu trúc dữ liệu dùng để lưu trữ và xử lý trong máy tính;

Cơ sở kiến ​​thức về phương tiện lưu trữ máy.

Kiến thức là gì? Hãy đưa ra một số định nghĩa.

Từ điển giải thích của S. I. Ozhegov: 1) “Tri thức là sự lĩnh hội hiện thực bằng ý thức, khoa học”; 2) "Tri thức là một tập hợp thông tin, kiến ​​thức trong bất kỳ lĩnh vực nào."

Định nghĩa của thuật ngữ "tri thức" bao gồm hầu hết các yếu tố triết học. Ví dụ, tri thức là kết quả được thực hành kiểm nghiệm của nhận thức về thực tại, sự phản ánh đúng đắn của nó trong tâm trí con người.

Tri thức là kết quả có được do nhận thức về thế giới xung quanh và các đối tượng của nó. Trong những tình huống đơn giản nhất, kiến ​​thức được coi như một tuyên bố về các sự kiện và mô tả của chúng.

Các nhà nghiên cứu AI đang đưa ra các định nghĩa cụ thể hơn về kiến ​​thức.

"Kiến thức là các quy luật của lĩnh vực chủ đề (nguyên tắc, kết nối, định luật) thu được từ hoạt động thực tế và kinh nghiệm nghề nghiệp, cho phép các chuyên gia đặt ra và giải quyết các vấn đề trong lĩnh vực này".

"Kiến thức là dữ liệu có cấu trúc tốt hoặc dữ liệu về dữ liệu hoặc siêu dữ liệu".

"Tri thức là thông tin được chính thức hóa được tham chiếu hoặc sử dụng trong quá trình suy luận".

Trong lĩnh vực hệ thống AI và kỹ thuật tri thức, định nghĩa của tri thức được liên kết với suy luận: tri thức là thông tin trên cơ sở đó quá trình suy luận được thực hiện, tức là Dựa trên thông tin này, có thể rút ra nhiều kết luận khác nhau từ dữ liệu có sẵn trong hệ thống bằng cách sử dụng suy luận. Cơ chế suy luận cho phép bạn liên kết các đoạn riêng biệt với nhau và sau đó rút ra kết luận về chuỗi các đoạn được kết nối này.

Kiến thức là thông tin được chính thức hóa được tham chiếu hoặc sử dụng trong quá trình suy luận (Hình 5.1.).


Cơm. 5.1. Quá trình suy luận trong IS

Theo kiến ​​thức, chúng tôi muốn nói đến tổng thể của các dữ kiện và quy tắc. Khái niệm quy tắc đại diện cho một mảng kiến ​​thức có dạng:

Nếu<условие>sau đó<действие>.

Định nghĩa này là một trường hợp đặc biệt của định nghĩa trước.

Tuy nhiên, người ta thừa nhận rằng các đặc điểm định tính khác biệt của tri thức là do chúng có cơ hội lớn theo hướng cấu trúc và liên kết với nhau của các đơn vị cấu thành, khả năng diễn giải của chúng, sự hiện diện của các thước đo, tính toàn vẹn của chức năng và hoạt động.

Có nhiều cách phân loại kiến ​​thức. Theo quy luật, với sự trợ giúp của phân loại, kiến ​​thức của các lĩnh vực chủ đề cụ thể được hệ thống hóa. Ở cấp độ xem xét trừu tượng, chúng ta có thể nói về các đặc điểm mà kiến ​​thức được phân chia, chứ không phải về phân loại. Theo bản chất của nó, kiến ​​thức có thể được chia thành khai báo và thủ tục.

Kiến thức so sánh là sự mô tả các sự kiện và hiện tượng, xác định sự có mặt hay vắng mặt của các sự kiện đó, đồng thời cũng bao gồm các mô tả về các mối liên hệ và mẫu chính trong đó các sự kiện và hiện tượng này được đưa vào.

Tri thức thủ tục là sự mô tả các hành động có thể thực hiện được khi vận dụng các sự kiện và hiện tượng để đạt được các mục tiêu đã định.

Để mô tả kiến ​​thức ở cấp độ trừu tượng, người ta đã phát triển các ngôn ngữ đặc biệt - ngôn ngữ mô tả tri thức. Các ngôn ngữ này cũng được chia thành các ngôn ngữ kiểu thủ tục và kiểu khai báo. Tất cả các ngôn ngữ mô tả tri thức hướng đến việc sử dụng máy tính kiến ​​trúc von Neumann truyền thống đều là ngôn ngữ thủ tục. Sự phát triển của các ngôn ngữ khai báo phù hợp với biểu diễn tri thức là một vấn đề thực tế của ngày nay.

Theo phương pháp thu nhận kiến ​​thức, nó có thể được chia thành sự kiện và phương pháp heuristics (các quy tắc cho phép bạn đưa ra lựa chọn trong trường hợp không có các biện minh lý thuyết chính xác). Loại kiến ​​thức đầu tiên thường chỉ ra các tình huống nổi tiếng trong lĩnh vực chủ đề. Loại kiến ​​thức thứ hai dựa trên kinh nghiệm bản thân của một chuyên gia làm việc trong một lĩnh vực chuyên môn cụ thể, được tích lũy từ kết quả của nhiều năm thực hành.

Theo kiểu biểu diễn, kiến ​​thức được chia thành các dữ kiện và quy tắc. Dữ kiện là kiến ​​thức thuộc loại “A là A”, kiến ​​thức đó là điển hình cho cơ sở dữ liệu và mô hình mạng. Các quy tắc, hoặc sản phẩm, là kiến ​​thức về loại "NẾU A, THÌ B".

Ngoài các dữ kiện và quy tắc, còn có kiến ​​thức tổng hợp - kiến ​​thức về kiến ​​thức. Chúng cần thiết để quản lý tri thức và tổ chức hiệu quả các thủ tục suy luận.

Hình thức biểu diễn tri thức có tác động đáng kể đến các đặc điểm của IMS. Cơ sở tri thức là mô hình tri thức của con người. Tuy nhiên, tất cả kiến ​​thức mà một người thu hút được trong quá trình giải quyết các vấn đề phức tạp không thể được mô hình hóa. Do đó, trong các hệ thống thông minh, cần phải tách biệt rõ ràng kiến ​​thức thành kiến ​​thức dành cho máy tính xử lý và kiến ​​thức được sử dụng bởi con người. Rõ ràng, để giải quyết các vấn đề phức tạp, cơ sở tri thức phải có một khối lượng đủ lớn, và do đó các vấn đề về quản lý một cơ sở dữ liệu như vậy chắc chắn sẽ nảy sinh. Do đó, khi lựa chọn mô hình biểu diễn tri thức, các yếu tố như tính đồng nhất của biểu diễn và tính dễ hiểu cần được tính đến. Sự đồng nhất của cách trình bày dẫn đến việc đơn giản hóa cơ chế quản lý tri thức. Sự dễ hiểu rất quan trọng đối với người dùng các hệ thống thông minh và các chuyên gia có kiến ​​thức được nhúng trong IIS. Nếu dạng biểu diễn tri thức khó hiểu, thì quá trình thu nhận và giải thích tri thức trở nên phức tạp hơn. Cần lưu ý rằng khá khó để đáp ứng đồng thời những yêu cầu này, đặc biệt là trong các hệ thống lớn, nơi mà việc cấu trúc và biểu diễn theo mô-đun của tri thức trở nên không thể tránh khỏi.

Việc giải quyết các vấn đề của kỹ thuật tri thức đặt ra vấn đề chuyển đổi thông tin nhận được từ các chuyên gia dưới dạng dữ kiện và quy tắc sử dụng chúng thành dạng có thể được thực hiện hiệu quả trong máy xử lý thông tin này. Với mục đích này, nhiều mô hình biểu diễn tri thức khác nhau đã được tạo ra và sử dụng trong các hệ thống hiện có.

Các mô hình cổ điển của biểu diễn tri thức bao gồm các mô hình mạng logic, sản xuất, khung và ngữ nghĩa.

Mỗi mô hình có ngôn ngữ biểu diễn tri thức riêng. Tuy nhiên, trong thực tế, hiếm khi có thể sử dụng được cùng với khuôn khổ của một mô hình khi phát triển IIS, ngoại trừ những trường hợp đơn giản nhất, do đó, việc biểu diễn tri thức trở nên khó khăn. Ngoài việc biểu diễn kết hợp sử dụng các mô hình khác nhau, các công cụ đặc biệt thường được sử dụng để phản ánh các đặc điểm của kiến ​​thức cụ thể về lĩnh vực chủ đề, cũng như các cách khác nhau để loại bỏ và tính đến sự mờ nhạt và không đầy đủ của kiến ​​thức.

Tranh luận về sự khác biệt giữa thông tin và dữ liệu, bạn bất giác tự hỏi liệu chúng có điểm chung nào không?
Chúng ta thường thay thế từ này bằng từ khác trong bài phát biểu mà chúng ta không nhận thấy rằng câu nói của chúng ta trở nên vô lý như thế nào. Để không rơi vào tình huống ngớ ngẩn, bạn nên tìm hiểu ý nghĩa của từng thứ.
Có một mối liên hệ chặt chẽ giữa dữ liệu và thông tin đến nỗi sự tồn tại của cái này mà không có cái kia là không thể hoặc đơn giản là vô nghĩa.
Dữ liệu là cơ sở của thông tin. Trên thực tế, chúng chỉ là một tập hợp các ký tự. Nhưng sau khi chúng trải qua hoạt động giải thích của một hệ thống nhận thức nhất định, dữ liệu sẽ trở thành thông tin.

Tình trạng xuất hiện

Vì vậy, thông tin chỉ phát sinh khi có một nguồn nhất định chứa dữ liệu và trực tiếp là người nhận. Dữ liệu có thể được chuyển đổi thành thông tin theo một số cách: thông qua đếm, hiệu chỉnh, nén, ngữ cảnh hóa và phân loại.
Dữ liệu là thông tin cố định trên một số nguồn. Gần đây, lượng dữ liệu đã đạt mức tăng trưởng đáng kinh ngạc. Điều này là do sự phát triển nhanh chóng của Internet.

Đo đạc

Dữ liệu không thể được đo lường. Ngay sau khi chúng tôi bắt đầu đếm dữ liệu, quá trình xử lý sẽ bắt đầu. Điều này có nghĩa là dữ liệu sẽ tự động đi vào danh mục "thông tin". Thông tin có thể được đo lường. Để làm được điều này, chỉ cần đánh giá mức độ hiểu biết trước và sau khi tiếp nhận thông tin là đủ.

Kết quả chuyển đổi

Bộ não con người, giống như một máy tính tiên tiến nhất, xử lý dữ liệu mà chúng ta nhận được và tạo ra một số thông tin. Và khi cần phải áp dụng nó vào một quá trình suy nghĩ khác, thì đối với anh ta, thông tin này, đến lượt nó, trở thành dữ liệu mà từ đó thông tin mới sẽ được thu thập.
Tri thức trở thành giai đoạn cuối cùng của sự biến đổi thông tin đã trải qua nhiều quá trình xử lý trong một khoảng thời gian nhất định.

Do đó, ImGist nêu bật những điểm khác biệt chính sau đây giữa thông tin và dữ liệu:

Dữ liệu và thông tin có liên quan chặt chẽ với nhau.
Dữ liệu là cố định, chúng thực sự tồn tại trong từng đơn vị thời gian. Thông tin chỉ phát sinh khi xử lý các dữ liệu này.
Dữ liệu sau khi biến đổi trở thành thông tin. Thông tin được kiểm chứng nhiều lần là kiến ​​thức.
Thông tin, không giống như dữ liệu, là một chất có thể đo lường được.

Ở phần đầu của chương này, cần nhấn mạnh sự khác biệt giữa các khái niệm dữ liệu và thông tin. Có một sự khác biệt đáng kể giữa chúng. Theo lý thuyết thông tin, dữ liệu nên được hiểu là tất cả những thông tin được thu thập và những thông tin đặc biệt quan trọng được xử lý đặc biệt để chiết xuất từ ​​chúng (bao gồm cả sự trợ giúp của tính toán) chỉ những thông tin cần thiết và hữu ích. để giải quyết một vấn đề nhất định. nhiệm vụ cụ thể. Dữ liệu được xử lý này sẽ tạo thành thông tin. Thông tin thô được gọi là dữ liệu. Vì vậy, ở đây có thể ví von như vậy - dữ liệu có thể được ví như một loại quặng nào đó, và thông tin có thể được ví như những chất hữu ích được chiết xuất từ ​​nó. Dữ liệu luôn gắn liền với sự dư thừa thông tin, trong khi thông tin luôn gắn liền với sự đầy đủ cần thiết. Nói cách khác, thông tin là thứ góp phần nâng cao tri thức, nó luôn mang dấu ấn của tính mới, đại diện cho thông tin mới. Nhưng nếu bạn tập trung vào nghiên cứu thị trường, thông tin không chỉ là thông tin mới. Cuối cùng, đây là thông tin mới được các dịch vụ liên quan (chuyên gia) nhận thức và đánh giá về việc thực hiện các hành động chuyên môn cụ thể.

Truyền dữ liệu và xuất hiện thông tin

Nhiều phép biến đổi dữ liệu trên đường chuyển đổi chúng thành thông tin có thể được truy tìm theo sơ đồ do Giáo sư E.G. Yasin (Hình 5.1).

Theo sơ đồ này, một số phần dữ liệu trên đường đến người nhận ban đầu bị mất trong các kênh truyền dẫn vật lý của chúng dưới dạng cái gọi là nhiễu vật lý (ví dụ: khi thực hiện một cuộc khảo sát trong nghiên cứu tiếp thị, một số bảng câu hỏi đã chuyển được điền không chính xác và chúng bị loại bỏ khỏi quy trình xử lý sắp tới). Dữ liệu đã đến tay người nhận (đã nhận) có thể không được người đó hiểu đầy đủ và nhận thức được do trình độ kiến ​​thức không đầy đủ. Dữ liệu bị hiểu nhầm và không được nhận thức được truyền qua ý thức của người nhận dưới dạng nhiễu ngữ nghĩa. Và cuối cùng, từ dữ liệu được người nhận cảm nhận, một số phần có thể đơn giản bị anh ta bỏ qua do thực tế là nó thừa hoặc đơn giản là không phù hợp với các nhiệm vụ đang được giải quyết. Dưới dạng nhiễu thực dụng, phần thông điệp này cũng đi qua ý thức của người nhận. Phần còn lại của dữ liệu thực sự là thông tin có thể được sử dụng để giải quyết các vấn đề thực tế. Rõ ràng là ở giai đoạn đánh giá, theo sơ đồ của Yasin, quá trình xử lý dữ liệu diễn ra, các thủ tục tính toán cần thiết, so sánh, v.v. được thực hiện.

Trong thực tế, các khái niệm về dữ liệu và thông tin thường được đồng nhất với nhau, tức là thay thế cái này cho cái kia, điều này không cải thiện sự hiểu biết lẫn nhau giữa các nhà nghiên cứu thị trường và khách hàng của nghiên cứu đó khi ký kết hợp đồng giữa họ để thực hiện nghiên cứu tiếp thị. Nhưng đôi khi việc nhận dạng như vậy khá dễ chấp nhận. Trong cuốn sách này, khái niệm thông tin sẽ được sử dụng thường xuyên hơn nhiều so với khái niệm dữ liệu, mặc dù đôi khi tác giả sẽ sử dụng khái niệm dữ liệu. Lời giải thích ở đây rất đơn giản: đó là tất cả về truyền thống lâu đời. Trong tiếp thị, khi nói về sự biện minh của các quyết định, thuật ngữ thông tin thường được sử dụng nhiều hơn, ngay cả khi nói đến việc lựa chọn thông tin cần thiết (tức là thông tin thực tế) cho sự biện minh này từ các mảng lớn của chúng (tức là từ các mảng dữ liệu). Và thuật ngữ dữ liệu được sử dụng chủ yếu để thu thập ban đầu của bất kỳ thông tin nào. Không có mâu thuẫn lớn trong lý thuyết thông tin ở đây, và do đó truyền thống đã được thiết lập không bị vi phạm.

Thông tin- thông tin về các đối tượng và hiện tượng của môi trường, các thông số, tính chất và trạng thái của chúng, làm giảm mức độ không chắc chắn và không đầy đủ của kiến ​​thức về chúng.

Nguồn (nhà cung cấp) và người tiêu dùng (người nhận) thông tin.

Thuật ngữ thông tin xuất phát từ tiếng Latinh thông tin, có nghĩa là làm rõ, nhận thức, trình bày. Theo nghĩa rộng thông tinđược định nghĩa là thông tin (thông điệp) về mặt này hoặc mặt khác của thế giới vật chất và các quá trình. Thông điệp là một dạng biểu diễn thông tin dưới dạng lời nói, văn bản, hình ảnh, dữ liệu số, đồ thị, bảng, v.v.

Thông tin- Đây là một khái niệm khoa học tổng quát bao gồm sự trao đổi thông tin giữa con người, sự trao đổi tín hiệu giữa thiên nhiên hữu hình và vô tri, con người và thiết bị.

Cần nhớ rằng: thông tin tồn tại bên ngoài người tạo ra nó; thông tin sẽ trở thành một thông điệp ngay khi nó được thể hiện bằng một ngôn ngữ cụ thể.

Cùng với khái niệm "thông tin", khái niệm thường được sử dụng dữ liệu. Dữ liệu có thể được coi là những dấu hiệu hoặc những quan sát được ghi lại, vì một lý do nào đó không được sử dụng mà chỉ được lưu trữ. Ở trong

nếu có thể sử dụng dữ liệu này để giảm bớt sự không chắc chắn về một điều gì đó, dữ liệu sẽ biến thành thông tin. Do đó, có thể lập luận rằng thông tin là dữ liệu được sử dụng .

Thông tin là dữ liệu có cấu trúc.

Thông tin(trong sinh học) = Sinh học nghiên cứu động vật hoang dã và khái niệm "thông tin" gắn liền với hành vi thích hợp của các sinh vật sống. Trong cơ thể sống, thông tin được truyền và lưu trữ bằng cách sử dụng các đối tượng có bản chất vật lý khác nhau (trạng thái DNA), được coi là dấu hiệu của bảng chữ cái sinh học. Thông tin di truyền được kế thừa và lưu trữ trong tất cả các tế bào của cơ thể sống.

Thông tin(trong triết học) = nó là tương tác, phản ánh, kiến ​​thức.

Thông tin(trong điều khiển học) = đây là các đặc tính của tín hiệu điều khiển được truyền qua đường truyền thông.

Có thể phân biệt các cách tiếp cận định nghĩa thông tin sau:

- truyên thông(phổ biến) được sử dụng trong khoa học máy tính: Thông tin- Đây là thông tin, kiến ​​thức, thông điệp về trạng thái của sự việc mà một người nhận thức được từ thế giới bên ngoài với sự trợ giúp của các giác quan (thị giác, thính giác, vị giác, khứu giác, xúc giác).

- xác suất- được sử dụng trong lý thuyết thông tin: Thông tin- đây là thông tin về các đối tượng và hiện tượng của môi trường, các thông số, tính chất và trạng thái của chúng, làm giảm mức độ không chắc chắn và không đầy đủ của kiến ​​thức về chúng.

Thông tin được lưu trữ, truyền và xử lý dưới dạng ký hiệu (ký hiệu). Các thông tin giống nhau có thể được trình bày dưới các hình thức khác nhau:

1) Chữ viết có dấu, bao gồm các ký tự khác nhau, trong đó ký tự ký hiệu được phân biệt dưới dạng văn bản, số, ký tự đặc biệt. ký hiệu; đồ họa; dạng bảng, v.v.

2) Dưới dạng cử chỉ hoặc tín hiệu.

3) Ở dạng lời nói miệng (hội thoại).

Việc trình bày thông tin được thực hiện với sự trợ giúp của ngôn ngữ, như các hệ thống ký hiệu, được xây dựng trên cơ sở bảng chữ cái và có quy tắc thực hiện các thao tác trên biển báo.

Ngôn ngữ- một hệ thống ký hiệu nhất định để trình bày thông tin.

ngôn ngữ tự nhiên- ngôn ngữ nói và viết. Trong một số trường hợp, ngôn ngữ nói có thể được thay thế bằng ngôn ngữ của nét mặt và cử chỉ, ngôn ngữ của các dấu hiệu đặc biệt (ví dụ, biển báo);

Ngôn ngữ trang trọng- các ngôn ngữ đặc biệt cho các lĩnh vực hoạt động khác nhau của con người, được đặc trưng bởi một bảng chữ cái cố định cứng nhắc, các quy tắc ngữ pháp và cú pháp nghiêm ngặt hơn. Đó là ngôn ngữ của âm nhạc (nốt nhạc), ngôn ngữ toán học (số, ký hiệu toán học), hệ thống số, ngôn ngữ lập trình, v.v.

Trọng tâm của bất kỳ ngôn ngữ nào là bảng chữ cái- ký tự / bộ ký tự.

Tổng số ký tự trong bảng chữ cái được gọi là sức mạnh của bảng chữ cái.

Hãng thông tin- một phương tiện hoặc một cơ thể vật chất để truyền, lưu trữ và tái tạo thông tin. Đó là tín hiệu điện, ánh sáng, nhiệt, âm thanh, vô tuyến, đĩa từ tính và laze, ấn phẩm in, ảnh, v.v.