Чем проявляется различие между информацией и данными. Понятия информации, даваемые различными науками

В самом начале этой главы необходимо подчеркнуть разли чия между понятиями данные и информация. Между ними есть разница и довольно существенная. Согласно теории информации под данными следует понимать все те сведения, которые собираются и, что особенно важно, подвергаются специальной обработ ке с целью вьщеления из них (в том числе и с помощью расчетов) только тех сведений, которые окажутся необходимыми и полезны ми для решения данной конкретной задачи. Эти обработанные данные будут представлять собой информацию. А необработан ные сведения принято называть данными. Таким образом - подобная аналогия здесь вполне уместна - данные можно уподобить какой-либо руде, а информацию - добытым из нее полезным веществам. Данные всегда ассоциируют с избытком сведений, информацию же - с необходимой достаточностью. Информация, другими словами,- это то, что способствует приращению знаний, она всегда несет на себе печать новизны, представляет собой новые сведения. Но если сосредоточиться на маркетинговых исследова ниях, информация - это не любые новые сведения. В конечном итоге - это такие новые сведения, которые восприняты и оцене ны соответствующими службами (специалистами) для совершения конкретных профессиональных действий.

Передача данных и появление информации

Многочисленные трансформации данных на пути их превращения в информацию можно проследить по схеме, предложенной профессором Е.Г. Ясиным (рис. 5.1).

Согласно этой схеме какая-то часть данных на пути движения к получателю первоначально теряется в физических каналах их передачи в форме так называемого физического шума (например, при проведении анкетирования в маркетинговых исследованиях некоторые анкеты оказались неправильно заполненными и их изымают из предстоящей обработки). Дошедшие до получателя данные (принятые) могут быть не все поняты им и восприняты в силу, допустим, недостаточного уровня знаний. Непонятые и невоспринятые данные проходят мимо сознания получателя в форме семантического шума. И наконец, из воспринятых получателем данных некоторая часть может быть просто им проигнорирована из-за того, что окажется излишней или просто непригодной для решаемых задач. В форме прагматического шума эта часть сообщений также проходит мимо сознания получателя. Оставшаяся часть данных и представляет собой собственно информацию, которая может быть использована в решении практических задач. Ясно, что на этапе оценки, по схеме Ясина, происходит и обработка данных, производятся необходимые вычислительные процедуры, сравнения и т.п.

На практике понятия данные и информация часто отождествляют между собой, т.е. подменяют одно другим, что не способствует улучшению взаимопонимания между, допустим, исследователями рынка и заказчиками такого исследования при заключении между ними контрактов на проведение маркетинговых исследований. Но иногда такие отождествления вполне допустимы. В данной книге понятие информация будет применяться значительно чаще, чем понятие данные, хотя иногда автор воспользуется и понятием данные. Объяснение здесь простое: все дело в сложившихся традициях. В маркетинге, когда говорят об обосновании решений, чаще применяют термин информация, даже если речь идет о выборе для этого обоснования необходимых сведений (т.е. собственно информации) из их больших массивов (т.е. из массивов данных). А термин данные применяют в основном при первоначальном сборе любых сведений. Большого противоречия теории информации здесь нет, а поэтому сложившаяся традиция не нарушается.

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.

  • · Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;
  • · Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).
  • 1. Данные и информация тесно взаимосвязаны.
  • 2. Данные фиксированы, они реально существуют в каждую единицу времени. Информация возникает только при переработке этих данных.
  • 3. Данные после преобразования становятся информацией. Многократно проверенная информация - знания.
  • 4. Информация, в отличие от данных, субстанция измеряемая.

Моделирование процесса принятия управленческих решений позволяет сделать значительный шаг в сторону количественных оценок и количественного анализа результатов принимаемых решений. Создание и использование моделей процесса принятия решений позволяет даже качественно оцениваемые управленческие ситуации оценивать количественно с помощью специально вводимых вербальночисловых шкал.

Использование моделирования процесса принятия управленческих решений позволяет поднять его на качественно новый уровень, разработать и внедрить в практику принятия управленческих решений современные технологии. Именно профессиональное использование моделей процесса принятия решения позволяет руководителю организации контролировать свою интуицию и обеспечивать большую степень непротиворечивости, согласованности и надежности принимаемых управленческих решений. Но с другой стороны, использование моделей позволяет более полно реализовать интуицию, опыт и знания лица, принимающего решение. Необходимо понимать, что модель позволяет найти рациональное решение лишь для того упрощенного варианта ситуации принятия решения, которое используется в модели.

Выделяют три базовых типа моделей: физическая, аналоговая и математическая

Физическая (описательная или портретная) - изображает предмет или ситуацию, показывая как она выглядит. Например: копии автомобилей, самолетов, уменьшенное чертежи завода и т др.

Аналоговая - изображение предмета, или ситуации другими средствами Например: озеро на карте - голубым цветом организационная схема; графики соотношение различных показателей деятельности предприятия

Математическая (символьная) - использование символов для характеристики объекта в виде математических уравнений

На основе этих базовых моделей разрабатываются различные типы моделей и методов принятия управленческих решений. Рассмотрим самые распространенные из них

Теория игр - используется для оценки влияния принятого решения на конкурентов. В бизнесе игровые модели используются для прогнозирования реакции конкурентов на изменение цен, сбыта, новую продукцию Эта модель рустоваться достаточно редкий.

Теория очередей, или оптимального обслуживания - используется для определения оптимального количества каналов обслуживания потребителей относительно их потребностям. Принципиальной проблемой считается уравновешивания расходов на дополнительные каналы обслуживаниями и потерь от обслуживания на уровне ниже, чем оптимальная.

Модель управления запасами - используются для определения времени размещения заказов на ресурсы и их количества, а также массы готовой продукции на складах Цель модели - сведение к минимуму потерь от недостачи или чрезмерного с обеспечения запасами.

Модель линейного программирования - используют для определения оптимального способа распределения дефицитных ресурсов при наличии конкурирующих потребностей (планирование дифференциации услуг, распределение работников и т.д.)

Имитационное моделирование - имитация конкретного процесса или модели, ее экспериментальное использование для определения изменений реальной ситуации

Экономический анализ - оценка издержек, прибыли и рентабельности предприятия часто используют метод безубыточности, т.е. определение момента с которого предприятие становится безубыточным

5.1. Отличия знаний от данных

Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области. При этом возникает естественный вопрос, что такое знания и чем они отличаются от обычных данных, об­рабатываемых ЭВМ.

Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной облас­ти, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

Исходная форма существования данных (результаты наблю­дений и измерений, таблицы, справочники, диаграммы, графики и т.д.);

Представление на специальных языках описания данных, предназначенных для ввода и обработки исходных данных в ЭВМ;

Базы данных на машинных носителях информации.

Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда на­зывают структурированными данными. Знания могут быть полу­чены на основе обработки эмпирических данных. Они представ­ляют собой результат мыслительной деятельности человека, на­правленной на обобщение его опыта, полученного в результате практической деятельности.

Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два основных способа наделения знаниями программных систем. Первый - по­местить знания в программу, написанную на обычном языке про­граммирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. Несмотря на то что основная задача будет решена, в этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Нелегким делом яв­ляются модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой.

Второй способ базируется на концепции баз данных и заклю­чается в вынесении знаний в отдельную категорию, т.е. знания представляются в определенном формате и помещаются в БЗ. Ба­за знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, реализованный в логическом блоке, а также средства ведения диалога накладывают определенные ограниче­ния на структуру БЗ и операции с нею. В современных ИИС при­нят этот способ.

Следует заметить, что для того, чтобы поместить знания в компьютер, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки ин­теллектуальной системы. Следовательно, при разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем зна­ния представляются определенными структурами данных, удоб­ными для хранения и обработки в ЭВМ. Знания в ИИС сущест­вуют в следующих формах:

Исходные знания (правила, выведенные на основе практи­ческого опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением време­ни; функции, диаграммы, графы и т. д.);

Описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или про­дукционных правил, семантическая сеть, фреймы и т. п.);

Представление знаний структурами данных, которые пред­назначены для хранения и обработки в ЭВМ;

Базы знаний на машинных носителях информации.

Что же такое знания? Приведем несколько определений.

Из толкового словаря С. И. Ожегова: 1) «Знание - постиже­ние действительности сознанием, наука»; 2) «Знание - это сово­купность сведений, познаний в какой-либо области».

Определение термина «знания» включает в себя большей частью философские элементы. Например, знание - это проверенный практикой результат познания действительности, верное ее отображение в сознании человека.

Знание есть результат, полученный познанием окружающего мира и его объектов. В простейших ситуациях знания рассматривают как констатацию фактов и их описание.

Исследователями в области ИИ даются более конкретные оп­ределения знаний.

«Знания - это закономерности предметной области (принци­пы, связи, законы), полученные в результате практической дея­тельности и профессионального опыта, позволяющие специали­стам ставить и решать задачи в этой области» .

«Знания - это хорошо структурированные данные или дан­ные о данных, или метаданные» .

«Знания - формализованная информация, на которую ссы­лаются или используют в процессе логического вывода» .

В области систем ИИ и инженерии знаний определение знаний увязывается с логическим выводом: знания - это информация, на основании которой реализуется процесс логического вывода, т.е. на основании этой информации можно делать различные заключения по имеющимся в системе данным с помощью логического вывода. Механизм логического вывода позволяет связывать воедино отдельные фрагменты, а затем на этой последовательности связанных фрагментов делать заключение.

Знания - это формализованная информация, на которую ссылаются или которую используют в процессе логического вывода (рис. 5.1.).


Рис. 5.1. Процесс логического вывода в ИС

Под знанием будем понимать совокупность фактов и правил. Понятие правила, представляющего фрагмент знаний, имеет вид:

Если <условие> то <действие>.

Это определение есть частный случай предыдущего определения.

Однако признается, что отличительные качественные особенности знаний обусловлены наличием у них больших возможностей в направлении структурирования и взаимосвязанности составных единиц, их интерпретируемости, наличие метрики, функциональной целостности, активности.

Существует множество классификаций знаний. Как правило, с помощью классификаций систематизируют знания конкретных предметных областей. На абстрактном уровне рассмотрения можно говорить о признаках, по которым подразделяются зна­ния, а не о классификациях. По своей природе знания можно разделить на декларативные и процедурные.

Декларативные знания представляют собой описания фактов и явлений, фиксируют наличие или отсутствие таких фактов, а также включают описания основных связей и закономерностей, в которые эти факты и явления входят.

Процедурные знания - это описания действий, которые воз­можны при манипулировании фактами и явлениями для дости­жения намеченных целей.

Для описания знаний на абстрактном уровне разработаны специальные языки - языки описания знаний. Эти языки также делятся на языки процедурного типа и декларативного. Все языки описания знаний, ориентированные на использование тради­ционных компьютеров фон-неймановской архитектуры, являют­ся языками процедурного типа. Разработка языков декларатив­ного типа, удобных для представления знаний, является актуаль­ной проблемой сегодняшнего дня.

По способу приобретения знания можно разделить на факты и эвристику (правила, которые позволяют сделать выбор при отсут­ствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной пред­метной области обстоятельства. Вторая категория знаний осно­вана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики.

По типу представления знания делятся на факты и правила, Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции, - это знания типа «ЕСЛИ А, ТО В».

Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффектив­ной организации процедур логического вывода.

Форма представления знаний оказывает существенное влия­ние на характеристики ИИС. Базы знаний являются моделями человеческих знаний. Однако все знания, которые привлекает человек в процессе решения сложных задач, смоделировать не­возможно. Поэтому в интеллектуальных системах требуется чет­ко разделить знания на те, которые предназначены для обработ­ки компьютером, и знания, используемые человеком. Очевидно, что для решения сложных задач БЗ должна иметь достаточно большой объем, в связи с чем неизбежно возникают проблемы управления такой базой. Поэтому при выборе модели представ­ления знаний следует учитывать такие факторы, как однород­ность представления и простота понимания. Однородность пред­ставления приводит к упрощению механизма управления знани­ями. Простота понимания важна для пользователей интеллекту­альных систем и экспертов, чьи знания закладываются в ИИС. Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации зна­ний. Следует заметить, что одновременно выполнить эти требо­вания довольно сложно, особенно в больших системах, где неиз­бежным становится структурирование и модульное представле­ние знаний.

Решение задач инженерии знаний выдвигает проблему преобразования информации, полученной от экспертов в виде фактов и правил их использования, в форму, которая может быть эффективно реализована при машинной обработке этой информации. С этой целью созданы и используются в действующих системах различные модели представления знаний.

К классическим моделям представления знаний относятся логи­ческая, продукционная, фреймовая и модель семантической сети.

Каждой модели отвечает свой язык представления знаний. Однако на практике редко удается обойтись рамками одной мо­дели при разработке ИИС за исключением самых простых случа­ев, поэтому представление знаний получается сложным. Кроме комбинированного представления с помощью различных моде­лей, обычно используются специальные средства, позволяющие отразить особенности конкретных знаний о предметной области, а также различные способы устранения и учета нечеткости и не­полноты знаний.

Информация - это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состояниях, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Данные – это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию. Становятся информацией, когда используются

2.Свойства информации: объективность, достоверность, полнота, актуальность, адекватность, доступность.

Свойства информации:

  1. Объективность информации. Объективный – существующий вне и независимо от человеческого сознания. Информация – это отражение внешнего объективного мира. Информация объективна, если она не зависит от методов ее фиксации, чьего-либо мнения, суждения. Пример. Сообщение «На улице тепло» несет субъективную информацию, а сообщение «На улице 22°С» – объективную. Объективную информацию можно получить с помощью исправных датчиков, измерительных приборов. Отражаясь в сознании человека, информация может искажаться в зависимости от мнения, суждения, опыта, знаний конкретного субъекта, и, таким образом, перестать быть объективной.
  2. Достоверность информации. Информация достоверна, если она отражает истинное положение дел. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Достоверная информация помогает принять нам правильное решение. Недостоверной информация может быть по следующим причинам:
  • преднамеренное или непреднамеренное искажение субъективного свойства;
  • искажение в результате воздействия помех и недостаточно точных средств ее фиксации.
  • Полнота информации. Информацию можно назвать полной, если ее достаточно для понимания и принятия решений. Неполная информация может привести к ошибочному выводу или решению.
  • Актуальность информации – это степень соответствия информации текущему моменту времени Только вовремя полученная информация может быть полезна.
  • Адекватность информации - это степень соответствия реальному объективному состоянию дела. Неадекватная информация может образовываться при создании новой информации на основе неполных или недостоверных данных. Однако и полные, и достоверные данные могут приводить к созданию неадекватной информации в случае применения к ним неадекватных методов.
  • Доступность информации- мера возможности получить ту или иную информа­цию. На степень доступности информации влияют одновременно как доступность данных, так и доступность адекватных методов для их интерпретации. Отсутствие доступа к данным или отсутствие адекватных методов обработки данных приводят к одинаковому результату: информация оказывается недоступной.
  •