Абстрактный тип данных общие положения о данных абстрактный. Абстрактные классы и члены классов

Разработка абстрактных моделей для данных и способов обработки этих данных является важнейшим компонентом в процессе решения задач с помощью компьютера. Примеры этого мы видим и на низком уровне в повседневном программировании (например, при использовании массивов и связных списков, рассмотренных в ), и на высоком уровне при решении прикладных задач (как при решении задачи связности с помощью леса объединение-поиск в "Введение"). В настоящей лекции рассматриваются абстрактные типы данных ( abstract data type , в дальнейшем АТД), позволяющие создавать программы с использованием высокоуровневых абстракций. Абстрактные типы данных позволяют отделять абстрактные (концептуальные) преобразования, которые программы выполняют над данными, от любого конкретного представления структуры данных и любой конкретной реализации алгоритма.

Все вычислительные системы основаны на уровнях абстракции: определенные физические свойства кремния и других материалов позволяют принять абстрактную модель бита, который может принимать двоичные значения 0-1; затем на динамических свойствах значений определенного набора битов строится абстрактная модель машины; далее, на основе принципа работы машины под управлением программы на машинном языке строится абстрактная модель языка программирования; и, наконец, строится абстрактное понятие алгоритма, реализуемое в виде программы на языке C++. Абстрактные типы данных дают возможность продолжать этот процесс дальше и разрабатывать абстрактные механизмы для определенных вычислительных задач на более высоком уровне, чем это обеспечивается системой C++, разрабатывать абстрактные механизмы , ориентированные на конкретные приложения и подходящие для решения задач в многочисленных прикладных областях, а также создавать абстрактные механизмы более высокого уровня, в которых используются эти базовые конструкции. Абстрактные типы данных предоставляют в наше распоряжение расширяемый до бесконечности набор инструментальных средств для решения все новых и новых задач.

С одной стороны, применение абстрактных конструкций освобождает от забот по их детальной реализации; с другой стороны, когда производительность программы важна, необходимо знать затраты на выполнение базовых операций. Мы используем множество базовых абстракций, встроенных в аппаратные средства компьютера и служащих основой для машинных инструкций; реализуем другие абстракции в программном обеспечении; и используем дополнительные абстракции, предоставляемые написанным ранее системным программным обеспечением. Абстрактные конструкции высокого уровня часто создаются на основе более простых конструкций. На всех уровнях действует один и тот же основной принцип: необходимо найти наиболее важные операции в программах и наиболее важные характеристики данных, а затем точно определить те и другие на абстрактном уровне и разработать эффективные конкретные механизмы для их реализации. В настоящей лекции мы рассмотрим множество примеров применения этого принципа.

Для разработки нового уровня абстракции потребуется (1) определить абстрактные объекты, с которыми необходимо манипулировать, и операции , которые должны выполняться над ними; (2) представить данные в некоторой структуре данных и реализовать операции ; (3) и (самое главное) обеспечить, чтобы эти объекты было удобно использовать для решения прикладных задач. Эти пункты применимы и к простым типам данных, так что базовые механизмы для поддержки типов данных, которые были рассмотрены в "Элементарные структуры данных" , можно адаптировать для наших целей. Однако язык C++ предлагает важное расширение механизма структур, называемое классом ( class ). Классы исключительно полезны при создании уровней абстракции и поэтому рассматриваются в качестве основного инструмента, который используется для этой цели в оставшейся части книги.

Определение 4.1. Абстрактный тип данных (АТД) - это тип данных (набор значений и совокупность операций для этих значений), доступ к которому осуществляется только через интерфейс. Программу, которая использует АТД, будем называть клиентом, а программу, содержащую спецификацию этого типа данных - реализацией.

Именно слово только делает тип данных абстрактным: в случае АТД клиентские программы не имеют доступа к значениям данных никаким другим способом, кроме операций, описанных в интерфейсе. Представление этих данных и функции, реализующие эти операции , находятся в реализации и полностью отделены интерфейсом от клиента. Мы говорим, что интерфейс является непрозрачным: клиент не может видеть реализацию через интерфейс .

В программах на языке C++ это различие обычно проводится немного четче, так как проще всего создать интерфейс , включив в него представление данных , но указав, что клиентским программам не разрешен прямой доступ к данным. Другими словами, разработчики клиентских программ могут знать представление данных , но никоим образом не могут его использовать.

В качестве примера рассмотрим интерфейс типа данных для точек ( программа 3.3) из раздела 3.1 "Элементарные структуры данных" . В этом интерфейсе явно объявляется, что точки представлены как структуры, состоящие из пары чисел с плавающей точкой, обозначаемых x и у. Подобное применение типов данных является обычным в больших системах программного обеспечения: мы разрабатываем набор соглашений о представлении данных (а также определяем ряд связанных с ними операций) и делаем эти правила доступными через интерфейс , чтобы ими могли пользоваться клиентские программы, входящие в состав большой системы. Тип данных обеспечивает согласованность всех частей системы с представлением основных общесистемных структур данных. Какой бы хорошей такая стратегия ни была, она имеет один изъян: если необходимо изменить представление данных , то потребуется изменить и все клиентские программы. Программа 3.3 снова дает нам простой пример: одна из причин разработки этого типа данных - удобство работы клиентских программ с точками, и мы ожидаем, что в случае необходимости у клиентов будет доступ к отдельным координатам точки. Но мы не можем перейти к другому представлению данных (скажем, к полярным координатам, или трехмерным координатам, или даже к другим типам данных для отдельных координат) без изменения всех клиентских программ.

В отличие от этого, программа 4.1 содержит реализацию абстрактного типа данных, соответствующего типу данных из программы 3.3, но с использованием класса языка C++, в котором сразу определены как данные, так и связанные с ними операции . Программа 4.2 является клиентской программой, работающей с этим типом данных. Эти две программы выполняют те же самые вычисления, что и программы 3.3 и 3.8. Они иллюстрируют ряд основных свойств классов, которые мы сейчас рассмотрим.

Когда мы пишем в программе определение наподобие int i, мы указываем системе зарезервировать область памяти для данных (встроенного) типа int , к которой можно обращаться по имени i. В языке C++ для подобных сущностей имеется термин объект . При записи в программе такого определения, как POINT p, говорят, что создается объект класса POINT , к которому можно обращаться по имени p. В нашем примере каждый объект содержит два элемента данных, с именами x и у. Как и в случае структур, к ним можно обращаться по именам вроде p.y.

Элементы данных x и у называются данными-членами класса. В классе могут быть также определены функции-члены, которые реализуют операции , связанные с этим типом данных. Например, класс , определенный в программе 4.1, имеет две функции-члена с именами POINT и distance .

Клиентские программы, такие как программа 4.2, могут вызывать функции-члены, связанные с объектом, указывая их имена точно так же, как и имена данных, находящихся в какой-нибудь структуре struct. Например, выражение p.distance(q) вычисляет расстояние между точками p и q (такое же расстояние должен возвращать и вызов q.distance(p) ). Функция POINT() - первая функция в программе 4.1 - является особой функцией-членом, называемой конструктором: у нее такое же имя, как и у класса, и она вызывается тогда, когда требуется создать объект этого класса.

Программа 4.1. Реализация класса POINT (точка)

В этом классе определен тип данных , который состоит из набора значений, представляющих собой "пары чисел с плавающей точкой" (предполагается, что они интерпретируются как точки на декартовой плоскости), а также две функции-члена, определенные для всех экземпляров класса POINT : функция POINT() , которая является конструктором, инициализирующим координаты случайными значениями от 0 до 1, и функция distance(POINT) , вычисляющая расстояние до другой точки. Представление данных является приватным ( private ), и обращаться к нему или модифицировать его могут только функции-члены. Сами функции-члены являются общедоступными ( public ) и доступны для любого клиента. Код можно сохранить, например, в файле с именем POINT .cxx.

#include class POINT { private: float x, у; public: POINT() { x = 1.0*rand()/RAND_MAX; у = 1.0*rand()/RAND_MAX; } float distance(POINT a) { float dx = x-a.x, dy = y-a.y; return sqrt(dx*dx + dy*dy); } };

Программа 4.2. Программа-клиент для класса POINT (нахождение ближайшей точки)

Эта версия программы 3.8 является клиентом, который использует АТД POINT , определенный в программе 4.3. Операция new создает массив объектов POINT (вызывая конструктор POINT () для инициализации каждого объекта случайными значениями координат). Выражение a[i].distance(a[j]) вызывает для объекта a[i] функцию-член distance с аргументом a[j] .

#include #include #include "POINT.cxx" int main(int argc, char *argv) { float d = atof(argv); int i, cnt = 0, N = atoi(argv); POINT *a = new POINT[N]; for (i = 0; i < N; i++) for (int j = i+1; j < N; j++) if (a[i].distance(a[j]) < d) cnt+ + ; cout << cnt << " пар в радиусе " << d << endl; }

Определение POINT p в программе-клиенте приводит к выделению области памяти под новый объект и затем (с помощью функции POINT() ) к присвоению каждому из двух его элементов данных случайного значения в диапазоне от 0 до 1.

Этот стиль программирования, который иногда называется объектно-ориентированным программированием, полностью поддерживается конструкцией class языка C++. Класс можно считать расширением понятия структуры, где не только объединяются данные, но и определяются операции с этими данными. Может существовать много разных объектов, принадлежащих одному классу, но все они подобны в том, что их данные-члены могут принимать один и тот же набор значений, и с этими данными-чле-нами может выполняться одна и та же совокупность операций - в общем, это экземпляры одного и того же типа данных. В объектно-ориентированном программировании объекты предназначены для обработки своих данных-членов (в отличие от использования независимых функций для обработки данных, хранимых в объектах).

Мы рассматриваем описанный выше пример небольшого класса просто чтобы познакомиться с основными чертами классов; поэтому он далеко не полон. В реальном коде для класса точки у нас будет намного больше операций. Например, в программе 4.1 отсутствуют даже операции , позволяющие узнавать значения координат x и y . Как мы увидим, добавление этих и других операций - довольно простая задача. В части 5 мы более подробно рассмотрим классы для точки и других геометрических абстракций, например, линий и многоугольников.

В языке C++ (но не в С) у структур также могут быть связанные с ними функции. Ключевое различие между классами и структурами связано с доступом к информации, который характеризуется ключевыми словами

Тип данных описывает множество объектов со схожими свойствами. Все традиционные языки программирования используют набор базовых типов данных (real, integer, string, character). Базовые типы данных подчиняются предопределенному набору операций. Например, базовый тип данных integer позволяет выполнять такие операции, как сложение, вычитание, умножение, деление.

В традиционные языки программирования включаются конструкторы типов, самым распространенным из которых является конструктор record. Например, для записи типа CUSTOMER можно определить поля данных. Запись CUSTOMER будет представлять собой новый тип данных, в котором будет храниться информация о клиенте, можно напрямую получать доступ к этой структуре данных, ссылаясь на имена полей. Над записью можно выполнять такие операции, как WRITE, READ, DELETE, UPDATE. Для базовых типов данных определить новые операции нельзя.

Как и базовые типы данных, абстрактные типы данных (ATD, abstract data types) описывают множество схожих объектов. Есть отличия ATD от традиционного типа данных:

· операции под ATD определяются пользователем;

· ATD не допускают непосредственного доступа к внутреннему представлению данных и реализации методов.

В некоторых ОО-системах (например, Smalltalk) базовые типы данных реализованы как абстрактные.

Для создания абстрактного типа данных необходимо обеспечить:

· имя типа;

· представление данных или переменные экземпляра объекта, принадлежащего ATD; каждая переменная экземпляра имеет тип данных, который может быть либо базовым типом, либо другим ATD;

· операции под ATD и ограничения реализуются с помощью методов.

Определение ATD перестраивает определение класса. В некоторых ОО-системах для различения классов и типов при ссылки на структуры данных и методы класса используется ключевое слово type, а при ссылке на набор экземпляров объекта - ключевой слово class. Тип (type) более статичное понятие, а class связан в основном со временем выполнения. Отличие ОО-класса от ОО-типа можно проиллюстрировать на примере. Предположим, имеется шаблон для конструктора. К шаблону прилагается описание его структуры, а также инструкция по его использованию. Этот шаблон и есть описание типа (type definition). Комплект сделанных с помощью шаблона реальных изделий, каждое из которых имеет уникальный номер (или OID), составляет класс (class).

ATD совместно с наследованием позволяют создавать сложные объекты. Сложный объект (complex object) формируется путем комбинации других объектов, находящихся в сложных взаимосвязях друг с другом. Пример сложного объекта можно найти в системах безопасности, где используются различные типы данных:

1. стандартные (табличные) данные о сотруднике (ФИО, Таб. № и т.д.);

2. битовая карта для хранения фотографии сотрудника;

Возможность относительно просто работать с такой сложной средой данных повышает значение ОО-систем на современном рынке баз данных.

Приложение к рабочей программе по дисциплине «Структуры и алгоритмы обработки данных в ЭВМ»

Абстрактный тип данных "Список".

Список – последовательность элементов определенного типа a 1 , a 2 , ..., a n , где n https://pandia.ru/text/78/308/images/image001_307.gif" width="13" height="16">1, то a 1

Называется первым элементом, а an – последним элементом списка. Элементы списка линейно упорядочены в соответствии с их позицией в списке. Элемент ai предшествует элементу ai +1 для i = 1,2, n -1 и ai следует за ai -1 для i = 2,3, n . Каждый элемент списка ai имеет позицию i , i =1,2, n . В списке существует позиция, означающая конец списка – nil . Она следует за последним элементом списка.

Операторы АТД "Список":

1. INSERT(x , р, L ). Этот оператор вставляет объект х в позицию р в списке L, перемещая элементы от позиции р и далее в следующую, более высокую позицию. Таким образом, если список L состоит из элементов a 1 , a 2 , ..., а n а1, а2, ..., ар-1, х, ар, ..., a n. . Если р принимает значение nil , то будем иметь a 1 , a 2 , ..., a n , , х . Если в списке L нет позиции р, то результат выполнения этого оператора не определен.

2. LOCATE (x , L ). Эта функция возвращает позицию объекта х в списке L. Если в списке объект x встречается несколько раз, то возвращается позиция первого от начала списка объекта х. Если объекта х нет в списке L , то возвращается nil .

3. RETRIEVE (p , L ). Эта функция возвращает элемент, который стоит в позиции р в списке L. Результат не определен, если р = nil или в списке L нет позиции р.

4. DELETE (p , L ). Этот оператор удаляет элемент в позиции р списка L. Так, если список L состоит из элементов a 1 , a 2 , ..., а n , то после выполнения этого оператора он будет иметь вид а1, а2, ...,, ap - i , ap + i , ..., а n. Результат не определен, если в списке L нет позиции р или р = nil .

5. NEXT(p, L ) и PREVIOUS(p, L ). Эти функции возвращают соответственно следующую и предыдущую позиции от позиции р в списке L. Если р - последняя позиция в списке L, то NEXT(p , L ) = nil . Функция NEXT не определена, когда р= nil . Функция PREVIOUS не определена, если р = 1. Обе функции не определены, если в списке L нет позиции р.

6. MAKENULL ( L ) . Эта функция делает список L пустым и возвращает позицию nil .

7. FIRST (L ). Эта функция возвращает первую позицию в списке L. Если список пустой, то возвращается позиция nil .

8. PRINTLIST (L ). Печатает элементы списка L в порядке их расположения в списке.

Представление списка с помощью массива:

Представление списка с помощью односвязного списка:

Обозначения:

· – указатель на начало списка,

· last - указатель на последний элемент в списке,

· maxlenght – максимальная длина (количество элементов) в списке.

Представление списка с помощью двусвязного списка:

Упражнения:

1. Напишите программы вставки, удаления и поиска элементов отсортированного списка, используя для реализации списка

§ массив,

§ указатели.

2. Напишите программу для слияния

§ двух отсортированных связных списков,

§ n отсортированных связных списков,

3. Дан многочлен вида

р(х) = с1 х e 1 + c 2 xe 2 + + с n х n , где е1 > е2 > ... > e n > 0.

Такой многочлен можно представить в виде связанного списка, где каждый элемент имеет три поля: одно - для коэффициента с i второе - для показателя степени е i третье - для указателя на следующий элемент. Для описанного, представления многочленов напишите программу сложения и умножения многочленов, используя это представление.

4. Реализуйте АТД LIST (Список) для любого типа данных и его операторы INSERT, LOCATE, RETRIEVE, DELETE, NEXT, PREVIOUS, MAKENULL, PRINTLIST:

§ список задан в виде массива,

§ список задан в виде односвязного списка,

§ список задан в виде двусвязного списка.

Раздел рабочей программы 2.1.2

Абстрактный тип данных "Стек".

Стек - это специальный тип списка, в котором все вставки и удаления выполняются только на одном конце, называемом вершиной , (top). Для стека используется метод доступа LIFO (last-in-first-out - последний вошел - первый вышел).

Операторы АТД "Стек":

1. MAKENULL (S ). Делает стек S пустым.

2. TOP (S ). Возвращает элемент из вершины стека S. Обычно вершина стека иден­тифицируется позицией 1, тогда TOP(S) можно записать в терминах общих опе­раторов списка как RETRIEVE(FIRST(S), S).

3. POP (S ). Удаляет элемент из вершины стека (выталкивает из стека), в терминах операторов списка этот оператор можно записать как DELETE(FIRST(S), S ).

4. PUSH (x , S ). Вставляет элемент х в вершину стека S (заталкивает элемент в стек). Элемент, ранее находившийся в вершине стека, становится элементом, следующим за вершиной, и т. д. В терминах общих операторов списка данный оператор можно записать как INSERT(;c, FIRST(S), S ).

5. EMPTY (S ) . Эта функция возвращает значение true (истина), если стек S пустой, и значение false (ложь) в противном случае.

массива:

Представление стека с помощью односвязного списка:

Упражнения:

Реализуйте АТД STACK(Стек) для любого типа данных и его операторы MAKENULL, TOP, POP, PUSH, EMPTY.

§ стек задан в виде массива,

§ стек задан в виде односвязного списка.

Раздел рабочей программы 2.1.2

Абстрактный тип данных "Очередь".

Очередь (queue) - это специальный тип списка, где элементы вставляются с одного конца, называемого задним (rear), а удаляются с другого, переднего (front). Очереди также называют "списками типа FIFO" (аббревиатура FIFO расшифровывается как first-in-first-out: первым вошел - первым вышел). Операторы, выполняемые над оче­редями, аналогичны операторам стеков. Существенное отличие между ними состоит в том, что вставка новых элементов осуществляется в конец списка , а не в начало, как в стеках.

Операторы АТД "Очередь":

1. MAKENULL (Q ) очищает очередь Q, делая ее пустой.

2. FRONT (Q ) - функция, возвращающая первый элемент очереди Q. Можно реализовать эту функцию с помощью операторов списка как RETRIEVE(FIRST(Q), Q).

3. ENQUEUE (a , Q ) вставляет элемент х в конец очереди Q.

С помощью операторов списка этот оператор можно выполнить следующим образом: INSERT(x, END(Q), Q).

4. DEQUEUE (Q ) удаляет первый элемент очереди Q. Также реализуем с помощью операторов списка как DELETE(FIRST(Q), Q).

5. EMPTY (Q ) возвращает значение true тогда и только тогда, когда Q является пустой очередью.

циклического массива:

Обозначения:

Q – очередь,

Q . front – указатель на начало очереди,

Q . rear - укаазатель на конец очереди.

Представление очереди с помощью односвязного списка:

Упражнения:

Реализуйте АТД QUEUE (Очередь) для любого типа данных и его операторы MAKENULL, FRONT, ENQUEUE, DEQUEUE, EMPTY.

§ очередь задана в виде циклического массива,

§ очередь задана в виде двусвязного списка.

Абстрактный тип данных "Дерево".

Дерево - это совокупность элементов, называемых узлами (один из которых определен как корень ), и отношений ("родительских"), образующих иерархическую структуру узлов. Узлы, так же, как и элементы списков, могут быть элементами любого типа. Формально дерево можно рекуррентно определить следующим образом.

1. Один узел является деревом. Этот же узел также является корнем этого дерева.

2. Пусть п - это узел, a T 1 , Т2, ..., Tk - деревья с корнями n 1 . n 2 , ..., nk соответственно. Можно построить новое дерево, сделав п родителем узлов n 1 . n 2 , ..., nk . В этом дереве п будет корнем, a T 1 , Т2, ..., Tk - поддеревьями этого корня. Узлы n 1 . n 2 , ..., nk называются сыновьями узла п.

Часто в это определение включают понятие нулевого дерева , т. е. "дерева" без узлов, такое дерево обозначается словом nill .

Пример: О главление книги, схематически можно представить деревом. Отношение родитель-сын отображается в виде линии. Деревья обычно рисуются сверху вниз так, что родители располагаются выше "детей".

DIV_ADBLOCK135">

Высотой узла дерева называется длина самого длинного пути из этого узла до какого-либо листа. В примере высота узла Гл.1 равна 1, узла Гл.2 - 2, а узла Гл. З - 0. Высота дерева совпадает с высотой корня. Глубина узла определяется как длина пути (он единственный) от корня до этого узла.

Сыновья узла обычно упорядочиваются слева направо. Поэтому два дерева на рисунке различны, так как порядок сыновей узла а различен. Если порядок сыновей игнорируется, то такое дерево называется неупорядоченным , в противном случае дерево называется упорядоченным .

Операторы АТД "Дерево":

1. PARENT (n , Т). Эта функция возвращает родителя (parent) узла п в дереве Т. Если п является корнем, который не имеет родителя, то в этом случае возвращается nill . Здесь nill указывает на то, что произошел выход за пределы дерева.

2. LEFTMOST __ CHILD (n , Т). Данная функция возвращает самого левого сына узла n в дереве Т. Если n является листом (и поэтому не имеет сына), то возвращается nill .

3. RIGHT _ SIBLING (n , Т). Эта функция возвращает правого брата узла п в дереве Т или значение nill , .если такового не существует. Для этого находится родитель р узла п и все сыновья узла р, затем среди этих сыновей находится узел, расположенный непосредственно справа от. узла п.

4. LABEL (n , T ). Возвращает метку узла n . дерева Т. Для выполнения этой функции требуется, чтобы на узлах дерева были определены метки.

5. CREATE (v , T 1 , T 2 , ..., Ti ,) - это cемейство функций, которые для каждого i = 0, 1, 2,... создают новый корень r с меткой v и далее для этого корня создает i сыновей, которые становятся корнями поддеревьев T 1 , Т2, .... Ti ;. Эти функции возвращают дерево с корнем r . Отметим, что если i = 0, то возвращается один узел r , который одновременно является и корнем, и листом.

6. ROOT (T ) возвращает узел, являющимся корнем дерева T , Если T - пустое дерево, то возвращается nill .

7. MAKENULL (T ). Этот оператор делает дерево T пустым деревом.

Представление дерева с помощью массива родителей:

Представление дерева с помощью связанных списков:

Представление дерева посредством, левых сыновей и правых братьев.

Обозначения в рисунке:

nodespace массив узлов дерева,

    label метка узла, header индекс левого сына в списке сыновей,

cellspase массив списков сыновей узлов,

    node указатель на узел в массиве nodespace , next индекс правого сына в списке сыновей.

Упражнения:

1. Дано дерево:

DIV_ADBLOCK137">

§ дерево задано в виде массива записей узлов, содержащих индекс самого левого сына, индекс правого брата и метку,

§ связное двоичное дерево задано с помощью указателей на левого и правого сыновей.

4. Напишите функции обхода двоичного дерева в прямом, обратном и симметричном порядке.

Раздел рабочей программы 2.1.3

Абстрактный тип данных "Множество".

Множество обычно изображается в виде последовательности его элементов, заключенной в фигурные скобки, например {1, 4} обозначает множество, состоящее из двух элементов, - чисел 1 и 4. Порядок, в котором записаны элементы множества, не существен, поэтому можно писать {4, 1} так же, как и {1, 4}, при записи одного и того же множества. Множество не является списком (хотя бы по признаку произвольного порядка записи элементов). В множестве отсутствуют повторяющиеся элементы ({1, 4, 1} не является множеством).

Фундаментальным понятием теории множеств является понятие отношения принадлежности к множеству , обозначаемое символом . Таким образом, запись х х не принадлежит множеству А ", т. е. х не является элементом множества А . Существует специальное множество, обозначаемое символом , которое называется пустым, множеством , и которое не имеет элементов. Множество DIV_ADBLOCK138">

Говорят, что множество А содержится в множестве В (или включается в множество В), пишется A В или В А , если любой элемент множества А является также элементом множества В. В случае A В также говорят, что множество А является подмножеством множества В.

Например, {1, 2} https://pandia.ru/text/78/308/images/image019_36.gif" width="15" height="15 src=">В и А В, то множество А называют собственным, истинным или строгим подмножеством множества В.

Основными операциями, выполняемыми над множествами, являются операции объединения, пересечения и разности. Объединением множеств А и В (обозначается А В) называется множество, состоящее из элементов, принадлежащих хотя бы од­ному из множеств A и В.

Пересечением множеств А и В (обозначается А В) называется множество, состоящее только из тех элементов, которые принадлежат и множеству А , и множеству В. Разностью множеств А и В (обозначается A \ B ) называется множество, состоящее только из тех элементов множества А , которые не принадлежат множеству В .

Например, если А = {а, b, с} и В= {b, а}, то А В= {а, b, с, d}, A В = { b } и А \ В = {а, с}.

Операторы АТД “Множество”:

1. UNION (A , В, С) А и В С, равное А В.

2. INTERSECTION (A , В, С) имеет "входными" аргументами множества А и В , а в качестве результата - "выходное" множество С, равное А В. .

3. DIFFERENCE (A , В, С) имеет "входными" аргументами множества А и В , а в качестве результата - "выходное" множество С, равное А\ В.

4. MERGE ( A , В, С) оператор выполняет слияние (merge ), или объединение непересекающихся множеств . Этот оператор не отличается от оператора. UNION , но здесь предполагается, что множества-операнды не пересекаются (т. е. не имеют общих элементов). Оператор присваивает множеству С значение А В , но результат будет не определен, если А В , т. е. в случае, когда множества А и В имеют общие элементы.

5. member (х, А ) имеет аргументами множество А и объект х того же типа, что и элементы множества А , и возвращает булево значение true (истина), еcли х a", "b", "с"})= "а". Подобным образом определяется оператор МАХ .

11.EQUAL (A , В ) возвращает значение true тогда и только тогда, когда множества А и В состоят из одних и тех же элементов.

12. FIND (x ) оперирует в среде, где есть набор непересекающихся множеств. Он возвращает имя (единственное) множества, в котором есть элемент х.

Представление множества:

Множество можно задать с помощью массива или связного списка.

Упражнения:

1. Заданы два множества А = {1, 2, 3} и В = {3, 4, 5}. Каков будет результат выполнения следующих операторов?

· UNION(A. В. С),

· INTERSECTION(A, В, С),

· DIFFERENCE(A. В. С),

· MEMBER(l. A),

· INSERT(1,А),

· DELETE(1, А),

2. Реализуйте АТД “Множество” для любого типа данных и его операторы MAKENULL, UNION, INTERSECTION, MEMBER, MIN.

· множество задано с помощью массива фиксированной длины и указателя на последнюю занятую позицию в массиве,

· множество задано с помощью несортированного связного списка,

· множество задано с помощью отсортированного связного списка,

Раздел рабочей программы 2.1.3

Специальные виды множеств

Абстрактный тип данных “Дерево двоичного поиска”

Дерево двоичного поиска - структура данных для представления множеств, чьи элементы упорядочены посредством некоторого отношения линейного порядка. На деревьях двоичного поиска можно реализовать операторы множества INSERT , DELETE , MEMBER и MIN , причем время их выполнения в среднем имеет порядок O (log n) для множеств, состоящих из п элементов.

Характерным для дерева двоичного поиска является то, что его узлы помечены элементами множеств (узлы дерева содержат элементы множества). Причем, все элементы, хранящиеся в узлах левого поддерева любого узла х, меньше элемента, содержащегося в узле х, а все элементы, хранящиеся в узлах правого поддерева узла х, больше элемента, содержащегося в узле х.

Примеры двоичного дерева:

https://pandia.ru/text/78/308/images/image023_7.jpg" width="277" height="122 src=">

Представление АВЛ-дерева не отличается от представления двоичного дерева поиска.

Другой разновидностью сбалансированного дерева поиска является 2-3 дерево. Структура 2-3 дерева отличается от структуры дерева двоичного поиска.Для 2-3 дерева характерно, что все узлы имеют 2 или 3 сына, все пути от корня до листа имеют одинаковую длину и все элементы множества содержатся в листьях. Узлы 2-3 дерева делятся на внутренние и терминальные (листья). Внутренние узлы используются только для маршрутизации поиска в дереве. Каждый внутренний узел содержит ключи наименьших элементов второго и третьего сына (если есть третий сын)и указатели на узлы сыновей.

Представление связного дерева двоичного поиска:

Представление сбалансированного связного 2-3 дерева:

Упражнения:

1. Нарисуйте все возможные деревья двоичного поиска для четырех элементов 1, 2, 3 и 4.

2. Вставьте целые числа 7, 2, 9, 0, 5, 6, 8, 1 в пустое дерево двоичного поиска.

3. Покажите результат удаления числа 7, а затем числа 2 из дерева, полученного в предыдущем упражнении.

4. Нарисуйте 2-3 дерево, которое получится в результате вставки в пустое множество (представленное как 2-3 дерево) элементов 5, 2, 7, 0, 3, 4, 6, 1, 8, 9.

5. Покажите результат удаления элемента 3 из 2-3 дерева, полученного в предыдущем упражнении.

3. Реализуйте АТД “Дерево поиска” для любого типа данных и его операторы INSERT, DELETE, MEMBER и MIN.

· дерево задано в виде связного двоичного дерева

· дерево задано в виде 2-3 дерева

Раздел рабочей программы 2.1.3

Абстрактный тип данных "Словарь".

Словарь – множество, предназначенное для хранения "текущих" объектов с периодической вставкой или удалением некоторых из них. Время от времени также возникает необходимость узнать, присутствует ли конкретный элемент в данном множестве. Словарь реализуется с помощью АТД “Словарь” с операторами INSERT, DELETE и MEMBER . В набор операторов словаря также входит оператор MAKENULL для инициализации структур данных АТД.

Словарь можно представить с помощью хеш-таблицы. Таблица строится на основе следующей идеи: потенциальное множество элементов (возможно, бесконечное) разбивается на конечное число классов. Для В классов, пронумерованных от 0 до В -1 , строится хеш-функция h такая, что для любого элемента х исходного множества функция h(x} принимает целочисленное значение из интервала 0, ..., В - 1, которое, соответствует классу, которому принадлежит элемент х. Элемент х часто называют ключом, h( x) - хеш -значением х, а "классы" – сегментами . Поспособу разрешения коллизий хеширования (два элемента множества имеют одинаковое значение h(x) ) применяется открытое и закрытое хеширование.

открытой хеш-таблицы

Массив, называемый таблицей сегментов и проиндексированный номерами сегментов 0, 1,...,В - 1 , содержит заголовки для В связных списков. Элемент i -го списка - это элемент исходного множества, для которого h (.х:) = i .

Представление словаря с помощью закрытой хеш-таблицы

В таблице сегментов хранятся непосредственно элементы словаря. Поэтому в каждом сегменте можно хранить только один элемент словаря. При закрытом хешировании применяется методика повторного хеширования . При попытке поместить элемент x в сегмент с номером h ( x ) , который уже занят другим элементом выбирается последовательность номеров сегментов h 1 ( x ) ,h 2 ( x ) , , куда можно поместить элемент. Последовательно проверяется занятость каждого из этих сегментов, пока не будет найден свободный сегмент. В него помещается элемент x . Для задания номеров сегментов при повторном хешировании применяются различные методы разрешения коллизий. Например, метод линейного хеширования, метод середины квадрата, метод случайного хеширования

Упражнения:

1. Предположим, что для хеширования целых чисел в 7-сегментную хеш-таблицу используется хеш-функция h(i) = i % 7.

· приведите результирующую хеш-таблицу, если в нее вставляются точные кубы 1, 8, 27,64,125, 216,343;

· повторите предыдущий пункт для закрытой хеш-таблицы с линейной методикой разрешения коллизий.

2. Предположим, что есть закрытая хеш-таблица с 5 сегментами, хеш-функцией h(i) = i % 5 и линейной методикой разрешения коллизий. Покажите результат вставки в первоначально пустую хеш-таблицу последовательности чисел 23, 48, 35, 4, 10.

3. Реализуйте АТД “Словарь” для текстовых строк и его операторы INSERT, DELETE, MEMBER и MAKENULL

· словарь задан с помощью открытой хеш-таблицы,

· словарь задан с помощью закрытой хеш-таблицы с линейной методикой разрешения коллизий,

Раздел рабочей программы 2.1.3

Абстрактный тип данных " Отображение".

Отображение - это множество, на элементах которого определена функция отображения элементов одного типа (области определения ) на элементы другого типа (области значений ) другого типа. Отображение М ставит в соответствие элемент d типа domaintype из области определения элементу r типа rangetype из области значений: M (d ) = r .Пустое отображение не содержит никаких элементов

Операторы АТД "Отображение":

1. MAKENULL (M ). Делает отображение М пустым.

2. ASSIGN(М d, r). Делает M (d ) равным r независимо от того, как M (d ) было определено ранее.

3. COMPUTE(M, d, r). Возвращает значение true и присваивает переменной r значение M (d ), если последнее определено, и возвращает false в противном случае.

Представление отображения: отображение можно эффективно реализовать с помощью хеш-таблиц. Здесь x задает значение из области определения отображения, а элемент таблицы с номером h ( x ) – элемент из области значений.

Раздел рабочей программы 2.1.3

Абстрактный тип данных “Очередь с приоритетами”

Очередь с приоритетами - это множество, для элементов которого задана функция приоритета (priority), т. е. для каждого элемента x множества можно вычислить функцию р( x )- приоритет элемента x , которая обычно принимает значения из множества действительных чисел, или, в более общем случае, из некоторого линейно упорядоченного множества.

АТД “Очередь с приоритетом” основано на АТД “Множество” с операторами INSERT и DELETEMIN , а также с оператором MAKENULL для инициализации структуры данных. Оператор INSERT для очереди с приоритетами понимается в обычном смысле, тогда как DELETEMIN является функцией, которая возвращает элемент с наименьшим приоритетом и в качестве побочного эффекта удаляет его из множества.

Представление очереди с помощью упорядоченного двузвязного списка.


Представление очереди с помощью частично упорядоченного связного дерева:

Основная идея такой реализации заключается в том, чтобы организовать элементы очереди в виде двоичного дерева. На нижнем уровне, где некоторые листья могут отсутствовать, все отсутствующие листья могут располагаться только справа от присутствующих листьев нижнего уровня. Более существенно, что дерево частично упорядочено . Это означает, что приоритет узла v не больше приоритета любого сына узла v , где приоритет узла - это значение приоритета элемента, хранящегося в данном узле. Из рисунке видно, что малые значения приоритетов не могут появиться на более высоком уровне, где есть большие значения приоритетов.

При выполнении функции DELETEMIN возвращается элемент с минимальным приоритетом, который должен быть корнем дерева. Чтобы не разрушить дерево и сохранить частичную упорядоченность значений приоритетов на дереве после удаления корня, выполняются следующие действия: на самом нижнем уровне находится самый правый узел и временно помещается в корень дерева. Затем этот элемент спускается по ветвям дерева вниз (на более низкие уровни), по пути меняясь местами с сыновьями, имеющими меньший приоритет, до тех пор, пока этот элемент не станет листом или не встанет в позицию, где его сыновья будут иметь по крайней мере не меньший приоритет.

Представление очереди с помощью массива, содержащего узлы частично упорядоченного дерева:

В массиве A первые n позиций соответствуют n узлам дерева. Элемент A содержит корень дерева. Левый сын узла дерева A [ i ], если он существует, находится в ячейке A , а правый сын, если он существует – в ячейке A . И наоборот, если сын находится в ячейке A [ i ], то его родитель в ячейке A [ i %2] . Узлы дерева заполняют ячейки A , A , … A [ n ] последовательно уровень за уровнем, начиная с корня, а внутри уровня – слева направо. Дерево, показанное выше, будет представлено в массиве следующей последовательностью своих узлов: 3, 5, 9, 6, 8, 9, 10, 10, 18, 9.

Упражнения:

1. Нарисуйте частично упорядоченное дерево, полученное в результате вставки в пустое дерево целых чисел 5, 6, 4, 9, 3, 1 и 7. Каков будет результат последовательного применения к этому дереву трех операторов DELETEMIN?

2. Реализуйте АТД “Очередь с приоритетами” для любого типа данных и его операторы INSERT, DELETEMIN и MAKENULL

§ частично упорядоченное дерево реализуется с помощью указателей,

§ частично упорядоченное дерево реализуется с помощью массива.

Раздел рабочей программы 2.1.3

Абстрактный тип данных " Объединение множеств".

АТД представляет собой объединение объектов, каждый из которых является множеством. Основные действия, выполняемые над такой совокупностью, заключаются в объединении множеств в определенном порядке, а также в проверке принадлежности определенного объекта конкретному множеству. Эти задачи решаются с помощью операторов MERGE (Слить) и FIND (Найти). Оператор MERGE(A , В, С ) делает множество С равным объединению множеств А и В , если эти множества не пересекаются (т. е. не имеют общих элементов); этот оператор не определен, если множества А и В пересекаются. Функция FIND(x ) возвращает множество, которому принадлежит элемент х; в случае, когда х принадлежит нескольким множествам или не принадлежит ни одному, значение этой функции не определено.

Операторы АТД “Объединение множеств”:

1. MERGE (A , В) объединяет компоненты А и. В, результат присваивается или А, или В.

2. FIND (x ) - функция, возвращающая имя компонента, которому принадлежит х.

3. INITIAL (A , х ) создает компонент с именем А, содержащим только элемент х.

Представление объединения множеств с помощью массивов:

Имя множества совпадает со значением индекса массива setheaders (имя 0)

Обозначения:

setheaders – массив заголовков множеств:

§ с ount – число элементов в множестве,

§ firstelement – индекс массива names с первым элементом множества,

names массив списков элементов множеств:

    setname - имя множества, которому принадлежит элемент, nextelement – индекс следующего элемента в списке данного множества (значение индекса 0 используется в качестве конца списка).

Раздел рабочей программы 2.1.3

Абстрактный тип данных Ориентированный граф”

Основные определения:

Ориентированный граф (орграф ) G = (V, Е) состоит из множества вершин V и множества дуг Е. Вершины также называются узлами , а дуги - ориентированными ребрами . Дуга представима в виде упорядоченной пары вершин (u , w ), где вершина и называется началом , a w - концом дуги.

Говорят также, что дуга и -> w ведет от вершины и к вершине w, а вершина w смежная с вершиной v .

Пример 1 орграфа:

Вершины орграфа можно использовать для представления объектов, а дуги - для отношений между объектами.

Путем в орграфе называется последовательность вершин v 1 , v 2 , … , vn , , для которой существуют дуги v 1 -> v 2 , v 2 , -> v 3, , ..., vn -1 , -> vn . Этот путь начинается в вершине v 1 и, проходя через вершины v 2 , v 3 , ..., vn -1 заканчивается в вершине vn . Длина пути - количество дуг, составляющих путь, в данном случае длина пути равна п - 1 . Как особый случай пути рассмотрим одну вершину v как путь длины 0 от вершины v к этой же вершине v . На рисунке последовательность вершин 1, 2, 4 образуют путь длины 2 от вершины 1 к вершине 4.

Путь называется простым , если все вершины на нем, за исключением, может быть, первой и последней, различны. Цикл - это простой путь длины не менее 1, который начинается и заканчивается в одной и той же вершине. На рисунке вершины 3, 2, 4, 3 образуют цикл длины 3.

Во многих приложениях удобно к вершинам и дугам орграфа присоединить какую-либо информацию. Для этих целей используется помеченный орграф , т. е. орграф, у которого каждая дуга и/или каждая вершина имеет соответствующие метки. Меткой может быть имя, вес или стоимость (дуги), или значение данных какого-либо заданного типа.

Пример 2 помеченного орграфа:

DIV_ADBLOCK149">

3. Алгоритм транзитивного замыкания (алгоритм Уоршелла):

Для графа G = (V , E ) алгоритм вычисляет матрицу транзитивности T , каждый элемент которой T [i , j ] = 1 только тогда, когда существует путь от вершины i к вершине j и T [ i , j ] = 0 в противном случае.

4. Алгоритм нахождения центра орграфа:

Пусть и - произвольная вершина орграфа G = (V ,Е}. Эксцентриситет (максимальное удаление) вершины и определяется как

max{минимальная длина пути от вершины w до вершины v }

w V

Центром орграфа G называется вершина с минимальным эксцентриситетом. Другими словами, центром орграфа является вершина, для которой максимальное рас­стояние (длина пути) до других вершин минимально.

Пример: Центром орграфа является вершина d

Эксцентр-т

5. Алгоритм обхода орграфа в глубину (поиска в глубину):

При решении многих задач, касающихся ориентированных графов, необходим эффективный метод систематического обхода вершин и дуг орграфов. Таким методом является так называемый поиск в глубину - обобщение метода обхода дерева в прямом порядке. Поиск в глубину начинается с выбора начальной вершины v графа G, эта вершина помечается меткой visited (посещалась). Затем для каждой вершины, смежной с вершиной v и которая не посещалась ранее, рекурсивно применяется поиск в глубину. Когда все вершины, которые можно достичь из вершины v , будут "удостоены" посещения, поиск заканчивается. Если некоторые вершины остались не посещенными, то выбирается одна из них и поиск повторяется. Этот процесс продолжается до тех пор, пока обходом не будут охвачены все вершины орграфа G .

6. Алгоритм построения глубинного остовного дерева графа:

При обходе графа методом поиска в глубину только определенные дуги ведут к непосещённым вершинам. Такие дуги, ведущие к новым вершинам, называются дугами дерева и формируют для графа остовный лес, построенный методом поиска в глубину глубинный остовный лес . При построении леса еще выделяются 3 типа дуг: обратные, прямые и поперечные.. Обратные дуги - такие дуги, которые в остовном лесе идут от потомков к предкам. Прямыми дугами называются дуги, идущие от предков к истинным потомкам, но которые не являются дугами дерева.

Дуги, соединяющие вершины, не являющиеся ни предками, ни потомками друг друга, называются поперечными дугами . Если при построении остовного дерева сыновья одной вершины располагаются слева направо в порядке их посещения и если новые деревья добавляются в лес также слева направо, то все поперечные дуги идут справа налево.

Например, дуги D ->С и G->D – поперечные, дуга C -> A – обратная, прямых дуг нет.

При глубинном обходе дерева часто удобно нумеровать вершины в порядке их посещения. Такие номера называются глубинными.

Представление орграфа:

§ Представление орграфа с помощью матрицы смежности:

Матрица смежности для орграфа G - это матрица А размером n n со значениями булевого типа, где A [ i , j ] = true тогда и только тогда, когда существует дуга из вершины i в вершину j. Часто в матрицах смежности значение true заменяется на 1, а значение false - на 0.

Обобщением представления орграфа с помощью матрицы смежности можно считать представление помеченного орграфа также посредством матрицы смежности, но у которой элемент A [ i , j ] равен метке дуги i -> j . Если дуги от вершины i к вершине j не существует, то значение A[i , j ] не может быть значением какой-либо допустимой метки, а может рассматриваться как "пустая" ячейка.

Матрица смежности для помеченного орграфа (пример 2):

§ Представление орграфа с помощью списков смежности:

Списком смежности для вершины i называется список всех вершин, смежных с вершиной i , причем определенным образом упорядоченный. Орграф G можно представить посредством массива HEAD (Заголовок), чей элемент HEAD [i ] является указателем на список смежности вершины i .


Операторы АТД “Орграф”:

Наиболее общие операторы, выполняемые над ориентированными графами, включают операторы чтения меток вершин и дуг, вставки и удаления вершин и дуг и оператор перемещения по последовательностям дуг.

Для просмотра множества смежных вершин необходимы следующие три оператора.

1. FIRST(v ) возвращает индекс первой вершины, смежной с вершиной v . Если вершина v не имеет смежных вершин, то возвращается "нулевая" вершина nil .

2. NEXT(v , i ) возвращает индекс вершины, смежной с вершиной v, следующий за индексом i. Если i - это индекс последней вершины, смежной с вершиной v, то возвращается nil .

3. VERTEX(v ,i ) возвращает вершину с индексом i из множества вершин, смежных с v .

Упражнения:

Дан ориентированный граф (орграф):

https://pandia.ru/text/78/308/images/image043_12.gif" width="125" height="100 src=">


Пример несвязного графа:

Циклом (простым) называется путь (простой) длины не менее 3 от какой-либо вершины до нее самой. Граф называется циклическим , если имеет хотя бы один цикл. Связный ациклический граф, представляющий собой "дерево без корня", называют свободным деревом . На втором рисунке, приведенном выше, показан граф, состоящий из двух связных компонент, каждая из которых является свободным деревом. Свободное дерево можно сделать "обычным" деревом, если какую-либо вершину назначить корнем, а все ребра сориентировать в направлении от этого корня.

Свободные деревья имеют два важных свойства:

1. Каждое свободное дерево с числом вершин n , n > 1 , имеет в точности n - 1 ребер.

2. Если в свободное дерево добавить новое ребро, то обязательно получится цикл.

Пусть G = (V , Е) - связный граф, в котором каждое ребро (r , w ) помечено числом с(v , w), которое называется стоимостью ребра . Остовным деревом графа G называется свободное дерево, содержащее все вершины V графа G. Стоимость остовного дерева вычисляется как сумма стоимостей всех ребер, входящих в это дерево

Основные алгоритмы обработки неориентированных графов:

1. Построение остовного дерева минимальной стоимости (алгоритм Прима):

Строится множество вершин U , из которого "вырастает" остовное дерево. Пусть V= {1, 2, ..., n }. Сначала U = {1}. На каждом шаге алгоритма находится ребро наименьшей стоимости (u , v ) такое, что u U и v V\U , затем вершина v переносится из множества V \ U в множество U . Этот процесс продолжается до тех пор, пока множество U не станет равным множеству V .

Последовательность построения остовного дерева приведена ниже.

https://pandia.ru/text/78/308/images/image048_12.gif" width="501" height="384 src=">

3. Обход неориентированных графов методом поиска в глубину:

Для систематического обхода всех вершин графа используется поиск в глубину. Алгоритм поиска в глубину аналогичен алгоритму обхода вершин орграфа. Последний используется и для неориентированных графов, поскольку неориентированное ребро (v , w ) можно представить в виде пары ориентированных дуг v -> w и w -> v .

Обход в глубину можно использовать для построения остовного дерева.

Граф и остовное дерево, полученное при обходе его вершин методом поиска в глубину приведены ниже:

4. Обход неориентированных графов методом поиска в ширину

Другой метод систематического обхода вершин графа называется поиском в ширину . Он получил свое название из-за того, что при достижении во время обхода любой вершины v далее рассматриваются все вершины, смежные с вершиной v , т. е. осуществляется просмотр вершин "в ширину". Этот метод также можно применить и к ориентированным графам.

Так же, как и при применении поиска вглубь, посредством метода поиска в ширину при обходе графа создается остовный лес. Если после достижения вершины х при рассмотрении ребра (х, у) вершина у не посещалась ранее, то это ребро считается ребром дерева. Если же вершина у уже посещалась ранее, то ребро (х, у) будет поперечным ребром, так как оно соединяет вершины, не связанные наследованием друг друга.

Остовное дерево, полученное методом поиска в ширину показано ниже.

Представление неориентированного графа с помощью матрицы смежности:

Для представления неориентированных графов можно применять те же методы, что и для представления ориентированных графов, если неориентированное ребро между вершинами v и w рассматривать как две ориентированных дуги от вершины v к вершине w и от вершины w к вершине v.

https://pandia.ru/text/78/308/images/image051_12.gif" width="159" height="106">

Представление неориентированного графа с помощью списков смежности:

https://pandia.ru/text/78/308/images/image053_12.gif" width="339" height="115 src=">

1. Постройте:

остовное дерево минимальной стоимости посредством алгоритма Прима;

остовное дерево минимальной стоимости с помощью алгоритма Крускала;

остовное дерево методом поиска в глубину, начиная с вершин а и d;

остовное дерево методом поиска в ширину, начиная с вершин а и d.

2. Реализуйте алгоритмы Прима и Крускала.

3. Реализуйте построение остовного дерева методом поиска в глубину

§ для неориентированного графа представленного с помощью матрицы смежности,

§ для неориентированного графа представленного с помощью списков смежности.

4. Реализуйте построение остовного дерева методом поиска в ширину

§ для неориентированного графа представленного с помощью матрицы смежности,

§ для неориентированного графа представленного с помощью списков смежности.

Абстрактный тип данных

Абстра́ктный тип да́нных (АТД) - это тип данных, который предоставляет для работы с элементами этого типа определённый набор функций , а также возможность создавать элементы этого типа при помощи специальных функций. Вся внутренняя структура такого типа спрятана от разработчика программного обеспечения - в этом и заключается суть абстракции . Абстрактный тип данных определяет набор независимых от конкретной реализации типа функций для оперирования его значениями. Конкретные реализации АТД называются структурами данных .

В программировании абстрактные типы данных обычно представляются в виде интерфейсов , которые скрывают соответствующие реализации типов. Программисты работают с абстрактными типами данных исключительно через их интерфейсы, поскольку реализация может в будущем измениться. Такой подход соответствует принципу инкапсуляции в объектно-ориентированном программировании . Сильной стороной этой методики является именно сокрытие реализации. Раз вовне опубликован только интерфейс, то пока структура данных поддерживает этот интерфейс, все программы, работающие с заданной структурой абстрактным типом данных, будут продолжать работать. Разработчики структур данных стараются, не меняя внешнего интерфейса и семантики функций, постепенно дорабатывать реализации, улучшая алгоритмы по скорости, надежности и используемой памяти.

Различие между абстрактными типами данных и структурами данных, которые реализуют абстрактные типы, можно пояснить на следующем примере. Абстрактный тип данных список может быть реализован при помощи массива или линейного списка, с использованием различных методов динамического выделения памяти. Однако каждая реализация определяет один и тот же набор функций, который должен работать одинаково (по результату, а не по скорости) для всех реализаций.

Абстрактные типы данных позволяют достичь модульности программных продуктов и иметь несколько альтернативных взаимозаменяемых реализаций отдельного модуля.

Примеры АТД

См. также

Ссылки

  • Лапшин В. А. Абстрактные типы данных в программировании

Wikimedia Foundation . 2010 .

Смотреть что такое "Абстрактный тип данных" в других словарях:

    абстрактный тип данных - Тип данных (абстрактный класс), определенный посредством перечисления его методов и свойств, без создания их конкретной реализации. Тематики информационные технологии в целом EN Abstract Data TypeADT … Справочник технического переводчика

    В теории программирования любой тип, значения которого являются значениями некоторых иных типов, «обёрнутыми» конструкторами алгебраического типа. Другими словами, алгебраический тип данных имеет набор конструкторов типа, каждый из которых… … Википедия

    Целое, целочисленный тип данных (англ. Integer), в информатике один из простейших и самых распространённых типов данных в языках программирования. Служит для представления целых чисел. Множество чисел этого типа представляет собой… … Википедия

    У этого термина существуют и другие значения, см. Множество (значения). Множество тип и структура данных в информатике, является реализацией математического объекта множество. Данные типа множество позволяют хранить ограниченное число значений… … Википедия

    Некоторые языки программирования предоставляют специальный тип данных для комплексных чисел. Наличие встроенного типа упрощает хранение комплексных величин и вычисления над ними. Содержание 1 Арифметика над комплексными 2 Поддержка в языках … Википедия

    У этого термина существуют и другие значения, см. Указатель. Диаграмма указателей Указатель (пойнтер, англ. pointer) переменная, диапазон значений которой состоит из адресов ячеек памяти и специального значения нулевого адреса.… … Википедия

    Один из видов алгебраических типов данных, который характеризуется тем, что его конструкторы могут возвращать значения не своего типа. Это понятие реализовано в нескольких языках программирования, в частности в языках ML и Haskell, причём в… … Википедия

    Типаж (англ. trait) это абстрактный тип, в информатике, используемый, как «простая концептуальная модель для структурирования объектно ориентированных программ». Типажи подобны mixins, но могут включать определения методов класса.… … Википедия

    Бинарное дерево, простой пример ветвящейся связной структуры данных. Структура данных (англ. data structure) программная единица, позволяющая хран … Википедия

    - (top type) в теории типов, часто обозначаемый как просто вершина или «закрепленным» символом (⊤), универсальный тип, то есть такой тип, который содержит в себе каждый возможный объект в нужной системе типов. Высший тип иногда именуется… … Википедия

Абстрактный тип данных Общие положения о данных Абстрактный тип данных общие положения спецификация, представление, реализация 1

Что такое данные? Набор различных информационных объектов, над которыми выполняются те или иные действия операторами программы, называются данными. Данные - непременный атрибут любой программы. Ими могут быть: - отдельные биты; - последовательность независимых битов; -числа в разных формах представления; -байты и группы независимых байтов; -массивы чисел; -связные списки; -отдельные файлы и системы файлов. 2

Универсальное представление этого многообразия данных сложно и нецелесообразно Целесообразно разделить их на типы 3

Что такое тип данных? Тип данных определяется: – Форматом представления в памяти компьютера по определенным соглашениям алгоритмического языка, но без необходимости вычислений; – Множеством допустимых значений, которые может принимать принадлежащая к выбранному типу переменная или константа; – Множеством допустимых операций, применимых к этому типу. 4

Примеры типов данных Целочисленные типы Вещественный тип Логический тип Символьный тип Перечисляемый тип Интервальный тип Указатели 5

Целочисленные типы имеется пять предопределенных целочисленных типов: Shortint, Integer, Longint, Byte и Word. Каждый тип обозначает определенное подмножество целых чисел. Значение одного целочисленного типа может быть явным образом преобразовано к другому целочисленному типу с помощью приведения типов. 6

Вещественный тип К вещественному типу относится подмножество чисел, представляемых в формате с плавающей точкой и с фиксированным числом цифр. Запись значения в формате с плавающей запятой обычно включает три значения - m, b и e - таким образом, что m * b ^ e = n, где b всегда равен 2, а m и e являются целочисленными значениями в диапазоне вещественного типа. Эти значения m и e далее определяют диапазон представления и точность вещественного типа. Пример: 0. 143 E+22, где m - 0. 143; b=2(подразумевается), e=22. Имеется пять видов вещественных типов: вещественное (Real), с одинарной точностью (Single), с двойной точностью (Double), с повышенной точностью (Extended) и сложное (Comp). 7

Логический тип Существует 4 предопределенных логических (булевских) типа: Boolean, Byte. Bool, Word. Bool и Long. Bool. Значения булевского типа обозначаются встроенными идентификаторами констант False и True. Логические переменные могут использоваться для хранения результатов каких - либо логических вычислений. Для булевых переменных разрешены только 2 операции сравнения "="(равно) и ""(неравно). 8

Символьный тип Множеством значений этого типа являются символы, упорядоченные в соответствии с расширенным набором символов кода ASCII. Это буквы ["A". . . "Z", "a". . . "z"], цифры ["0". . . "9"], знаки препинания и специальные символы. Переменная этого типа в памяти занимает один байт. 9

Перечисляемый тип Перечислимые типы определяют упорядоченные множества значений через перечисление идентификаторов, которые обозначают эти значения. Упорядочение множеств выполняется в соответствии с последовательностью, в которой перечисляются идентификаторы. Type Week = (Monday, Tuesday, Wednesday, Thursday, Friday, Saturday, Sunday); 10

Интервальный тип Интервальный тип представляет собой диапазон значений из порядкового типа. Определение интервального типа включает наименьшее и наибольшее значение в поддиапазоне. Type Interval = 0. . . 1000; Такая декларация типа указывает компилятору, что для переменных этого типа допустимы только числа из указанного диапазона. Тем самым в программе могут быть автоматически организованы проверки корректности операций присвоения для этих переменных. 11

Общее для типов данных Каждому из типов данных соответствует множество простых операций. INTEGER-операции +, -, *, div, mod REAL - операции + , -, *, / BOOLEAN- операции - конъюнкция (и), дизъюнкция V (или), отрицание (не) CHAR-операции ORD (с) -N: (С в ASCII), CHR (I) I -тый символ в ASCII По мере возрастания объемов и сложности представления информации возникает необходимость в удобных формах ее представления, хранения и обработки. 12

Определение абстрактный тип данных (АТД или abstract data type, или ADT), - это множество абстрактных объектов, представляющих элементы данных, и определенные на нем наборы операций, которые могут быть выполнены над элементами этого множества. 13

АТД – обобщение типов данных Абстрактные типы данных (АТД) можно рассматривать как средство расширения языков программирования. Сравним абстрактный тип данных с таким знакомым понятием, как процедура. Процедуру можно рассматривать как обобщённое понятие оператора. Две характерные особенности процедур – обобщение и инкапсуляция, отлично характеризуют абстрактные типы данных. АТД можно рассматривать как обобщение простых типов данных (целых, действительных и т. д.), точно также как процедура является обобщением простых операторов (+, - и т. д.) 14

Преимущества АТД Абстрактные структуры данных предназначены для удобного хранения и доступа к информации. Они предоставляют удобный интерфейс для типичных операций с хранимыми объектами, скрывая детали реализации от пользователя. Конечно, это весьма удобно и позволяет добиться большей модульности программы. 15

Пример Для автоматизированного управления температурой в различных комнатах большого здания полезным АТД был бы ТЕРМОСТАТ. В программе может быть много переменных типа ТЕРМОСТАТ, соответствующих реальным термостатам в различных помещениях здания. АТД может быть описан своим именем, множеством значений и допустимыми операциями так же, как и любой другой тип данных. Описание для типа ТЕРМОСТАТ: – Тип данных: ТЕРМОСТАТ – Область значений: температура может изменяться в диапазоне от 0 до 50 градусов (по Цельсию). – Операции: Выше, Ниже, Установить, Проверить, Тревога. (Можно придумать много полезных операций, но слишком большое их количество ухудшает абстракцию) 16

Уровни абстракции Уровни абстракции напоминают слои программного обеспечения. Высшие уровни абстракции отражают представление пользователя о решении задачи. Нижние уровни абстракции – возможности языка программирования. 17

Пример абстракции на уровне пользователя Архитектор представляет дом в виде стен, полов, окон, дверей и т. д. В этом случае тип данных Рисунок. Двери мог бы стать хорошим абстрактным типом. Тип данных: Рисунок. Двери Операции: Рисовать. Дверь Стереть. Дверь Рисовать. Двойную. Дверь ……. Рисунок. Двери являются абстракцией высокого уровня, отражающего взгляд пользователя на проблему 18

Пример абстракции на уровне программиста Программист может предложить другой уровень абстракции для этих объектов, например, прямоугольник. Тип данных: Прямоугольник Операции: Рисовать. Прямоугольник Стереть. Прямоугольник Разделить. Прямоугольник. На. Части ……. Прямоугольник – абстракция более низкого уровня, поскольку она ближе к реализации. 19

Конструкторы АТД Каждый АТД должен содержать операции построения значений своего типа. Такие операции называются конструкторами. Конструкторов должно быть достаточно для порождения всего множества значений данного типа. АТД, удовлетворяющий этому свойству, называется полным. Неполный АТД – ошибка проектирования. 20

Рекомендации к выбору операций абстрактного типа данных Целесообразно включение следующих операций: – операции-конструкторы, – операции проверки, – операции преобразования типов, – операции ввода-вывода, – операции копирования, – операции-селекторы. Постарайтесь свести к минимуму число операций. Простой АТД легче понять. Поддерживайте связь операций с выбранной абстракцией типа. 21

Первичный конструктор Операции, создающие новые значения АТД вне зависимости от его предшествующего значения, называются первичными конструкторами. Каждый АТД включает по меньшей мере один первичный конструктор: без него невозможно сформировать начальное значение. 22

Использование скрытых типов Абстрактные типы данных лучше объявлять в виде скрытых типов. Это позволяет переместить описание структуры данных в модуль реализации, где оно преимущественно используется. Они также обеспечивают возможность предотвращения прямого доступа к компонентам типа со стороны импортера. Поскольку скрытый тип всегда реализуется с помощью указателя, то в АТД должны быть включены три операции. – Создать - операция, создающая узел соответствующей структуры. – Уничтожить - операция по освобождению памяти узла скрытого типа. – Присвоить - операция копирования полей динамической структуры узла скрытого типа. 23

Что такое спецификация и реализация у абстрактного типа данных Абстрактный тип данных - это способ определения некоторого понятия в виде класса объектов с некоторыми свойствами и операциями. В языке программирования такое определение оформляется как специальная синтаксическая конструкция, называемая в разных языках капсулой, модулем, кластером, классом, пакетом, формой и т. д. Эта конструкция в самой развитой форме содержит: спецификацию типа данных, включающую описание интерфейса (имя определяемого типа, имена операций с указанием их профилей) и абстрактное описание операций и объектов, с которыми они работают, некоторыми средствами спецификации; реализацию типа данных, включающую конкретное описание тех же операций и объектов. 24

Классификация типов данных по способу описания и защиты пакетированный, если описание типа данных собрано в одном месте (в одном пакете), т. е. его объекты и операции объединены в одно понятие; он имеет определение, которое может содержать, однако, лишь его реализацию; инкапсулированный, если тип данных пакетированный, его определение содержит описание интерфейса и реализацию, а также предусмотрена инкапсуляция реализации; абстрактный, если тип данных инкапсулированный и его спецификация включает абстрактное описание. 25

Составляющие спецификации Программирование, как процесс, начинается с постановки задачи (ее определения), или спецификации задачи. Далее повсеместно в тексте используются спецификации, состоящие из шести составляющих: – Название - название решаемой задачи; – Описание - несколько предложений, описывающих суть задачи; – Вход - детальное описание предполагаемой формы входных данных; – Выход - детальное описание предполагаемой формы выходных данных; – Ошибки - подробный список ситуаций, возникающих при неправильных входных данных; – Пример - пример выполнения в терминах вход-выход. 26

П р и м е р спецификации Абстрактный тип данных СТЕК, реализующий широко известную структуру данных, которая характеризуется тем, что в нее можно "поместить" некоторый элемент и "выбрать" из нее элемент, помещенный туда самым последним. Синтаксическая часть спецификации типа данных СТЕК имеет вид type СТЕК specification is СОЗДАТЬ: function () return (@); ВСТАВИТЬ: function (integer; @) return (@); УДАЛИТЬ: function (@) return (@); ВЕРШИНА: function (@) return (integer); ПУСТ: function (@) return (boolean); end specification; Здесь операция СОЗДАТЬ выдает в качестве результата пустой стек, ВСТАВИТЬ - стек с добавленным на "верх" его элементом, УДАЛИТЬ - стек с удаленным "верхним" элементом, ВЕРШИНА - значение "верхнего" элемента стека, ПУСТ - признак пустоты стека. Элементами стека здесь могут быть только целые числа. 27

РЕАЛИЗАЦИЯ АБСТРАКТНОГО ТИПА ДАННЫХ Реализацию удобнее делать с помощью объектноориентированных языков программирования, таких как C++ или Java, в которых абстрактные типы данных поддерживаются с помощью классов Реализация АТД включает конкретное описание объектов определяемого типа и реализацию операций этого типа. Это означает, что объекты описываются либо как данные простых типов, либо как массивы, записи или объединения. Причем используются предопределенные типы данных или АТД, определенные ранее. Реализация операций состоит в описании подпрограмм, выполняющих необходимые действия с указанными объектами. Например операции +, *, =. . и т. п, но при этом скрывается сама реализация этих операций. 28