Mô hình khái niệm là gì? Thiết kế hệ thống khái niệm.

chú thích

VẤN ĐỀ THIẾT KẾ KHÁI NIỆM CÁC ĐỐI TƯỢNG KỸ THUẬT

Butenko L.N.

Bài báo được dành cho các vấn đề của thiết kế khái niệm của hệ thống kỹ thuật. Sự phù hợp của việc tích hợp liên ngành của các phương pháp được sử dụng để có được các giải pháp kỹ thuật mới được thể hiện.

Các vấn đề về thiết kế ý tưởng

Mục đích của bài viết này là trình bày các vấn đề và phương pháp của lý thuyết thiết kế khái niệm. Thảo luận về vấn đề trí tuệ trong khía cạnh thành tựu lý thuyết phát triển. Hiển thị nghiên cứu liên đối tượng để giải quyết thành công những vấn đề này. Sản xuất này có thể thay đổi mô hình khoa học.

Trong bài viết này, chúng tôi trình bày các nghiên cứu này, các thủ tục, các siêu mô hình, có thể quản lý thiết kế mối quan hệ và một số mô tả ngữ nghĩa về khía cạnh này.

VẤN ĐỀ THIẾT KẾ KHÁI NIỆM CÁC ĐỐI TƯỢNG KỸ THUẬT

Butenko L.N.

Đại học Kỹ thuật Bang Volgograd
400131, Volgograd, đại lộ im. TRONG VA. Lenina, 28 tuổi, [email được bảo vệ]

“Người không nghĩ đến những khó khăn xa xôi,
những rắc rối đang chờ đợi "
nho giáo

"Đầu - cô ấy có thể làm bất cứ điều gì." Đếm Cagliostro
Grigory Gorin "Công thức của tình yêu"

Hiện nay, nghiên cứu trong lĩnh vực thiết kế khái niệm đã trở nên phù hợp nhiều do việc sử dụng các phương pháp xác định truyền thống để mô tả, kiểm soát và quản lý đã bộc lộ những hạn chế lớn của chúng, và đôi khi thậm chí là không thể xây dựng mô hình của các hệ thống đã thiết kế.

Tình trạng nghiên cứu hiện tại trong các ngành phương pháp luận (nghiên cứu hoạt động, kỹ thuật hệ thống, phân tích hệ thống) cũng như lý thuyết quyết định, hệ thống phân cấp nhiều cấp, điều khiển tự động, thảm họa là nó không cho phép khám phá các lĩnh vực chủ đề phức tạp, có cấu trúc kém, năng động. .

Mô hình toán học hiện đang tập trung vào tổng hợp tham số.

Phương pháp tự động hóa lập trình tốt nhất (công nghệ CASE lập trình logic, có cấu trúc và hướng đối tượng) không bao gồm các công cụ nhận thức được phát triển. Các công cụ tự động hóa thiết kế mạnh mẽ (ví dụ: AutoCAD) không có phương tiện để biểu diễn các đối tượng phát triển phức tạp.

Các phương pháp và phương tiện của trí tuệ nhân tạo (quản lý tình huống, hệ thống chuyên gia, kỹ thuật tri thức, cơ sở tri thức) không có phương tiện để hiểu sâu hơn các lĩnh vực chủ đề, chúng chỉ huy động kiến ​​thức hiện có.

Các phương pháp thiết kế tổ chức (phương pháp tiếp cận theo định hướng vấn đề, phương pháp tiếp cận theo chức năng, thiết kế hệ thống, và các phương pháp khác) không có phương tiện để khôi phục tính toàn vẹn của lợi ích của tổ chức và các lĩnh vực hoạt động của tổ chức.

Các phương pháp nhận thức mạnh mẽ được phát triển trong khuôn khổ phép biện chứng triết học, lý thuyết tri thức, lôgíc và phương pháp luận của khoa học, trong lý thuyết tư duy, chủ nghĩa cấu trúc vẫn chưa trở thành phương tiện ứng dụng, kỹ thuật.

Lý thuyết hệ thống trong quá trình phát triển của nó đang gặp bế tắc về phương pháp luận và chưa phát triển được các phương pháp để xác định các lớp phức tạp của hệ thống.

Hợp lực có các quá trình vật lý hoặc vật lý chủ thể của nó.

Bộ máy toán học (lý thuyết tập hợp, lý thuyết phạm trù và chức năng, lý thuyết cấu trúc, lý thuyết topo) được sử dụng rộng rãi trong lý thuyết hệ thống và trong một số bài toán ứng dụng (thiết kế cơ sở dữ liệu), nhưng cho đến nay vẫn chưa thể cung cấp cho nghiên cứu. của các lĩnh vực chủ đề phức tạp và thiết kế của các đối tượng phức tạp.

Thiết kế khái niệm của một hệ thống là giai đoạn mà tại đó các quyết định được đưa ra nhằm xác định sự xuất hiện sau đó của nó ở các cấp hệ thống khác nhau, việc nghiên cứu các giải pháp được tạo ra và sự phối hợp sơ bộ của chúng được thực hiện.

Dưới đây là một số định nghĩa cơ bản:

Ý tưởng(lat. conceptus - khái niệm) - khái niệm;

Thuật ngữ "khái niệm" chỉ ra bản chất của quá trình (mô tả, biểu diễn, v.v.) hoặc đối tượng (mô hình, cấu trúc, kết quả, v.v.), đặc trưng ở chỗ tính chắc chắn về mặt định tính của các đối tượng được trình bày dưới dạng các khái niệm; Tư duy khái niệm là khả năng cơ bản của tư duy con người để "gấp" và khái quát thông tin thuộc bất kỳ loại nào với tốc độ cao. Sự tích hợp của thông tin có thể được hiển thị trong các khái niệm, số lượng, cấu trúc thời gian hoặc không gian.

Chúng ta hãy xem xét một loạt các nhiệm vụ trí tuệ và cách giải quyết chúng theo quan điểm của một cách tiếp cận có hệ thống đối với thiết kế khái niệm của các hệ thống thuộc bất kỳ lớp nào.

Định nghĩa cập nhật nhất về hệ thống được đưa ra trong

Hệ thống= (các yếu tố, quan hệ, môi trường, người quan sát, ngôn ngữ)

Hãy xem xét các vấn đề của thiết kế khái niệm theo quan điểm của biểu diễn hiện đại của cái được gọi là hệ thống. Điều đầu tiên đập vào mắt bạn là định nghĩa này là tĩnh, không có quy tắc nào cho việc xây dựng hệ thống. Chỉ gần đây các đối tượng mới xuất hiện trong định nghĩa có ảnh hưởng đến hiệu quả của quá trình thiết kế khái niệm hệ thống, ví dụ, Observer (người thiết kế), Language (ngôn ngữ thiết kế). Vấn đề đầu tiên được đặt ra là để đảm bảo các thuộc tính của hệ thống, các mảng quy tắc cho cung cấp của chúng phải được tạo ra. Dưới đây là danh sách các thuộc tính bất biến của hệ thống tạo thành một bộ giá trị:

S = (a, b, c, d, f,…,),

trong đó: a là ưu thế của toàn bộ (hệ thống); b - tính không cộng của hệ thống; c - kích thước của hệ thống; d - độ phức tạp của cấu trúc hệ thống; e - độ cứng của hệ thống; f - tính toàn vẹn theo chiều dọc của hệ thống; g - tính cách ly theo chiều ngang của hệ thống; h - thứ bậc của hệ thống; sự phụ thuộc lẫn nhau của hệ thống và môi trường; k-mức độ độc lập của hệ thống; l-tính mở của hệ thống; m-tính tương thích của hệ thống; tính mục đích của hệ thống; o- tính di truyền của hệ thống ;; tính tối ưu của hệ thống; t-sự không chắc chắn về hỗ trợ thông tin của hệ thống; tính xuất hiện của hệ thống; v-tính đa dạng của hệ thống; tính liên tục của hoạt động và phát triển của hệ thống; x-các cách hoạt động thay thế và sự phát triển của hệ thống; y - sức mạnh tổng hợp của hệ thống; z - quán tính của hệ thống; - khả năng thích ứng của hệ thống; - tổ chức hệ thống; - mức độ tiêu chuẩn hóa hệ thống; - đặc tính đổi mới của sự phát triển hệ thống.

Để hệ thống là một đối tượng hợp thành, cần xác định bản chất và trình tự các thủ tục trí tuệ đảm bảo biểu hiện tất cả các thuộc tính trên.

Lưu ý rằng các thuộc tính của bất kỳ hệ thống nào chỉ có thể được xác định trong một trường hợp cụ thể bởi chức năng của cấu trúc của hệ thống này, dễ chấp nhận hơn, theo quan điểm của chúng tôi, là sự phụ thuộc "thuộc tính-tổ chức" của hệ thống. Theo tổ chức, chúng tôi có nghĩa là một tập hợp các yếu tố và mối quan hệ, cũng như sự tương tác giữa các yếu tố. Trong trường hợp này, việc thiết kế khái niệm hệ thống phải tuân theo quy luật tổ chức hệ thống, cả về cấu trúc và chức năng. Điều này cho thấy sự cần thiết của sự tồn tại và do đó, việc thiết kế một siêu hệ thống như vậy cung cấp mục tiêu tạo ra và phối hợp tất cả các biểu hiện của các thuộc tính của hệ thống. Một hệ thống thượng tầng như vậy về cơ bản khác với môi trường bên ngoài.

Một vấn đề trí tuệ cũng là việc tạo ra "ranh giới" của hệ thống với môi trường bên ngoài, nơi mà điều chính là duy trì tính toàn vẹn và đảm bảo sự ổn định.

Ảnh hưởng của người quan sát đến quá trình thiết kế ý tưởng có thể được xác định thông qua sự tương tác của chủ thể và đối tượng. Trong trường hợp này, cần giải quyết vấn đề nảy sinh, hình thành, phát triển và thực hiện ý tưởng của hệ thống đã thiết kế. Dưới đây là các định nghĩa phổ biến nhất về ý tưởng:

Ý kiến- một hình thức lĩnh hội tư tưởng về các hiện tượng của thực tế khách quan;

Ý kiến là một thuật ngữ được bao quanh bởi kiến ​​thức có liên quan;

Ý kiến- đây là một đại diện cố định trong bất kỳ mã nào về các thiết bị của một đối tượng, về bản chất của quá trình, về nguyên nhân và hậu quả của hiện tượng.

Chuỗi hoàn chỉnh của việc triển khai ý tưởng về một đối tượng như một hệ thống được chỉ ra trong: Người quan sát tạo ra ý định, tức là những ý định ban đầu trong khía cạnh. Bước tiếp theo trong biểu hiện của một ý tưởng là kết quả của sự phát triển của ý định trong một môi trường cụ thể. Ở đây, kiến ​​thức đã có thể được “coi là”, đây là sự thể hiện bản chất của hiện tượng. Tiếp theo là giai đoạn biểu hiện của bản thể. Đây là giai đoạn hình thành hệ thống, ở đây bản chất như một cái gì đó tổng thể bộc lộ sự khác biệt của các bộ phận của nó. và “cuối cùng”, giai đoạn đi lên các lớp của hệ thống với sự trợ giúp của các tiên đề mới. Như sau từ mô tả, câu hỏi làm thế nào một ý tưởng xuất hiện là rất phức tạp và các thủ tục cho sự phức tạp của nó xảy ra trong Người quan sát không được mô tả rõ ràng trong tâm lý học. Trong ngôn ngữ học tâm lý học, khái niệm của khái niệm đã được làm rõ và hóa ra khái niệm đó không tương đương với thuật ngữ của khái niệm. Khái niệm tồn tại trong thế giới tinh thần của một người không phải dưới dạng các khái niệm rõ ràng, mà là một “gói” các ý tưởng, khái niệm, kiến ​​thức, liên tưởng, kinh nghiệm đi kèm với từ đó. Các khái niệm không chỉ là suy nghĩ, chúng là "kinh nghiệm", chúng là chủ đề của cảm xúc, thích và không thích, và đôi khi thậm chí xung đột. Khái niệm được hiểu là một số thực thể nhận thức cơ bản cho phép bạn liên kết ý nghĩa với từ được sử dụng, như một đơn vị có ý nghĩa của quá trình hình thành khái niệm, qua đó thực tế được khúc xạ trong đầu con người.

Như vậy, chúng ta đi đến vấn đề thu nhận kiến ​​thức theo cấp số nhân. Một người có thể biểu lộ kiến ​​thức mới bằng "phương pháp khám phá" và "phương pháp định đề". Lưu ý rằng trong bối cảnh này, có những vấn đề về việc tính đến những thay đổi của thông tin trong quá trình suy diễn tri thức (nghĩa là suy luận là phi đơn điệu), cũng như các vấn đề về tổng hợp theo chiều ngang và chiều dọc, trọng tâm là vấn đề tương thích. giữa các phần tử và giữa các cấp độ thiết kế hệ thống.

Đối với thiết kế ý tưởng, việc đạt được các giải pháp mới có tầm quan trọng đặc biệt. Chúng ta hãy chỉ ra mối quan hệ của vấn đề này với vấn đề khởi nguồn hệ thống, cũng như với vấn đề thu nhận kiến ​​thức theo cấp số nhân.

Chúng tôi cũng lưu ý rằng thiết kế khái niệm của các hệ thống trong khía cạnh đảm bảo sự phát triển sáng tạo của chúng có liên quan đặc biệt. Điều này liên quan trực tiếp đến sự chuyển đổi định tính giữa các hệ thống đòi hỏi sự thay đổi trong tổ chức của các hệ thống này. Theo chúng tôi, lĩnh vực nghiên cứu mới này nên được gọi là dị động học. Hình 1 cho thấy các hướng khả thi cho các nghiên cứu liên ngành tiếp theo. Nhấn mạnh định hướng thực dụng, chúng tôi muốn chỉ ra mối quan hệ chặt chẽ với các nhiệm vụ hoạch định chiến lược, quản lý chiến lược, marketing chiến lược cho nhiều lĩnh vực chủ đề.

Danh sách thư mục:

1. Nikanorov S. P. Phương pháp thiết kế khái niệm hệ thống quản lý tổ chức và ứng dụng của nó. Tạp chí thông tin khoa học điện tử “QUẢN LÝ HỆ THỐNG. VẤN ĐỀ VÀ GIẢI PHÁP "http://www.situation.ru/app/j_art_960.htm

2. Teslinov A.G. Phát triển hệ thống điều khiển: phương pháp luận và cấu trúc khái niệm. M.: Globus, 1998. 229p.

3. Volkova V.N., Denisov A.A. Các nguyên tắc cơ bản về lý thuyết hệ thống và phân tích hệ thống

4. Tiếp thị chiến lược: R.A.Fatkhutdinov. - St.Petersburg: Peter, 2003.

5. Từ điển bách khoa triết học. M: Bách khoa toàn thư Liên Xô. 1983

6. Finn VK Các vấn đề triết học về logic của các hệ thống thông minh. Tạp chí của Hiệp hội Trí tuệ nhân tạo Nga. "Tin tức trí tuệ nhân tạo" số 1. Mátxcơva 1999. tr. 36.

7. Ptushenko A. "Kỹ thuật của Tuổi trẻ" số 3, 2003, trang 24.

8. Zalevskaya A.A. Giới thiệu về ngôn ngữ học tâm lý. Người Nga, Nhà nước, Nhà văn học, Đại học M., 2000, 382 tr.

9. Alexandrov E.A. Những nguyên tắc cơ bản của lý thuyết về các giải pháp heuristic. M. đài phát thanh Xô Viết, 1975, 254 tr.

10. Butenko Dm.V. Mối quan hệ giữa hoạch định chiến lược và thiết kế ý tưởng. // Hội nghị và thảo luận quốc tế kỷ niệm XXX Câu lạc bộ CNTT + SE`2003 Công nghệ thông tin mới trong khoa học, giáo dục, viễn thông và kinh doanh. Ukraine, Crimea, Yalta-Gurzuf, 2003, tr. 107

TÓM TẮT KIẾN TRÚC ĐÁNH GIÁ

Dành cho sinh viên các chuyên ngành
T1002 "Phần mềm công nghệ thông tin"

(L.V. Rudikova, Ph.D., Phó Giáo sư)

Câu 31. KIẾN TRÚC DBMS. MÔ HÌNH DỮ LIỆU QUỐC TẾ

1. Khái niệm về cơ sở dữ liệu.

2. Kiến trúc cơ sở dữ liệu ba tầng.

3. Vòng đời cơ sở dữ liệu.

4. Kiến trúc DBMS.

5. Mô hình dữ liệu quan hệ.

6. Thiết kế cơ sở dữ liệu quan hệ.

7. các hình thức quan hệ thông thường.

8. Đại số quan hệ.

1. Khái niệm về cơ sở dữ liệu.

Hệ thống cơ sở dữ liệu là bất kỳ hệ thống thông tin dựa trên máy tính nào trong đó dữ liệu có thể được chia sẻ giữa nhiều ứng dụng.

Hệ thống thông tin - một hệ thống tự động sắp xếp dữ liệu và phát hành thông tin.

Hệ thống thông tin và kiểm soát - một hệ thống cung cấp hỗ trợ thông tin cho ban quản lý.

Dữ liệu - sự thật rải rác.

Thông tin - dữ liệu được tổ chức và xử lý.

Ở dưới cơ sở dữ liệu đề cập đến một tập hợp các nhóm dữ liệu (thông tin) cơ bản có liên quan với nhau có thể được xử lý bởi một hoặc nhiều hệ thống ứng dụng. Hệ thống cơ sở dữ liệu bao gồm một cơ sở dữ liệu; phần mềm mục đích chung được gọi là hệ quản trị cơ sở dữ liệu (DBMS) , và phục vụ để quản lý cơ sở dữ liệu; thiết bị và con người thích hợp.

Mỗi DBMS phải đáp ứng các yêu cầu sau:

· cung cấp cho người dùng khả năng tạo cơ sở dữ liệu mới và xác định chúng giản đồ (cấu trúc dữ liệu logic) sử dụng một ngôn ngữ đặc biệt ngôn ngữ định nghĩa dữ liệu; hỗ trợ nhiều biểu diễn của cùng một dữ liệu;

· cho phép " yêu cầu»Dữ liệu và sửa đổi chúng bằng cách sử dụng ngôn ngữ truy vấn, hoặc là ngôn ngữ thao tác dữ liệu; cho phép tích hợp và chia sẻ dữ liệu giữa các ứng dụng khác nhau;

· hỗ trợ lưu trữ các mảng dữ liệu rất lớn được tính bằng gigabyte trở lên trong thời gian dài, bảo vệ chúng khỏi bị hư hỏng do ngẫu nhiên và sử dụng trái phép; đảm bảo tính bảo mật và toàn vẹn của dữ liệu;

· kiểm soát truy cập dữ liệu đồng thời cho nhiều người dùng; loại trừ ảnh hưởng của yêu cầu của một người dùng đối với yêu cầu của người dùng khác và ngăn chặn truy cập đồng thời có thể làm hỏng dữ liệu, tức là đảm bảo kiểm soát việc truy cập đồng thời vào dữ liệu.

Hệ thống cơ sở dữ liệu bao gồm các thành phần sau:

· Người dùng, tức là những người sử dụng dữ liệu.

· Ứng dụng, tức là chương trình người dùng yêu cầu dữ liệu từ hệ thống.

· DBMS - phần mềm quản lý quyền truy cập vào dữ liệu và cung cấp chức năng cụ thể của hệ thống cơ sở dữ liệu.

· Dữ liệu, tức là chuỗi được lưu trữ trong tệp.

· Hệ thống máy chủ lưu trữ là hệ thống máy tính nơi các tệp được lưu trữ. Các hàng dữ liệu được truy cập bởi hệ thống máy chủ. Vai trò của DBMS là tạo ra các truy vấn cho phép chức năng quản lý tệp của hệ thống máy chủ phục vụ các ứng dụng khác nhau. DBMS là một lớp phần mềm bổ sung được xây dựng trên phần mềm hệ thống chủ.

Do đó, một hệ thống có cơ sở dữ liệu có thể được biểu diễn dưới dạng chuỗi các cấp độ sau:

Ở mức thấp nhất là dữ liệu được lưu trữ trong các tệp vật lý (bộ nhớ vật lý cơ sở dữ liệu). Ở cấp cao nhất, các ứng dụng có các đại diện riêng của chúng về cùng một dữ liệu vật lý. Mỗi dạng xem cơ sở dữ liệu là một cấu trúc logic cụ thể được xây dựng từ dữ liệu vật lý bên dưới. Để cung cấp một giao diện giữa bộ nhớ vật lý của cơ sở dữ liệu và các phiên bản logic khác nhau của nó (tập hợp các biểu diễn được hỗ trợ), DBMS, đến lượt nó, phải bao gồm một số cấp.

2. Kiến trúc cơ sở dữ liệu ba cấp.

Sự phân biệt giữa biểu diễn logic và vật lý của dữ liệu được chính thức công nhận vào năm 1978 khi một ủy ban ANSI / SPARC đề xuất một cấu trúc tổng quát của hệ thống cơ sở dữ liệu. Cấu trúc này được gọi là kiến ​​trúc ba tầng. Ba cấp độ của kiến ​​trúc là: bên trong, khái niệm và bên ngoài.

mức độ bên trong - đây là mức xác định diện mạo vật lý của cơ sở dữ liệu, gần nhất với lưu trữ vật lý và gắn liền với các cách lưu trữ thông tin trên các thiết bị lưu trữ vật lý. Ổ đĩa, địa chỉ vật lý, chỉ mục, con trỏ, v.v. được liên kết với cấp độ này. Lớp này là trách nhiệm của các nhà thiết kế cơ sở dữ liệu vật lý, họ quyết định thiết bị vật lý nào sẽ lưu trữ dữ liệu, phương pháp truy cập nào sẽ được sử dụng để truy xuất và cập nhật dữ liệu cũng như các biện pháp cần được thực hiện để duy trì hoặc cải thiện hiệu suất của quản lý cơ sở dữ liệu. hệ thống. Người dùng không chạm vào mức này.

Cấp khái niệm - mức cấu trúc xác định lược đồ logic của cơ sở dữ liệu. Ở cấp độ này, thiết kế khái niệm của cơ sở dữ liệu được thực hiện, bao gồm phân tích nhu cầu thông tin của người dùng và định nghĩa các yếu tố dữ liệu mà họ cần. Kết quả của thiết kế khái niệm là một lược đồ khái niệm, một mô tả hợp lý của tất cả các phần tử dữ liệu và các mối quan hệ giữa chúng.

Cấp độ bên ngoài - mức cấu trúc của cơ sở dữ liệu xác định các biểu diễn dữ liệu người dùng. Mỗi nhóm người dùng nhận được biểu diễn dữ liệu của riêng mình trong cơ sở dữ liệu. Mỗi chế độ xem dữ liệu như vậy cung cấp mô tả hướng người dùng về các phần tử dữ liệu tạo nên chế độ xem dữ liệu và mối quan hệ giữa chúng. Nó có thể được rút ra trực tiếp từ lược đồ khái niệm. Tổng thể của các biểu diễn dữ liệu do người dùng xác định như vậy cho cấp bên ngoài.

Chế độ xem người dùng và ứng dụng

Cấp độ bên ngoài

Hiển thị

sơ đồ khái niệm

Cấp khái niệm

Trưng bày

mức độ bên trong

Hệ thống máy chủ

Dữ liệu được lưu trữ

Cơm. Các cấp độ DBMS

3. Vòng đời cơ sở dữ liệu.

Quá trình thiết kế, triển khai và duy trì một hệ thống cơ sở dữ liệu được gọi là vòng đời cơ sở dữ liệu (ZhTsBD). Thủ tục tạo một hệ thống được gọi là vòng đời hệ thống (LCS).

Hiểu và cách tiếp cận đúng đối với LCBD là rất quan trọng và cần được xem xét chi tiết, vì nó dựa trên cách tiếp cận theo hướng dữ liệu. Các mục dữ liệu ổn định hơn so với các chức năng hệ thống đã thực hiện. Việc tạo cấu trúc dữ liệu phù hợp đòi hỏi phải phân tích phức tạp các lớp mục dữ liệu và mối quan hệ giữa chúng. Nếu bạn xây dựng một lược đồ cơ sở dữ liệu logic, thì trong tương lai, bạn có thể tạo bất kỳ hệ thống chức năng nào bằng cách sử dụng lược đồ này. Phương pháp hướng chức năng chỉ có thể được sử dụng để tạo ra các hệ thống tạm thời được thiết kế cho một thời gian ngắn hoạt động.

LCBD bao gồm các bước sau:

1. Lập kế hoạch trước - lập kế hoạch cơ sở dữ liệu, được thực hiện trong quá trình phát triển một kế hoạch cơ sở dữ liệu chiến lược. Thông tin sau được thu thập trong quá trình lập kế hoạch:

· những chương trình ứng dụng nào được sử dụng và chúng thực hiện những chức năng gì;

· những tệp nào được liên kết với mỗi ứng dụng này;

· những ứng dụng và tệp mới nào đang trong quá trình này.

Thông tin này giúp xác định cách thông tin ứng dụng được sử dụng, để xác định các yêu cầu trong tương lai đối với hệ thống cơ sở dữ liệu.

Thông tin của giai đoạn này được ghi lại dưới dạng mô hình dữ liệu tổng quát.

2. Kiểm tra tính khả thi . Ở đây, tính khả thi về công nghệ, hoạt động và kinh tế của kế hoạch tạo cơ sở dữ liệu được xác định, tức là:

· tính khả thi về công nghệ - có công nghệ để thực hiện cơ sở dữ liệu theo kế hoạch không?

· Tính khả thi trong hoạt động - có các công cụ và chuyên gia cần thiết để thực hiện thành công kế hoạch cơ sở dữ liệu không?

· tính khả thi về kinh tế - kết luận có xác định được không? Liệu hệ thống đã lên kế hoạch có thành công không? Có thể đánh giá chi phí và lợi ích không?

3. Định nghĩa các yêu cầu bao gồm việc lựa chọn các mục tiêu cơ sở dữ liệu, làm rõ các yêu cầu thông tin đối với hệ thống và các yêu cầu đối với phần cứng và phần mềm. Do đó, ở giai đoạn thu thập dữ liệu và xác định yêu cầu này, a mô hình thông tin chung, thể hiện trong các nhiệm vụ sau:

· Các mục tiêu của hệ thống được xác định bằng cách phân tích nhu cầu thông tin. Nó cũng nhất thiết chỉ ra cơ sở dữ liệu nào nên được tạo (phân tán, tổng thể) và những công cụ giao tiếp nào là cần thiết. Một tài liệu đầu ra là một nhận xét mô tả các mục tiêu của hệ thống.

· Định nghĩa yêu cầu của người dùng: tài liệu dưới dạng thông tin tổng quát (nhận xét, báo cáo, khảo sát, bảng câu hỏi, v.v.); sửa chữa các chức năng hệ thống và xác định các hệ thống ứng dụng sẽ đáp ứng các yêu cầu đó. Dữ liệu được trình bày dưới dạng các tài liệu liên quan.

· Xác định các yêu cầu chung đối với phần cứng và phần mềm liên quan đến việc duy trì mức hiệu suất mong muốn. (Tìm hiểu số lượng người dùng của hệ thống, số lượng tin nhắn đầu vào mỗi ngày, số lượng bản in). Thông tin này được sử dụng để chọn loại máy tính và DBMS, khối lượng đĩa, số lượng máy in. Dữ liệu của giai đoạn này được đưa ra trong một báo cáo chứa các cấu hình phần cứng và phần mềm gần đúng.

· Phát triển một kế hoạch cho việc tạo hệ thống theo từng giai đoạn, bao gồm cả việc lựa chọn các ứng dụng ban đầu.

4. Thiết kế mẫu - tạo một lược đồ khái niệm của cơ sở dữ liệu. Các thông số kỹ thuật được phát triển ở mức độ cần thiết để chuyển sang triển khai.

Tài liệu đầu ra chính là một tài liệu duy nhất mô hình sinh học(hoặc là lược đồ cơ sở dữ liệu ở cấp độ khái niệm). Khi phát triển mô hình này, thông tin và chức năng mà hệ thống phải thực hiện, được xác định ở giai đoạn thu thập và xác định các yêu cầu đối với hệ thống, sẽ được sử dụng. Ở giai đoạn này, cũng nên xác định: 1) các quy tắc cho dữ liệu; 2) quy tắc cho các quá trình; 3) quy tắc cho giao diện.

5. Thực hiện quá trình biến một mô hình khái niệm thành một cơ sở dữ liệu chức năng. Nó bao gồm các bước sau.

1) Lựa chọn và mua lại DBMS cần thiết.

2) Chuyển đổi mô hình cơ sở dữ liệu khái niệm (thông tin học) thành mô hình dữ liệu logic và vật lý:

· dựa trên mô hình dữ liệu thông tin, một lược đồ dữ liệu được xây dựng cho một DBMS cụ thể, nếu cần, cơ sở dữ liệu sẽ không chuẩn hóa để tăng tốc độ xử lý truy vấn trong tất cả các ứng dụng quan trọng về thời gian;

· xác định quy trình ứng dụng nào cần được thực hiện trong lược đồ dữ liệu dưới dạng các thủ tục được lưu trữ;

· thực hiện các ràng buộc được thiết kế để đảm bảo tính toàn vẹn của dữ liệu và thực thi các quy tắc dữ liệu;

· thiết kế và tạo các trình kích hoạt để thực hiện tất cả các quy tắc dữ liệu được xác định tập trung và các quy tắc toàn vẹn dữ liệu không thể được chỉ định là các ràng buộc;

· phát triển một chiến lược lập chỉ mục và phân cụm; thực hiện định kích thước của tất cả các bảng, cụm và chỉ mục;

· xác định các cấp độ truy cập của người dùng, phát triển và thực hiện các quy tắc bảo mật và kiểm toán. Tạo vai trò và bí danh để cung cấp quyền truy cập cho nhiều người dùng với các cấp quyền truy cập nhất quán.

· phát triển cấu trúc liên kết mạng cơ sở dữ liệu và một cơ chế để truy cập liền mạch vào dữ liệu từ xa (cơ sở dữ liệu sao chép hoặc phân tán).

3) Xây dựng từ điển dữ liệu, xác định việc lưu trữ các định nghĩa của cấu trúc dữ liệu cơ sở dữ liệu. Từ điển dữ liệu cũng chứa thông tin về quyền truy cập, quy tắc bảo vệ dữ liệu và kiểm soát dữ liệu.

4) Làm đầy cơ sở dữ liệu.

5) Tạo các chương trình ứng dụng, kiểm soát quản lý.

6) Đào tạo người dùng.

6. Đánh giá và cải tiến lược đồ cơ sở dữ liệu. Bao gồm một cuộc khảo sát người dùng để xác định các nhu cầu chức năng chưa được đáp ứng. Các thay đổi được thực hiện khi cần thiết, thêm các chương trình và mục dữ liệu mới khi nhu cầu thay đổi và mở rộng.

Do đó, LCBD bao gồm:

· Nghiên cứu lĩnh vực chủ đề và nộp các tài liệu liên quan (1-3).

· Xây dựng mô hình infological (4).

· Thực hiện (5).

· Đánh giá hiệu suất và hỗ trợ cơ sở dữ liệu (6).

4. Kiến trúc DBMS.



Cơm. Các thành phần chính của DBMS

Dữ liệu, siêu dữ liệu - không chỉ chứa dữ liệu mà còn chứa thông tin về cấu trúc dữ liệu ( metadata). Trong DBMS quan hệ, siêu dữ liệu bao gồm bảng hệ thống (mối quan hệ), tên mối quan hệ, tên thuộc tính của các mối quan hệ đó và kiểu dữ liệu của các thuộc tính đó.

Thường thì DBMS hỗ trợ chỉ số dữ liệu. Mục lục là một cấu trúc dữ liệu giúp nhanh chóng tìm thấy các phần tử dữ liệu khi một phần giá trị của chúng có mặt (ví dụ: chỉ mục tìm các bộ giá trị của một quan hệ cụ thể có giá trị cho trước của một trong các thuộc tính). Chỉ mục là một phần của dữ liệu được lưu trữ và các mô tả cho biết thuộc tính nào mà chỉ mục có là một phần của siêu dữ liệu.

Quản lý bộ nhớ - nhận thông tin cần thiết từ vị trí lưu trữ dữ liệu và thay đổi thông tin trong đó theo yêu cầu của các cấp cao hơn của hệ thống.

Trong các hệ thống cơ sở dữ liệu đơn giản, trình quản lý bộ nhớ có thể là hệ thống tệp của hệ điều hành. Tuy nhiên, để nâng cao hiệu quả, DBMS thường thực hiện giám sát bộ nhớ trực tiếp. Trình quản lý bộ nhớ bao gồm hai thành phần:

· Quản lý tập tin kiểm soát vị trí của các tệp trên đĩa và lấy khối hoặc các khối chứa các tệp theo yêu cầu của trình quản lý bộ đệm (đĩa thường được chia thành khối đĩa- vùng nhớ liền kề chứa từ 4000 đến 16000 byte).

· Quản lý bộ đệm quản lý bộ nhớ chính. Nó nhận các khối dữ liệu từ đĩa thông qua trình quản lý tệp và chọn một trang bộ nhớ chính để lưu trữ một khối cụ thể. Nó có thể tạm thời lưu trữ một khối đĩa trong bộ nhớ chính, nhưng giải phóng nó vào đĩa khi cần trang bộ nhớ chính cho khối khác. Các trang cũng được trả lại đĩa theo yêu cầu của người quản lý giao dịch.

bộ xử lý "yêu cầu" - xử lý các yêu cầu và yêu cầu thay đổi dữ liệu hoặc siêu dữ liệu. Nó gợi ý cách tốt nhất để thực hiện thao tác cần thiết và đưa ra các lệnh thích hợp cho trình quản lý bộ nhớ.

Bộ xử lý truy vấn (trình quản lý) biến một truy vấn hoặc hành động cơ sở dữ liệu có thể được thực hiện ở mức rất cao (ví dụ: ở dạng truy vấn SQL ), thành một chuỗi các truy vấn cho dữ liệu được lưu trữ, chẳng hạn như các bộ dữ liệu riêng lẻ của một quan hệ hoặc các phần của chỉ mục trên một quan hệ. Thường là phần khó nhất của quá trình xử lý yêu cầu là của anh ấy tổ chức, tức là sự lựa chọn hàng hóa kế hoạch truy vấn hoặc một chuỗi các yêu cầu đến hệ thống bộ nhớ đáp ứng yêu cầu đó.

Giám đốc giao dịch - chịu trách nhiệm về tính toàn vẹn của hệ thống và phải đảm bảo xử lý đồng thời nhiều yêu cầu, không có yêu cầu can thiệp (ngoài ra, nhỏ nhất lớn nhất ) và bảo vệ dữ liệu trong trường hợp hệ thống bị lỗi. Nó tương tác với trình quản lý truy vấn vì nó cần biết dữ liệu nào đang bị ảnh hưởng bởi các truy vấn hiện tại (để tránh xung đột) và nó có thể trì hoãn một số truy vấn và hoạt động để tránh xung đột. Trình quản lý giao dịch cũng tương tác với trình quản lý bộ nhớ, vì các sơ đồ bảo vệ dữ liệu thường bao gồm việc lưu trữ tệp nhật ký thay đổi dữ liệu. Với thứ tự chính xác của hoạt động, tệp đăng ký sẽ chứa một bản ghi các thay đổi, vì vậy bạn có thể thực hiện lại ngay cả những thay đổi không đến đĩa do lỗi hệ thống.

Các DBMS điển hình cho phép người dùng nhóm nhiều truy vấn và / hoặc các thay đổi trong một giao dịch. Giao dịch là một nhóm các hoạt động phải được thực hiện tuần tự, như một tổng thể.

Theo quy định, một hệ thống cơ sở dữ liệu hỗ trợ nhiều giao dịch cùng một lúc. Việc thực hiện đúng tất cả các giao dịch như vậy đảm bảo giám đốc giao dịch. Đảm bảo thực hiện đúng các giao dịchAXIT -tính chất (tính nguyên tử, tính nhất quán, tính cô lập, độ bền):

· tính nguyên tử- thực hiện tất cả các giao dịch hoặc không giao dịch nào trong số đó (ví dụ: rút tiền từ máy ATM và ghi nợ tương ứng vào tài khoản của khách hàng phải là một giao dịch nguyên tử duy nhất, không được phép thực hiện từng hoạt động này riêng lẻ);

· Tính nhất quán - trạng thái trong đó dữ liệu đáp ứng tất cả các kỳ vọng có thể có (ví dụ, điều kiện nhất quán đối với cơ sở dữ liệu của các hãng hàng không là không có ghế nào trên máy bay được đặt cho hai hành khách);

· vật liệu cách nhiệt- khi hai hoặc nhiều giao dịch được thực hiện song song, kết quả của chúng phải được tách biệt với nhau. Việc thực hiện đồng thời hai giao dịch cùng lúc sẽ không dẫn đến kết quả sẽ không xảy ra nếu chúng được thực hiện tuần tự (ví dụ: khi bán vé cho cùng một chuyến bay trong trường hợp có ghế cuối cùng miễn phí khi yêu cầu đồng thời hai đại lý, yêu cầu của một trong những phải được hoàn thành, kia - Không);

· tuổi thọ - Sau khi hoàn thành giao dịch, kết quả không bị mất trong trường hợp hệ thống bị lỗi, ngay cả khi sự cố này xảy ra ngay sau khi hoàn thành giao dịch.

Ngoài ra, hãy xem xét 3 kiểu truy cập vào DBMS:

1. Yêu cầu Các câu hỏi về dữ liệu có thể được tạo theo hai cách:

Một)thông qua giao diện truy vấn chung(ví dụ, một DBMS quan hệ cho phép các truy vấn SQL , được chuyển cho bộ xử lý yêu cầu và cũng nhận được phản hồi cho chúng);

b) với sự giúp đỡ giao diện chương trình ứng dụng- các yêu cầu được truyền qua một giao diện đặc biệt (không thể gửi các yêu cầu tùy ý qua giao diện này);

2. Các sửa đổi là các hoạt động sửa đổi dữ liệu. Chúng cũng có thể được thực thi thông qua giao diện chung hoặc thông qua giao diện chương trình ứng dụng;

3. Sửa đổi mạch là các lệnh của người quản trị cơ sở dữ liệu có quyền thay đổi lược đồ cơ sở dữ liệu hoặc tạo cơ sở dữ liệu mới.

Kiến trúc máy khách / máy chủ. Trong nhiều biến thể của phần mềm hiện đại, kiến ​​trúc được triển khai máy khách / máy chủ: một tiến trình (máy khách) gửi yêu cầu thực thi tới một tiến trình khác (máy chủ). Thông thường, cơ sở dữ liệu thường được chia thành một quy trình máy chủ và nhiều quy trình khách.

Trong kiến ​​trúc máy khách / máy chủ đơn giản nhất, toàn bộ DBMS là một máy chủ, ngoại trừ các giao diện truy vấn tương tác với người dùng và gửi truy vấn hoặc các lệnh khác tới máy chủ. Ví dụ, một DBMS quan hệ thường sử dụng ngôn ngữ SQL để biểu diễn các yêu cầu từ máy khách đến máy chủ. Máy chủ cơ sở dữ liệu sau đó cung cấp cho máy khách một phản hồi dưới dạng một bảng (mối quan hệ). Có xu hướng tăng tải trên máy khách, bởi vì nếu có nhiều người dùng cơ sở dữ liệu làm việc đồng thời với máy chủ, các vấn đề có thể phát sinh.

5. Mô hình dữ liệu quan hệ.

RDM của một lĩnh vực chủ đề nhất định là một tập hợp các mối quan hệ thay đổi theo thời gian. Khi tạo một hệ thống thông tin, một tập hợp các mối quan hệ cho phép bạn lưu trữ dữ liệu về các đối tượng của lĩnh vực chủ đề và mô hình hóa các mối quan hệ giữa chúng.

Thái độ là một bảng hai chiều chứa một số dữ liệu. Về mặt toán học dướin quan hệ -ary R hiểu bộ tích Descartes D 1 D 2… D n bộ ( các miền) D 1, D 2,…, D n (), tùy chọn khác nhau:

R D 1 D 2… D n,

trong đó D 1 D 2… D n là sản phẩm hoàn chỉnh của Descartes, tức là một loạt các kết hợp của n mỗi phần tử, trong đó mỗi phần tử được lấy từ miền riêng của nó.

Lãnh địa là một khái niệm ngữ nghĩa. Miền có thể được coi là một tập hợp con các giá trị của một số kiểu dữ liệu có ý nghĩa cụ thể. Miền được đặc trưng bởi các thuộc tính sau:

· Miền có tên riêng(trong cơ sở dữ liệu).

· Miền được xác định trên một số giản dị kiểu dữ liệu hoặc trên một miền khác.

· Miền có thể có một số điều kiện boolean A cho phép bạn mô tả một tập hợp con dữ liệu hợp lệ cho miền này.

· Miền mang một số tải ngữ nghĩa.

thuộc tính quan hệ có một vài loại<Имя_атрибута: Имя_домена>. Tên thuộc tính phải là duy nhất trong một mối quan hệ. Thông thường, tên thuộc tính của một quan hệ giống với tên của các miền tương ứng.

Tỉ lệ , được định nghĩa trên nhiều miền, chứa hai phần: phần đầu và phần nội dung.

Tiêu đề mối quan hệ là một số thuộc tính quan hệ cố định:

Tiêu đề của quan hệ mô tả tích Descartes của các miền mà trên đó quan hệ được xác định. Tiêu đề là tĩnh, nó không thay đổi trong khi làm việc với cơ sở dữ liệu. Nếu các thuộc tính đã được thay đổi, thêm hoặc xóa trong mối quan hệ, thì kết quả là chúng ta sẽ nhận được khác quan hệ (thậm chí cùng tên).

Cơ quan quan hệ chứa nhiều tuples mối quan hệ. Mỗi bộ quan hệ là một tập hợp các cặp có dạng<Имя_атрибута: Значение_атрибута>:

sao cho giá trị thuộc tính thuộc về miền. Phần thân quan hệ là một tập hợp các bộ giá trị, tức là một tập con của tích Descartes của các miền. Vì vậy, thân của quan hệ thực sự là một quan hệ theo nghĩa toán học của từ này. Phần thân quan hệ có thể thay đổi trong khi làm việc với cơ sở dữ liệu - các bộ giá trị có thể được thay đổi, thêm và bớt.

Mối quan hệ thường được viết là:

hoặc ngắn hơn

,

hoặc đơn giản

Số lượng thuộc tính trong mối quan hệ được gọi là trình độ (hoặc là -hiếm có ) mối quan hệ. Bản chất của một tập hợp các bộ giá trị trong một mối quan hệ được gọi là sức mạnh mối quan hệ.

Lược đồ quan hệ một danh sách tên các thuộc tính của mối quan hệ này được gọi, cho biết miền mà chúng thuộc về:

Nếu các thuộc tính nhận các giá trị từ cùng một miền, thì chúng được gọi là-có thể so sánh được, trong đó tập hợp các thao tác so sánh hợp lệ được chỉ định cho miền đã cho. Ví dụ: nếu miền chứa dữ liệu số, thì tất cả các phép toán so sánh đều được phép đối với miền đó. Tuy nhiên, đối với các miền có chứa dữ liệu ký tự, không chỉ có thể chỉ định các phép toán so sánh cho sự bình đẳng và bất bình đẳng của các giá trị. Nếu một thứ tự từ vựng được chỉ định cho một miền nhất định, thì nó cũng có đầy đủ các thao tác so sánh.

Lược đồ của hai quan hệ được gọi là tương đương , nếu chúng có cùng mức độ và có thể sắp xếp các tên thuộc tính trong các lược đồ để các thuộc tính có thể so sánh sẽ ở cùng một vị trí, tức là các thuộc tính nhận giá trị từ cùng một miền:

Cho phép - sơ đồ mối quan hệ. - lược đồ quan hệ sau khi sắp xếp các tên thuộc tính. sau đó

~

Do đó, các điều kiện sau đây được thỏa mãn cho các quan hệ tương đương:

· Các bảng có cùng số cột.

· Các bảng chứa các cột có cùng tiêu đề.

· Các cột có cùng tên chứa dữ liệu từ các miền giống nhau.

· Các bảng có các hàng giống nhau, nhưng thứ tự của các cột có thể khác nhau.

Tất cả các bảng như vậy là khác nhau Hình ảnh mối quan hệ giống nhau.

Thuộc tính quan hệ. Các thuộc tính của quan hệ theo trực tiếp từ định nghĩa ở trên về một quan hệ. Các thuộc tính này là sự khác biệt chính giữa các mối quan hệ và bảng.

· Không có bộ giá trị nào giống hệt nhau trong mối quan hệ .

· Tuples không được sắp xếp theo thứ tự (từ trên xuống dưới) .

· Các thuộc tính không được sắp xếp theo thứ tự (từ trái sang phải) .

· Tất cả các giá trị thuộc tính đều là nguyên tử .

Cơm. Biểu diễn giản đồ của một mối quan hệ

mô hình quan hệ là một cơ sở dữ liệu dưới dạng một tập hợp các mối quan hệ liên kết với nhau. Trong mỗi kết nối, một quan hệ có thể hoạt động như một quan hệ chính và một quan hệ khác hoạt động như một quan hệ phụ. Do đó, một bộ giá trị của quan hệ chính có thể được liên kết với một số bộ giá trị của quan hệ phụ. Để hỗ trợ các mối quan hệ này, cả hai mối quan hệ phải chứa các tập hợp các thuộc tính mà chúng có liên quan với nhau. Về cơ bản, điều này khóa chính quan hệ , xác định duy nhất bộ giá trị của mối quan hệ cơ bản. Một quan hệ con phải có một tập hợp các thuộc tính tương ứng với khóa chính của quan hệ mẹ để mô hình hóa một mối quan hệ. Tuy nhiên, ở đây tập hợp các thuộc tính này đã khóa phụ hoặc là khóa ngoại , I E. nó định nghĩa một tập hợp các bộ giá trị quan hệ được liên kết với một bộ giá trị quan hệ chính duy nhất.

6. Thiết kế cơ sở dữ liệu quan hệ.

Khi thiết kế cơ sở dữ liệu quan hệ, cần giải quyết các vấn đề sau:

1) Có tính đến ngữ nghĩa của môn học, cần phải biểu diễn các đối tượng của môn học dưới dạng mô hình dữ liệu trừu tượng (thiết kế logic dữ liệu) một cách tốt nhất. Những thứ kia. - quyết định về lược đồ cơ sở dữ liệu: cơ sở dữ liệu nên bao gồm những mối quan hệ nào, những mối quan hệ này nên có những thuộc tính nào, mối quan hệ giữa các mối quan hệ là gì.

2) Đảm bảo hiệu quả của việc thực thi truy vấn cơ sở dữ liệu (thiết kế vật lý cơ sở dữ liệu).

Sau giai đoạn thiết kế danh mục, cần thu được các tài liệu kết quả sau:

· Xây dựng một lược đồ dữ liệu đúng dựa trên mô hình dữ liệu quan hệ.

· Mô tả lược đồ cơ sở dữ liệu về DBMS đã chọn.

· Mô tả các mô hình bên ngoài về DBMS đã chọn.

· Mô tả các quy tắc khai báo để duy trì tính toàn vẹn của cơ sở dữ liệu.

· Phát triển các thủ tục để duy trì tính toàn vẹn ngữ nghĩa của cơ sở dữ liệu.

Vì vậy, nhiệm vụ của việc thiết kế cơ sở dữ liệu quan hệ là chọn một lược đồ cơ sở dữ liệu từ nhiều lựa chọn thay thế khác nhau.

Chính xác được gọi là lược đồ cơ sở dữ liệu trong đó không có phụ thuộc không mong muốn giữa các thuộc tính quan hệ. Quá trình phát triển một lược đồ cơ sở dữ liệu đúng được gọi là thiết kế logic .

Thiết kế lược đồ cơ sở dữ liệu có thể được thực hiện theo hai cách:

· Phương pháp phân rã (phân vùng) tập hợp quan hệ ban đầu có trong lược đồ cơ sở dữ liệu được thay thế bởi một tập hợp quan hệ khác là các phép chiếu của quan hệ ban đầu! Đồng thời, số lượng các mối quan hệ tăng lên.

· Phương pháp tổng hợp liên kết lược đồ cơ sở dữ liệu từ các phụ thuộc sơ cấp ban đầu đã cho giữa các đối tượng của khu vực chủ đề.

Thiết kế cơ sở dữ liệu cổ điển liên quan đến lý thuyết bình thường hóa , dựa trên việc phân tích sự phụ thuộc chức năng giữa các thuộc tính mối quan hệ. Các phụ thuộc chức năng xác định các mối quan hệ ổn định giữa các đối tượng và thuộc tính của chúng trong lĩnh vực chủ thể đang được xem xét.

Phương pháp phân rã là một quá trình chuẩn hóa liên tiếp các lược đồ quan hệ: mỗi lần lặp mới tương ứng với một dạng chuẩn bậc cao hơn và có các thuộc tính tốt hơn lần lặp trước đó. Do đó, sự tồn tại của một quan hệ phổ quát chứa tất cả các thuộc tính của cơ sở dữ liệu được giả định ban đầu; chuyển đổi sang một số quan hệ có kích thước nhỏ hơn, và quan hệ ban đầu phải được khôi phục bằng cách sử dụng phép toán nối tự nhiên.

Vì vậy, mỗi dạng chuẩn tương ứng với một số tập hợp các ràng buộc cụ thể, và một quan hệ ở một số dạng bình thường nếu nó thỏa mãn tập các ràng buộc của chính nó.

Trong lý thuyết cơ sở dữ liệu quan hệ, các dạng thông thường sau đây thường được phân biệt:

dạng bình thường đầu tiên (1 NF);

· dạng bình thường thứ hai (2 NF);

· hình thức bình thường thứ ba (3 NF);

· Bayes-Codd dạng bình thường ( BCNF);

· hình thức bình thường thứ tư (4 NF);

· dạng chuẩn thứ năm hoặc dạng chiếu - kết nối (5 NF hoặc PYNF).

Các thuộc tính chính của các dạng thông thường:

· mỗi dạng bình thường kế tiếp theo một nghĩa nào đó tốt hơn dạng trước đó;

· khi chuyển sang dạng chuẩn tiếp theo, các thuộc tính của thuộc tính chuẩn trước đó được giữ nguyên.

Các lược đồ cơ sở dữ liệu được gọi là tương đương, nếu nội dung của cơ sở dữ liệu nguồn có thể được lấy bằng một kết nối tự nhiên của các quan hệ có trong lược đồ kết quả và không có bộ giá trị mới nào xuất hiện trong cơ sở dữ liệu nguồn.

7. Các hình thức quan hệ thông thường.

Quá trình chuẩn hóa dựa trên sự phản ánh đầy đủ đối tượng dưới dạng các bảng chứa dữ liệu về đối tượng được mô hình hóa và khả năng thay đổi trạng thái của cơ sở dữ liệu theo thời gian. Theo quy tắc, do mô hình dữ liệu miền không khớp, các điểm bất thường có thể xuất hiện khi thực hiện các thao tác tương ứng:

· Chèn các điểm bất thường (CHÈN) - lưu trữ thông tin không đồng nhất theo một khía cạnh.

· Cập nhật các điểm bất thường (CẬP NHẬT) - dư thừa dữ liệu quan hệ do lưu trữ không đồng nhất.

· Xóa các điểm bất thường (DELETE) - lưu trữ thông tin không đồng nhất theo một khía cạnh.

Cũng nên xem xét chưa xác định ( VÔ GIÁ TRỊ) giá trị. Trong các DBMS khác nhau, khi thực hiện các hoạt động khác nhau (so sánh, kết hợp, sắp xếp, nhóm, v.v.), hai VÔ GIÁ TRỊ -các giá trị có thể bằng hoặc không bằng nhau, ảnh hưởng khác nhau đến kết quả thực hiện các phép toán xác định giá trị trung bình và tìm số giá trị. Để loại bỏ lỗi trong nhiều DBMS, có thể thay thế VÔ GIÁ TRỊ -giá trị bằng 0 khi thực hiện các phép tính, khai báo tất cả VÔ GIÁ TRỊ -giá trị bằng nhau, v.v.

Bình thường hóa - Chia bảng thành nhiều bảng, có các thuộc tính tốt hơn khi cập nhật, chèn và xóa dữ liệu. Những thứ kia. chuẩn hóa là quá trình thay thế liên tiếp một bảng bằng các phân rã hoàn toàn của nó cho đến khi tất cả chúng đều ở dạng 5NF, tuy nhiên, trên thực tế, chỉ cần giảm các bảng xuống BCNF là đủ.

Thủ tục chuẩn hóa dựa trên thực tế là các phụ thuộc hàm duy nhất trong bất kỳ bảng nào phải là phụ thuộc của biểu mẫu, đâu là khóa chính và là một số trường khác. Do đó, trong quá trình chuẩn hóa, người ta nên loại bỏ tất cả các phụ thuộc hàm "khác", tức là từ những người có ngoại hình khác với.

Nếu chúng ta thay thế mã của khóa chính (ngoại) bằng thời gian chuẩn hóa, thì chúng ta nên xem xét 2 trường hợp:

1. Ví dụ: bảng có một khóa chính tổng hợp và một trường có chức năng phụ thuộc vào một phần của khóa này, ví dụ: on (không phụ thuộc vào khóa đầy đủ). Bạn nên tạo một bảng khác có chứa và (- khóa chính) và xóa khỏi bảng gốc:

Thay thế, Khóa chính, FZ

trên, khóa chính

và, khóa chính.

2. Bảng có một khóa chính (có thể), một trường không phải là một khóa khả dĩ nhưng phụ thuộc vào chức năng và một trường không khóa khác phụ thuộc vào chức năng:. Bạn nên tạo một bảng chứa cả (- khóa chính) và - xóa khỏi bảng gốc: Cần lưu ý rằng để thực hiện các hoạt động như vậy, ban đầu người ta phải có một số quan hệ "lớn" (phổ quát) làm đầu vào.

Def.1. Mối quan hệ là trong dạng chuẩn đầu tiên (1NF) nếu và chỉ khi không có hàng nào của nó chứa một giá trị duy nhất trong bất kỳ trường nào của nó và không có trường nào trong số các trường khóa của mối quan hệ trống.

Theo định nghĩa 1, bất kỳ mối quan hệ nào sẽ nằm trong 1NF, tức là một quan hệ thỏa mãn các thuộc tính của quan hệ: không có bộ giá trị nào giống hệt nhau trong quan hệ; bộ giá trị không được đặt hàng; các thuộc tính không có thứ tự và khác nhau về tên; tất cả các giá trị thuộc tính là nguyên tử.

Def.2. Mối quan hệ là trong dạng bình thường thứ hai (2NF) nếu và chỉ khi quan hệ nằm trong 1NF và không có thuộc tính không phải khóa nào phụ thuộc vào một phần của khóa phức hợp (nghĩa là tất cả các trường không thuộc khóa chính đều phụ thuộc đầy đủ về mặt chức năng vào khóa chính).

Nếu khóa ứng viên là đơn giản, thì quan hệ tự động ở trong 2NF.

Để loại bỏ sự phụ thuộc của các thuộc tính vào một phần của khóa phức tạp, cần phải phân hủy mối quan hệ thành nhiều mối quan hệ. Các thuộc tính phụ thuộc vào một phần của khóa phức hợp được lấy ra trong một mối quan hệ riêng biệt.

Các thuộc tính của một mối quan hệ được gọi là Độc lập với nhau nếu không cái nào trong số chúng phụ thuộc về mặt chức năng vào cái còn lại.

Def.3. Mối quan hệ là trong dạng bình thường thứ ba (3NF) nếu và chỉ khi quan hệ nằm trong 2NF và tất cả các thuộc tính không khóa là độc lập lẫn nhau (nghĩa là không có trường nào trong quan hệ phụ thuộc về mặt chức năng vào bất kỳ trường không khóa nào khác).

Để loại bỏ sự phụ thuộc của các thuộc tính không phải khóa, bạn cần phải phân tách quan hệ thành một số quan hệ. Trong trường hợp này, những thuộc tính không phải khóa phụ thuộc đó được lấy ra trong một mối quan hệ riêng biệt.

Khi giảm các quan hệ bằng cách sử dụng thuật toán chuẩn hóa thành các quan hệ trong 3NF, giả định rằng tất cả các quan hệ đều chứa một khóa ứng viên. Điêu nay không phải luc nao cung đung. Đôi khi một quan hệ có thể chứa nhiều khóa.

Def.4. Mối quan hệ là trong Bays-Codd dạng bình thường (NFBK) nếu và chỉ khi các yếu tố quyết định của tất cả các phụ thuộc chức năng là các khóa tiềm năng (hoặc - nếu bất kỳ phụ thuộc chức năng nào giữa các bảng màu của nó được giảm xuống thành phụ thuộc chức năng hoàn chỉnh trên một khóa khả dĩ).

Nếu một quan hệ nằm trong BCNF, thì nó tự động ở trong 3NF, theo sau từ Định nghĩa 4. Để loại bỏ sự phụ thuộc vào các định thức không phải là khóa tiềm năng, người ta nên phân rã bằng cách chuyển các định thức này và các phần phụ thuộc của chúng vào một quan hệ riêng biệt.

Có những trường hợp khi một quan hệ không chứa bất kỳ phụ thuộc hàm nào. Những thứ kia. mối quan hệ là hoàn toàn chính, tức là khóa của quan hệ là toàn bộ tập hợp các thuộc tính. Do đó, chúng tôi có sự phụ thuộc nhiều giá trị, vì vẫn có mối quan hệ giữa các thuộc tính.

Def.5. Mối quan hệ là trong dạng chuẩn thứ tư (4NF) nếu và chỉ khi mối quan hệ nằm trong BCNF và không chứa các phụ thuộc nhiều giá trị không tầm thường.

Các mối quan hệ với các phụ thuộc đa giá trị không tầm thường phát sinh, như một quy luật, là kết quả của sự kết nối tự nhiên của hai mối quan hệ dọc theo một trường chung, mà không phải là mối quan hệ chính trong bất kỳ mối quan hệ nào. Trong thực tế, điều này dẫn đến việc lưu trữ thông tin về hai thực thể độc lập trong một mối quan hệ.

Để loại bỏ các quan hệ phụ thuộc nhiều giá trị không tầm thường, bạn có thể phân tách quan hệ ban đầu thành một số quan hệ mới.

Xác định 6. Mối quan hệ là trong dạng bình thường thứ năm (5NF) nếu và chỉ khi bất kỳ sự phụ thuộc kết nối nào hiện tại là không đáng kể.

Xác định 6. giống hệt nhau cũng theo định nghĩa.

Def.7. Một quan hệ không nằm trong 5NF nếu quan hệ có phụ thuộc tham gia không tầm thường.

Điều đó. nếu trong mỗi phép phân tích hoàn toàn, tất cả các phép chiếu của quan hệ ban đầu đều chứa một khóa khả dĩ, chúng ta có thể kết luận rằng quan hệ này nằm trong 5NF. Một quan hệ không có bất kỳ sự phân hủy hoàn toàn nào cũng nằm trong 5NF.

Nếu không biết bất cứ điều gì về các khóa tiềm năng mà một quan hệ có và các thuộc tính liên quan như thế nào, người ta không thể nói rằng một quan hệ đã cho là ở dạng 5NF hoặc các dạng bình thường khác.

chìa khóa khả thi quan hệ là một tập hợp các thuộc tính quan hệ xác định hoàn toàn và rõ ràng (hoàn chỉnh về mặt chức năng) xác định giá trị của tất cả các thuộc tính quan hệ khác. Nói chung, có thể có một số khóa khả thi trong một mối quan hệ. Trong số tất cả các khóa có thể có của quan hệ, theo quy tắc, một khóa được chọn, được coi là khóa chính và được gọi là khóa chính của quan hệ.

Các thuộc tính độc lập lẫn nhau Đây là những thuộc tính không phụ thuộc vào nhau. Nếu có một số FD trong một quan hệ, thì mỗi thuộc tính hoặc tập hợp các thuộc tính mà một thuộc tính khác phụ thuộc vào đó được gọi là định thức của quan hệ.

9. Đại số quan hệ.

Đại số quan hệ là nền tảng để truy cập dữ liệu quan hệ. Mục đích chính của đại số là cung cấp cách viết biểu thức. Biểu thức có thể được sử dụng để:

· định nghĩa khu vực mẫu, I E. xác định dữ liệu để lựa chọn là kết quả của hoạt động tìm nạp;

· định nghĩa khu vực cập nhật, I E. xác định dữ liệu sẽ được chèn, sửa đổi hoặc xóa do kết quả của hoạt động cập nhật;

· Định nghĩa (được đặt tên) quan hệ ảo, I E. trình bày dữ liệu để họ trực quan hóa thông qua các khung nhìn;

· định nghĩa ảnh chụp nhanh, tức là xác định dữ liệu để lưu trữ dưới dạng "ảnh chụp nhanh" của mối quan hệ;

· xác định các quy tắc bảo mật, tức là xác định dữ liệu mà kiểm soát truy cập được thực hiện;

· xác định các yêu cầu về tính bền vững, tức là xác định dữ liệu được bao gồm trong khu vực cho một số hoạt động kiểm soát đồng thời;

· định nghĩa về các quy tắc toàn vẹn, tức là một số quy tắc cụ thể mà cơ sở dữ liệu phải đáp ứng, cùng với các quy tắc chung là một phần của mô hình quan hệ và áp dụng cho mỗi cơ sở dữ liệu.

Trong các triển khai của DBMS quan hệ cụ thể, cả đại số quan hệ và phép tính quan hệ hiện không được sử dụng ở dạng thuần túy của nó. SQL (Ngôn ngữ truy vấn có cấu trúc) đã trở thành tiêu chuẩn thực tế để truy cập dữ liệu quan hệ.

Đại số quan hệ được định nghĩa bởi Codd bao gồm 8 toán tử tạo thành 2 nhóm:

  • hoạt động tập hợp truyền thống (liên hiệp, giao điểm, phép trừ, tích cacte);
  • các phép toán quan hệ đặc biệt (lựa chọn, chiếu, kết nối, phân chia).

Ngoài ra, đại số còn bao gồm thao tác gán, cho phép lưu kết quả của phép tính các biểu thức đại số trong cơ sở dữ liệu và thao tác đổi tên thuộc tính, giúp có thể định dạng chính xác tiêu đề (lược đồ) của quan hệ kết quả.

Khảo sát ngắn gọn về toán tử đại số quan hệ.

Vật mẫutrả về một quan hệ chứa tất cả các bộ giá trị của một quan hệ cụ thể thỏa mãn một số điều kiện. Thao tác lựa chọn còn được gọi là thao tác hạn chế ( hạn chế - hạn chế, việc lấy mẫu hiện nay thường được chấp nhận hơn - LỰA CHỌN ).

Phép chiếutrả về một quan hệ chứa tất cả các bộ giá trị (tức là các bộ phận con) của một quan hệ nhất định sau khi loại trừ một số thuộc tính khỏi nó.

Công việctrả về một quan hệ chứa tất cả các bộ giá trị có thể là sự kết hợp của hai bộ giá trị tương ứng với hai quan hệ xác định.

Một hiệp hộitrả về một quan hệ chứa tất cả các bộ giá trị thuộc về một trong hai quan hệ được chỉ định hoặc cả hai.

Ngã tư -trả về một quan hệ chứa tất cả các bộ giá trị đồng thời thuộc hai quan hệ đã xác định.

phép trừ -trả về một quan hệ chứa tất cả các bộ giá trị thuộc về quan hệ đầu tiên trong hai quan hệ đã xác định và không thuộc về quan hệ thứ hai.

Kết nối (tự nhiên) - trả về một quan hệ có bộ giá trị là sự kết hợp của hai bộ giá trị (thuộc về hai quan hệ cụ thể) có giá trị chung cho một hoặc nhiều thuộc tính chung của hai quan hệ này (và các giá trị chung như vậy chỉ xuất hiện một lần trong bộ giá trị kết quả, không hai lần).

Phân công -đối với hai quan hệ, nhị phân và một ngôi, trả về một quan hệ chứa tất cả các giá trị của một thuộc tính của quan hệ nhị phân khớp với tất cả các giá trị trong quan hệ một ngôi.

VĂN CHƯƠNG

1. Ngày K.J. Giới thiệu về hệ thống cơ sở dữ liệu, ấn bản thứ 6: Per. từ tiếng Anh. - ĐẾN.; M.; Petersburg: Nhà xuất bản Williams, 2000. - 848 tr.

2. Cơ sở dữ liệu Connolly T., Begg K., Strachan A.: thiết kế, triển khai và bảo trì. Lý thuyết và thực hành, xuất bản lần thứ 2.: Per. từ tiếng Anh. - M.: Nhà xuất bản Williams, 2000. - 1120 tr.

3. Karpova T.S. Cơ sở dữ liệu: mô hình, phát triển, thực hiện. - St.Petersburg: Peter, 2001. - 304 tr.

4. Faronov V.V., Shumakov P.V. Delphi 4. Hướng dẫn dành cho nhà phát triển cơ sở dữ liệu. - M .: "Tri thức", 1999. - 560 tr.

5. J. Groff, P. Weinberg. SQL: Hướng dẫn hoàn chỉnh: Per. từ tiếng Anh. - K .: Tập đoàn xuất bản BHV, 2001. - 816 tr.

6. Ken Getz, Paul Litvin, Mike Gilbert. Truy cập Hướng dẫn dành cho nhà phát triển 2000. T.1, 2. Per. từ tiếng Anh. - K .: Nhóm xuất bản BHV, 2000. - 1264 tr., 912 tr.

7. Maklakov S.V. BPwin và EPwin. CASE-công cụ cho sự phát triển của hệ thống thông tin. - M.: DIALOG-MEPhI, 2001. - 304 tr.

8. Ulman D., Widom D. Giới thiệu về hệ thống cơ sở dữ liệu / Per. từ tiếng Anh. - M .: "Lori", 2000. - 374 tr.

9. Homonenko A.D., Tsygankov V.M., Maltsev M.G. Cơ sở dữ liệu: Sách giáo khoa cho các cơ sở giáo dục đại học / Ed. GS. A.D. Khomonenko. - Xanh Pê-téc-bua: Bản in CROWN, 2000. - 416 tr.

7.2. Thiết kế ý tưởng sử dụng phương pháp IDEF1X

Mục đích của thiết kế ý tưởng - tạo một lược đồ dữ liệu khái niệm dựa trên các khái niệm về lĩnh vực chủ đề của từng loại người dùng riêng lẻ. sơ đồ khái niệm là một mô tả về các thực thể chính (bảng) và các mối quan hệ giữa chúng mà không tính đến mô hình cơ sở dữ liệu được chấp nhận và cú pháp của DBMS đích. Thông thường, một lược đồ như vậy chỉ hiển thị tên của các thực thể (bảng) mà không chỉ định các thuộc tính của chúng. Người dùng xem bao gồm dữ liệu mà một người dùng cụ thể cần để đưa ra quyết định hoặc thực hiện một số tác vụ.

Trình tự các bước trong thiết kế khái niệm của [,] được thảo luận dưới đây.

1. Lựa chọn các thực thể.

Bước đầu tiên trong việc xây dựng lược đồ dữ liệu khái niệm là xác định các đối tượng chính (thực thể) có thể được người dùng quan tâm và do đó, nên được lưu trữ trong cơ sở dữ liệu. Với sự hiện diện của một mô hình chức năng, nguyên mẫu của các đối tượng đó là đầu vào, điều khiển và đầu ra. Nó thậm chí còn tốt hơn nếu sử dụng cho những mục đích này. Nguyên mẫu của các đối tượng trong trường hợp này sẽ là thiết bị lưu trữ dữ liệu. Như đã nói ở trên, data store là một tập hợp các bảng (một tập hợp các đối tượng) hoặc trực tiếp là một bảng (đối tượng). Để có định nghĩa chi tiết hơn về tập hợp các đối tượng chính, cũng cần phân tích các luồng dữ liệu và tất cả các tài liệu phương pháp cần thiết để giải quyết vấn đề. Ví dụ, đối với bài toán xác định tốc độ cho phép, các đối tượng chính (tập đối tượng) là: thông tin quy định và tham chiếu, thông tin về đoạn đường, nhiệm vụ tính toán, danh mục tốc độ cho phép, v.v. Trong quá trình phân tích và thiết kế mô hình thông tin, các tập hợp các đối tượng phải được chi tiết hóa. Ví dụ: đối tượng tổng hợp “thông tin về các đoạn đường”, có tính đến các chi tiết cụ thể của vấn đề đang được giải quyết, yêu cầu chia thành các thành phần riêng biệt: các đoạn, đường, điểm riêng biệt, quãng đường, sơ đồ, cấu trúc thượng tầng của đường, v.v.

Những khó khăn có thể xảy ra trong việc xác định đối tượng liên quan đến việc sử dụng trình quản lý tác vụ:

Ví dụ và loại suy khi mô tả các đối tượng (ví dụ, thay vì khái niệm chung chung về “nhân viên”, chúng có thể đề cập đến chức năng hoặc vị trí của nó: “người đứng đầu”, “người chịu trách nhiệm”, “người điều khiển”, “người phó”);

Từ đồng nghĩa (ví dụ, “tốc độ cho phép” và “tốc độ đặt”, “phát triển” và “dự án”, “địa điểm rào cản” và “giới hạn tốc độ”);

Từ đồng âm (ví dụ, "chương trình" có thể có nghĩa là một chương trình máy tính, một kế hoạch cho công việc trong tương lai hoặc một hướng dẫn chương trình TV).

Không phải lúc nào cũng rõ ràng một đối tượng nhất định là gì - một thực thể, một mối quan hệ hay một thuộc tính. Ví dụ, "hôn nhân gia đình" nên được phân loại như thế nào? Trên thực tế, khái niệm này có thể được quy cho bất kỳ loại nào ở trên một cách hợp lý. Phân tích là một quá trình chủ quan, vì vậy các nhà phát triển khác nhau có thể tạo ra các cách diễn giải khác nhau, nhưng khá hợp lệ về cùng một thực tế. Việc lựa chọn phương án phần lớn phụ thuộc vào ý thức và kinh nghiệm chung của người thiết kế.

Mỗi thực thể phải có một số thuộc tính:

Phải có một tên duy nhất và cách giải thích giống nhau phải luôn áp dụng cho cùng một tên;

Có một hoặc nhiều thuộc tính thuộc sở hữu của một thực thể hoặc được thừa kế thông qua một mối quan hệ;

Có một hoặc nhiều thuộc tính (khóa chính) xác định duy nhất từng cá thể thực thể, nghĩa là làm cho mỗi hàng trong bảng là duy nhất;

Có thể có bất kỳ số lượng mối quan hệ nào với các thực thể khác.

Ký hiệu đồ họa IDEF1X sử dụng ký hiệu được hiển thị trong hình sau để hiển thị một thực thể.

a) độc lập b) phụ thuộc

Cơm. 7.1. Tinh chất

Thực thể trong phương pháp IDEF1X là độc lập (mạnh mẽ, cha mẹ, thống trị, chủ sở hữu) , nếu thực thể không phụ thuộc vào sự tồn tại của một thực thể khác (nói cách khác, mỗi cá thể của một thực thể có thể được xác định duy nhất mà không cần xác định mối quan hệ của nó với các thực thể khác, hoặc tính duy nhất của một cá thể chỉ được xác định bởi các thuộc tính của chính nó). Thực thể được gọi là phụ thuộc (yếu, con, cấp dưới) nếu sự tồn tại của nó phụ thuộc vào sự tồn tại của các thực thể khác. Thuật ngữ "cha" - "con" và "chủ sở hữu" - "cấp dưới" cũng có thể được sử dụng trong mối quan hệ với hai thực thể phụ thuộc, nếu các trường hợp của một trong số chúng (con, cấp dưới) có thể được xác định duy nhất bằng cách sử dụng các thể hiện của đối tượng kia (cha , chủ sở hữu), mặc dù thực thể thứ hai đến lượt nó phụ thuộc vào thực thể thứ ba.

2. Định nghĩa các thuộc tính.

Theo quy tắc, các thuộc tính chỉ được chỉ định cho các thực thể. Nếu một mối quan hệ có các thuộc tính, điều này chỉ ra rằng mối quan hệ là một thực thể. Cách dễ nhất để xác định các thuộc tính là sau khi xác định một thực thể hoặc mối quan hệ, hãy tự đặt câu hỏi "Bạn muốn lưu trữ thông tin gì về ...?". Các biểu mẫu và tài liệu bằng giấy và điện tử khác nhau được sử dụng trong tổ chức để giải quyết vấn đề có thể giúp ích đáng kể trong việc xác định các thuộc tính. Đây có thể là các biểu mẫu chứa cả thông tin ban đầu (ví dụ: “Danh sách độ cao đường sắt bên ngoài trong đường cong”) và kết quả xử lý dữ liệu (ví dụ: “Mẫu số 1”).

Các thuộc tính đã xác định có thể thuộc các loại sau:

Đơn giản (nguyên tử, không thể phân chia) - bao gồm một thành phần tồn tại độc lập (ví dụ: “vị trí nhân viên”, “mức lương”, “tốc độ tăng tốc vượt trội”, “bán kính đường cong”, v.v.);

Composite (giả nguyên tử) - bao gồm một số thành phần (ví dụ: "tên", "địa chỉ", v.v.). Mức độ nguyên tử của các thuộc tính được nhúng trong mô hình được xác định bởi nhà phát triển. Nếu hệ thống không bắt buộc phải chọn tất cả các khách hàng có họ Ivanov hoặc sống trên đường Komsomolskaya, thì các thuộc tính tổng hợp không thể được chia thành các thuộc tính nguyên tử;

Rõ ràng - chỉ chứa một giá trị cho một trường hợp của thực thể (ví dụ: một đường cong trong kế hoạch có thể chỉ có một giá trị cho bán kính, góc quay, độ cao của đường ray bên ngoài, v.v.);

Nhiều giá trị - chứa một số giá trị (ví dụ: một chi nhánh của công ty có thể có nhiều số liên lạc);

Derived (tính toán) - giá trị của thuộc tính có thể được xác định từ các giá trị của các thuộc tính khác (ví dụ, "tuổi" có thể được xác định từ "ngày sinh" và ngày hiện tại được đặt trên máy tính);

Khóa - dùng để xác định duy nhất một cá thể thực thể (một phần của khóa chính), nhanh chóng tìm kiếm các cá thể thực thể hoặc thiết lập mối quan hệ giữa các cá thể của thực thể mẹ và con;

Không chính (mô tả);

Bắt buộc - khi nhập một phiên bản mới vào một thực thể hoặc chỉnh sửa, một giá trị thuộc tính hợp lệ phải được chỉ định, tức là sau các hành động được chỉ định, nó không thể được xác định (NOT NULL). Các thuộc tính có trong khóa chính của một thực thể là bắt buộc.

Sau khi các thuộc tính được xác định, chúng được thiết lập miền (khu vực có giá trị chấp nhận được) , Ví dụ:

Tên trang web - một tập hợp các chữ cái trong bảng chữ cái tiếng Nga với độ dài không quá 60 ký tự;

Xoay đường cong - các giá trị hợp lệ "L" (bên trái) và "R" (bên phải);

Bán kính của đường cong là một số dương có không quá 4 chữ số.

Việc chỉ định miền xác định tập hợp các giá trị hợp lệ cho một thuộc tính (một số thuộc tính) và loại, kích thước và định dạng của (các) thuộc tính.

Dựa trên tập hợp các thuộc tính đã chọn cho thực thể, một tập hợp các khóa được xác định. Chìa khóa - một hoặc nhiều thuộc tính của một thực thể dùng để xác định duy nhất các cá thể của nó, tìm kiếm nhanh chúng hoặc để thiết lập mối quan hệ giữa các cá thể của thực thể mẹ và con. Các khóa được sử dụng để xác định duy nhất các phiên bản thuộc các loại sau:

- siêu chìa khóa - một thuộc tính hoặc tập hợp các thuộc tính xác định duy nhất một thể hiện của một thực thể. Siêu khóa có thể chứa các thuộc tính "bổ sung" không cần thiết để xác định duy nhất một trường hợp. Với thiết kế chính xác của cấu trúc cơ sở dữ liệu, superkey trong mỗi thực thể (bảng) sẽ là tập hợp đầy đủ các thuộc tính của nó;

- chìa khóa tiềm năng - siêu khóa không chứa tập hợp con cũng là siêu khóa của thực thể này, tức là siêu khóa chứa tập hợp các thuộc tính bắt buộc tối thiểu để xác định duy nhất một cá thể thực thể. Một thực thể có thể có nhiều khóa ứng viên. Nếu một khóa bao gồm một số thuộc tính thì nó được gọi là khóa tổng hợp. Trong số toàn bộ tập hợp các khóa tiềm năng để xác định duy nhất các cá thể, một khóa được chọn, cái gọi là khóa chính, được sử dụng sau này để thiết lập mối quan hệ với các thực thể khác;

- khóa chính - khóa ứng viên được chọn để xác định duy nhất các cá thể trong một thực thể;

- chìa khóa thay thế - các khóa ứng viên không được chọn làm khóa chính.

Hãy xem xét một ví dụ. Để có một bảng chứa thông tin học sinh với các cột sau:

Họ;

Họ;

Ngày sinh;

Nơi sinh;

Số nhóm;

Số giấy chứng nhận bảo hiểm hưu trí (NPSS);

Số Hộ Chiếu;

Ngày cấp hộ chiếu;

Tổ chức cấp hộ chiếu.

Đối với mỗi trường hợp (bản ghi), toàn bộ tập thuộc tính có thể được chọn làm siêu khóa. Các khóa tiềm năng (số nhận dạng duy nhất) có thể là:

Số giấy chứng nhận bảo hiểm hưu trí;

Số Hộ Chiếu.

Là một định danh duy nhất, có thể chọn một tập hợp các thuộc tính "Họ" + "Tên" + "Tên viết tắt", nếu xác suất học tại trường đại học của hai tên đầy đủ sẽ bằng không.

Nếu đối tượng không có bất kỳ tổ hợp thuộc tính nào phù hợp với vai trò của khóa tiềm năng, thì một thuộc tính riêng biệt sẽ được thêm vào đối tượng - khóa thay thế (khóa nhân tạo, khóa thay thế) . Theo quy tắc, loại thuộc tính như vậy được chọn là ký tự hoặc số. Một số DBMS có các công cụ tích hợp để tạo và duy trì các giá trị khóa thay thế (ví dụ: MS Access). Cũng cần lưu ý rằng một số nhà phát triển, thay vì tìm kiếm các khóa tiềm năng và chọn một khóa chính từ chúng, lại thêm một thuộc tính nhân tạo vào mỗi thực thể, sau này được sử dụng làm khóa chính.

Nếu có một số khóa tiềm năng, thì bạn nên tuân theo các quy tắc sau để chọn khóa chính:

Số lượng thuộc tính được bao gồm trong khóa phải tối thiểu (điều cần thiết là khóa phải là nguyên tử, tức là bao gồm một thuộc tính);

Kích thước khóa tính bằng byte phải càng ngắn càng tốt;

Loại miền chính là số. Khi chọn thuộc tính ký tự trong một khóa, thường có vấn đề với việc nhập các giá trị sai (chúng gây nhầm lẫn giữa các chữ cái; thêm dấu cách; sử dụng các chữ cái được đánh vần giống nhau trong các ngôn ngữ khác nhau). Thuộc tính số ít có khả năng mắc lỗi khi nhập giá trị hơn;

Xác suất thay đổi các giá trị khóa là nhỏ nhất (ví dụ: “Số giấy chứng nhận bảo hiểm hưu trí” là một tham số không đổi hơn “TIN” hoặc “Số hộ chiếu”);

Người dùng có thể làm việc với chìa khóa dễ dàng nhất (ví dụ: “Số giấy chứng nhận bảo hiểm hưu trí” là một tập hợp 11 chữ số và “Số hộ chiếu” tùy thuộc vào loại của nó: công dân của Liên Xô, công dân của Liên bang Nga hoặc nước ngoài).

Nếu một thuộc tính nhất định (một tập hợp các thuộc tính) có trong một số thực thể, thì sự hiện diện của nó thường phản ánh sự hiện diện của mối quan hệ giữa các cá thể của các thực thể này. Trong mỗi mối quan hệ, một thực thể đóng vai trò là cha mẹ và thực thể kia đóng vai trò là con. Điều này có nghĩa là một phiên bản của thực thể mẹ có thể được liên kết với một số trường hợp con. Để hỗ trợ các mối quan hệ này, cả hai thực thể phải chứa các tập hợp các thuộc tính mà chúng có liên quan với nhau. Trong thực thể mẹ, đây là khóa chính. Trong thực thể con, để mô hình hóa mối quan hệ cần có một tập các thuộc tính tương ứng với khóa chính của cha. Tập hợp các thuộc tính này trong thực thể con được gọi là khóa ngoại .

Trong ký hiệu IDEF1X, các thuộc tính được biểu diễn dưới dạng danh sách tên trong một khối thực thể. Các thuộc tính xác định khóa chính được đặt ở đầu danh sách và được ngăn cách với các thuộc tính khác bằng một thanh ngang. Việc xác định sơ bộ các thuộc tính trên ví dụ của hai thực thể được thể hiện trong hình sau.

Cơm. 7.2. Ví dụ về thực thể

Đối tượng độc lập "Plots" có khóa thay thế làm khóa chính, trong khi đối tượng phụ thuộc "Plan" có khóa chính tổng hợp bao gồm năm thuộc tính.

3. Định nghĩa các kết nối.

Các loại mối quan hệ đặc trưng nhất giữa các thực thể là:

Các liên kết thuộc loại "toàn bộ", thường được xác định bởi các động từ "gồm có", "bao gồm", v.v.;

Phân loại các mối quan hệ (ví dụ, "kiểu - kiểu con", "tập hợp - phần tử", "chung - riêng", v.v.);

Quan hệ lao động (ví dụ: "sếp-cấp dưới");

Các kết nối chức năng, thường được định nghĩa bởi các động từ “tạo ra”, “ảnh hưởng”, “phụ thuộc vào”, “được tính toán bởi”, v.v.

Trong số đó, chỉ những liên kết cần thiết để đáp ứng các yêu cầu cho sự phát triển của cơ sở dữ liệu mới được phân biệt.

Giao tiếp được đặc trưng bởi tập hợp các tham số sau:

Tên - được chỉ ra dưới dạng một động từ và xác định ngữ nghĩa (nền ngữ nghĩa) của kết nối;

Tính đa dạng (số lượng, lũy thừa): một đối một (1: 1), một với nhiều (1: N) và nhiều với nhiều (N: M, N = M hoặc N<>M). Tính đa dạng cho thấy có bao nhiêu trường hợp của một thực thể được xác định bởi một trường hợp của một thực thể khác. Ví dụ: một phần (được mô tả bằng một hàng trong bảng "Parcels") có thể có một, hai hoặc nhiều đường dẫn (mỗi đường dẫn được mô tả bằng một hàng riêng biệt trong bảng "Đường dẫn"). Trong trường hợp này, mối quan hệ là 1: N. Một ví dụ khác: một con đường đi qua một số điểm riêng biệt và một số con đường có thể đi qua một điểm riêng biệt - Kết nối N: M;

Loại: xác định (các thuộc tính của một thực thể, được gọi là khóa ngoại, là một phần của con và phục vụ để xác định các cá thể của nó, tức là được bao gồm trong khóa chính của nó) và không xác định (khóa ngoại nằm trong thực thể con, nhưng là không phải là một phần của khóa chính);

Bắt buộc: bắt buộc (khi một phiên bản mới được nhập vào một thực thể con, các thuộc tính khóa ngoại phải được điền vào và các giá trị đã nhập phải khớp với giá trị của các thuộc tính khóa chính của một số phiên bản của thực thể mẹ) và tùy chọn (việc điền các thuộc tính khóa ngoại trong cá thể thực thể con là tùy chọn hoặc các giá trị đã nhập không khớp với các giá trị thuộc tính khóa chính của không phiên bản nào của thực thể mẹ);

Mức độ tham gia là số lượng thực thể tham gia vào mối quan hệ. Về cơ bản, có các mối quan hệ nhị phân giữa các thực thể, tức là hiệp hội liên kết hai thực thể (mức độ tham gia là 2). Ví dụ: "Trang web" bao gồm "Đường dẫn". Đồng thời, theo mức độ tham gia, có thể có các loại kết nối sau:

o một ngôi (đệ quy) - một thực thể có thể được liên kết với chính nó. Ví dụ, trong bảng "Nhân viên" có thể có các bản ghi cho cả cấp dưới và sếp của họ. Khi đó mối quan hệ "sếp" - "cấp dưới" là có thể, được xác định trên một bảng;

o ternary - kết nối ba thực thể. Ví dụ: một “Học sinh” tại một “Buổi học” đã nhận được “Điểm Kỷ luật”;

o bậc bốn, v.v.

Trong phương pháp IDEF1X, mức độ tham gia chỉ có thể là đơn phân hoặc nhị phân. Các kết nối ở mức độ lớn hơn được giảm xuống dạng nhị phân.

Sự xuất hiện của một kết nối trên sơ đồ IDEF1X cho biết sức mạnh, loại và nghĩa vụ của nó.

Bảng 7.1. Các kiểu quan hệ

Vẻ bề ngoài Loại và nghĩa vụ giao tiếp Liên kết quyền lực
1
Bắt buộc, xác định 0 .. ∞

Z
Bắt buộc, xác định 0 hoặc 1

P
Bắt buộc, xác định 1 .. ∞

<число>
Bắt buộc, xác định <число>
Bắt buộc, không xác định 0 .. ∞
Tùy chọn, không xác định 0 .. ∞

Ghi chú.

1. Liên kết xác định được hiển thị dưới dạng đường liền, liên kết không xác định được hiển thị dưới dạng đường chấm.

2. Tính tùy chọn được biểu thị bằng một viên kim cương.

Hình dưới đây cho thấy các ví dụ về ánh xạ liên kết.

a) xác định

b) không xác định

c) đệ quy

Hình.7.3. Ví dụ về mối quan hệ

Trên hình. 7.3b, kết nối là tùy chọn, vì một số nhân viên không phải thuộc bất kỳ bộ phận nào (ví dụ: giám đốc doanh nghiệp) và không xác định, vì số nhân sự là duy nhất cho mỗi nhân viên.

4. Định nghĩa lớp cha và lớp con.

Trong trường hợp hai hoặc nhiều thực thể hơi khác nhau về một tập hợp các thuộc tính, một cấu trúc có thể được sử dụng trong mô hình - một hệ thống phân cấp kế thừa (danh mục) bao gồm các lớp cha và lớp con.

Siêu cấp - một thực thể bao gồm các lớp con.

Hệ thống phân cấp kế thừa là một kiểu nhóm đặc biệt của các thực thể có chung các đặc điểm. Ví dụ, tổ chức sử dụng nhân viên toàn thời gian (nhân viên cố định) và nhân viên bán thời gian. Từ các thuộc tính chung của chúng, bạn có thể hình thành một thực thể tổng quát (tổ tiên chung) "Nhân viên" (Hình 7.4) để đại diện cho thông tin chung cho tất cả các loại nhân viên. Thông tin cụ thể cho từng loại có thể được đặt trong các thực thể bổ sung (con cháu) "Nhân viên thường trực" và "Nhân viên bán thời gian".


Cơm. 7.4. Hệ thống phân cấp người thừa kế (danh mục không hoàn chỉnh)

Thông thường, hệ thống phân cấp kế thừa được tạo khi một số thực thể có các thuộc tính chung về ý nghĩa hoặc khi các thực thể có mối quan hệ chung về ý nghĩa (ví dụ: nếu “Nhân viên cố định” và “Nhân viên bán thời gian” có mối liên hệ tương tự về ý nghĩa "Làm việc tại" với thực thể "Tổ chức").

Đối với mỗi danh mục, bạn phải chỉ định người phân biệt đối xử - một thuộc tính của tổ tiên chung cho biết cách phân biệt thực thể này với thực thể khác. Trong ví dụ trên, dấu phân biệt là thuộc tính Type.


V danh mục đầy đủ một trường hợp của tổ tiên chung nhất thiết phải tương ứng với một trường hợp trong bất kỳ hậu duệ nào, tức là trong ví dụ, nhân viên nhất thiết phải là nhân viên bán thời gian hoặc chuyên gia tư vấn hoặc nhân viên cố định.

Khi xây dựng một mô hình, có thể có nhiều sự kết hợp khác nhau giữa các danh mục hoàn chỉnh và không hoàn chỉnh. Ví dụ, cấp độ đầu tiên của danh mục là không đầy đủ, các thực thể riêng lẻ được bổ sung bởi cấp độ thứ hai - thể loại hoàn chỉnh.

7.3. Một ví dụ về việc xây dựng một sơ đồ khái niệm

Hình dưới đây cho thấy một đoạn của sơ đồ khái niệm của mô hình thông tin cho nhiệm vụ xác định tốc độ cho phép, được xây dựng bằng ERwin v9.2.

Cơm. 7.6. Mảnh vỡ của lược đồ khái niệm của mô hình thông tin

Các khối dữ liệu logic sau được đánh dấu trong sơ đồ khái niệm:

Tài liệu tham khảo;

Thông tin về các đoạn đường;

Nhiệm vụ tính toán;

Tờ tốc độ cho phép;

Lệnh nháp "H" (không được hiển thị trong Hình 7.6);

Mẫu số 1, 1a và 2 (không được trình bày trong Hình 7.6).

Tất cả các thực thể được bao gồm trong các khối (ngoại trừ khối "Thông tin quy định và tham chiếu") được trình bày trong phân đoạn chỉ bằng tên. Các thực thể được bao gồm trong khối "Thông tin quy định và tham chiếu" được hiển thị mở rộng, tức là bao gồm tất cả các thuộc tính và khóa chính. Trong khối này, có hai thực thể ("Tiêu chuẩn cho đường cong giao phối" và "Tốc độ cho phép đối với độ dốc của độ cao trong đường cong"), không liên kết với bất kỳ thực thể nào khác. Đây không phải là một sai lầm, vì có ý kiến ​​cho rằng lược đồ cơ sở dữ liệu nên là một đồ thị liên thông (tất cả các thực thể nên được kết nối với nhau). Đối với hầu hết các nhiệm vụ, nơi thông tin hoạt động khác nhau được tích lũy trong cơ sở dữ liệu, và sau đó các báo cáo và tóm tắt khác nhau được hình thành trên cơ sở đó, một tuyên bố như vậy thực sự diễn ra. Nhưng đối với kỹ thuật, tối ưu hóa và một số nhiệm vụ khác, có thể có các bảng không liên quan. Trong ví dụ này, hai thực thể không liên quan tham gia vào mỗi phép tính tốc độ cho phép, nghĩa là chúng ảnh hưởng đến kết quả hiển thị trong các trang tính tốc độ cho phép. Nhưng có tính đến các chi tiết cụ thể của vấn đề, việc thay đổi nội dung của các bảng này không được dẫn đến thay đổi kết quả đã thu được. Do đó, các bảng không được kết nối với các tác vụ cho phép tính hoặc với các kết quả của phép tính.

Nhiệm vụ của thiết kế khái niệm là xác định nhu cầu thông tin của "doanh nghiệp", những quá trình và dữ liệu cần thiết để đáp ứng những nhu cầu này. Quá trình thiết kế khái niệm bắt đầu bằng việc nghiên cứu các hoạt động của "doanh nghiệp", tức là từ phân tích miền. Đầu tiên, các mục tiêu và mục tiêu của doanh nghiệp được xác định, các quá trình (lập kế hoạch, quản lý, kiểm soát) đảm bảo đạt được các mục tiêu này và hoàn thành các nhiệm vụ đặt ra được phân tích. Các quy trình sau đó được chia thành các quy trình cấp thấp hơn cho đến khi sự phân rã dẫn đến một mức ứng dụng có thể được thực thi mà không cần chia nhỏ thêm. Tiếp theo, nhu cầu thông tin của mỗi ứng dụng được xác định, các yêu cầu dữ liệu được xác định, về bản chất, xác định các đại diện cục bộ đã thảo luận ở trên. Quá trình tiếp tục kết hợp các biểu diễn cục bộ này, loại bỏ các mâu thuẫn nảy sinh, nhằm mục đích tạo ra một biểu diễn tổng thể duy nhất của cơ sở dữ liệu, được gọi là, như đã đề cập ở trên, biểu diễn khái niệm. Thật không may, cần phải nói rằng thiết kế cơ sở dữ liệu vẫn còn là một nhiệm vụ rất chủ quan, vì không có phương pháp thực sự chặt chẽ để giải quyết vấn đề này.

Một lược đồ khái niệm mô tả một biểu diễn chung dưới dạng một số tóm tắtmô hình dữ liệu .

2. mô hình dữ liệu

Bất kỳ mô hình dữ liệu nào cũng chứa ba thành phần:

    Mô tả cấu trúc dữ liệu , những thứ kia. mô tả các đối tượng mà cơ sở dữ liệu được xây dựng.

    Ràng buộc hoàn toàn , I E. một tập hợp các quy tắc hạn chế tập hợp các thể hiện của các đối tượng này được phép trong cơ sở dữ liệu.

    Tập hợp các hoạt động được phép , I E. một tập hợp các toán tử được sử dụng để xử lý các cá thể đối tượng.

Mô hình dữ liệu giả định, ở mức tối thiểu, sự hiện diện của ngôn ngữ định nghĩa dữ liệu (DDL) để mô tả cấu trúc và ngôn ngữ thao tác dữ liệu (DML), bao gồm các hoạt động trích xuất và sửa đổi dữ liệu, cũng như sự hiện diện của cơ chế duy trì sự tương ứng của dữ liệu lĩnh vực chủ đề dựa trên các quy tắc được mô tả chính thức.

Một cách tiếp cận phổ biến để mô hình hóa dữ liệu đã được Peter Chen đề xuất trong Mô hình mối quan hệ-thực thể - Hướng tới một cái nhìn thống nhất về dữ liệu. Cách tiếp cận này dựa trên thực thể-mối quan hệ hoặc mô hình ER, được thảo luận trong bài giảng này.

Mô hình ER dựa trên một số thông tin ngữ nghĩa quan trọng về thế giới thực và được thiết kế để hợp lý Trình bày dữ liệu.

3. Mô hình "thực thể-mối quan hệ". Khái niệm ngữ nghĩa

Hãy để chúng tôi chỉ ra các khái niệm ngữ nghĩa (các yếu tố cấu tạo) được sử dụng trong mô hình này.

Tinh chất (chúng tôi sẽ sử dụng thuật ngữ quen thuộc hơn Các đối tượng ) được chia thànhđúng (mạnh) Yếu . Yếu đuốimột đối tượng được gọi, đối tượng này phụ thuộc vào một số đối tượng khác, tức là nó không thể tồn tại trừ khi đối tượng này tồn tại.Một đối tượng thích hợp là một đối tượng không yếu. Ví dụ: trong cơ sở dữ liệu của một công ty lưu trữ dữ liệu về sở thích của khách hàng, đối tượng Preferences yếu vì một cá thể của đối tượng này tương ứng với một máy khách cụ thể không thể có trong cơ sở dữ liệu nếu không có phiên bản tương ứng của đối tượng Máy khách. Đặc biệt, nếu một phiên bản nhất định của đối tượng Client bị xóa, thì tất cả các phiên bản của đối tượng Preferences phụ thuộc vào nó cũng phải bị xóa.

Có những trường hợp khi một số đối tượngMỘT là một loại đặc biệt của một đối tượng khácV . Sau đó, họ nói rằngMỘT là mộtkiểu phụ V (hoặc là "MỘT V ") hoặc làV là mộtsự khái quát MỘT . Ví dụ, trong cơ sở dữ liệu "Hàng không" có đối tượng là "Nhân viên". Để cho biết nhân viên nào là hoa tiêu, bạn có thể xác định đối tượng "Hoa tiêu" trong cơ sở dữ liệu dưới dạng một kiểu con của đối tượng "Nhân viên". Phi công tự động có tất cả các thuộc tính của nhân viên, nhưng điều ngược lại là không đúng (ví dụ: đối với phi công, thuộc tính "Loại máy bay mà phi công sở hữu nhiều nhất" có thể được xác định thêm, không áp dụng cho tất cả mọi người người lao động). Tương tự như vậy, các phi công tự động tham gia vào tất cả các cuộc liên lạc (xem bên dưới) mà nhân viên tham gia. Các thuộc tính và mối quan hệ như vậy được cho là thừa hưởng kiểu con của supertype.

Đến lượt nó, một kiểu con có thể là một siêu kiểu cho các đối tượng kiểu con của cấp độ tiếp theo, những đối tượng này lần lượt cho cấp độ tiếp theo, v.v., do đó tạo thành một hệ thống phân cấp kiểu cho đối tượng này. Một ví dụ về hệ thống phân cấp như vậy được hiển thị trong Hình. một.

Cơm. 1. Ví dụ về cấu trúc phân cấp đối tượng

Không nên nhầm lẫn phân cấp kiểu với phân cấp dữ liệu. Hình 1 hoàn toàn không có nghĩa là một nhân viên có thể có nhiều lập trình viên cấp dưới, ngược lại, đối với một trường hợp của đối tượng "Employee", có tối đa một thể hiện của đối tượng Lập trình viên đại diện cho cùng một người với lập trình viên.

Các thuộc tính và phân loại của chúng.

Gợi lại , rằng một thuộc tính là một thuộc tính của một đối tượng hoặc mối quan hệ được đặc trưng bởi một tên và một tập hợp các giá trị hợp lệ.

      Thuộc tính chia thànhgiản dị hỗn hợp. Một thuộc tính đơn giản không thể được chia nhỏ thành các phần tử độc lập nhỏ hơn (trong khuôn khổ của mô hình dữ liệu đang được sử dụng). Thuộc tính phức hợp bao gồm một số phần tử tồn tại độc lập(ví dụ: thuộc tính kết hợp "tên của nhân viên" có thể bao gồm các thuộc tính đơn giản "tên", "tên đệm" và "họ").

      Thuộc tính cũng được chia thànhrõ ràng đa nghĩa . rõ ràng một thuộc tính chỉ chứa một giá trị cho mỗi trường hợp của một đối tượng của một kiểu cụ thể.đa nghĩa một thuộc tính có thể chứa nhiều giá trị cho mỗi trường hợp của một đối tượng thuộc một loại cụ thể. Ví dụ: tên của chi nhánh hoặc chi nhánh của một công ty là một thuộc tính có giá trị duy nhất và số điện thoại của chi nhánh nói chung là nhiều giá trị (nó có thể có nhiều số).

      Một bộ phận khác của các thuộc tính lànền tảng các dẫn xuất. Căn cứ thuộc tính là thuộc tính mà giá trị của nó không phụ thuộc vào giá trị của các thuộc tính khác của đối tượng này hay đối tượng khác. Thuộc tính dẫn xuất là thuộc tính có giá trị phụ thuộc vào giá trị của một số tập hợp các thuộc tính khác.

      thuộc tính làChìa khóa , duy nhất nếu nó xác định duy nhất từng cá thể đối tượng từ tập hợp đã cho.

    Các liên kết và đặc điểm của chúng

Kết nối được thiết lập giữa các đối tượng được gọi lànhững người tham gia và số lượng người tham gia trong kết nối này được gọi làtrình độ kết nối này. Giao tiếp có thể đượchoàn chỉnh hoặc làmột phần . Cho phépR là một liên kết có chứa một đối tượngE với tư cách là một thành viên. Sau đó, nếu mỗi cá thể đối tượngE cư trú trong ít nhất một trường hợp của mối quan hệR , sau đó tham giaE quá hạnR được gọi là hoàn chỉnh, nếu không nó được gọi là từng phần. Ví dụ, nếu mỗi mặt hàng phải được cung cấp bởi ít nhất một nhà cung cấp, thì sự tham gia của các mặt hàng vào mối quan hệ giữa mặt hàng và nhà cung cấp là hoàn tất. Nhưng nếu tình huống như vậy có thể chấp nhận được khi một sản phẩm nhất định không được cung cấp bởi bất kỳ nhà cung cấp nào, thì sự tham gia của hàng hóa trong kết nối là một phần.

Hãy thảo luận một số đặc điểm chung quan trọng của các mối quan hệ:

    Một liên kết có thể được xác định trên nhiều hơn hai đối tượng. Ví dụ, kết nối giữa các đối tượng "Bộ môn" - "Chuyên ngành" - "Môn học" - "Loại bài kiểm tra" xác định danh sách các bài kiểm tra (bài thi, bài kiểm tra, môn học, v.v.) ") nhánh. Đặc biệt, kết nối này được xác định trên bốn thực thể.

    Có thể có một số mối quan hệ được xác định trên cùng một nhóm đối tượng. Ví dụ: các mối quan hệ "Hoạt động trên" và "Người quản lý" được xác định trên các tập hợp đối tượng phù hợp ("Dự án", "Nhân viên").

    Giao tiếp có thể được thiết lập giữa các trường hợp khác nhau của cùng một đối tượng. Một kết nối như vậy được gọi làđệ quy.

    Giao tiếp có thể xác địnhsự phụ thuộc vào sự tồn tại (sự phụ thuộc tồn tại) của một đối tượng này từ một đối tượng khác. Ví dụ, mối quan hệ "Cấp dưới" chỉ ra rằng sự tồn tại của một thể hiện đối tượng trong tập hợp "Cấp dưới" phụ thuộc vào sự hiện diện của một thể hiện của một số đối tượng trong tập đối tượng "Người phục vụ".

Khái niệm thiết kế khái niệm đề cập đến giai đoạn đầu của thiết kế IS và gần tương ứng với các giai đoạn 1-3 của quá trình phát triển AS theo GOST 34 hoặc các giai đoạn từ xác định yêu cầu đến thiết kế trong các mô hình vòng đời.

Định nghĩa về các yêu cầu đối với IP được đặt trước định nghĩa về các mục đích mà hệ thống này sẽ được phát triển. Mục tiêu IS xác định ranh giới của lĩnh vực chủ đề, các đối tượng, các thuộc tính và mối quan hệ của chúng có ý nghĩa quan trọng theo quan điểm của các mục tiêu đã đặt ra và sẽ được trình bày trong IS (đây là thông tin về lĩnh vực chủ đề - thông tin phần mềm) . Các mục tiêu của IS cũng xác định người dùng nào và thông tin nào cần hệ thống sẽ phục vụ (đây là thông tin về nhu cầu của người dùng - PP-information). Hai thành phần này: thông tin phần mềm (phản ánh khách quan của lĩnh vực chủ đề) và thông tin phần mềm (phản ánh phần nào nhận thức chủ quan của người sử dụng) đều cần thiết và quan trọng như nhau để xây dựng mô hình khái niệm, được trình bày trong Hình. 14 7. Đôi khi thuật ngữ thứ hai chiếm ưu thế trong mô hình khái niệm, dựa trên việc xem xét các ứng dụng hiện tại và có thể thấy trước, vì điều này giúp tạo hệ thống nhanh hơn và dễ dàng hơn. Tuy nhiên, các hệ thống như vậy hóa ra không phù hợp để xử lý các nhiệm vụ và yêu cầu không được chuẩn hóa, thay đổi và không lường trước được. Sự phản ánh đầy đủ thông tin phần mềm trong hệ thống mang lại cho nó sự linh hoạt cần thiết và khả năng thích ứng với các điều kiện thay đổi.

O sơ đồ chung của thiết kế ý tưởng:

Đề án trong hình. 16 đại diện cho hai giai đoạn thiết kế: thu thập và phân tích ý nghĩa thông tin về lĩnh vực chủ đề và các nhiệm vụ ứng dụng của người dùng; phân tích dữ liệu khái niệm và tổng hợp mô hình khái niệm.

Giai đoạn đầu tiên là thu thập dữ liệu về lĩnh vực chủ đề, có thể thu được từ các phép đo hoặc quan sát, nghiên cứu các báo cáo và tài liệu, khảo sát các chuyên gia và xác định danh sách các nhiệm vụ cần được giải quyết bằng cách sử dụng hệ thống đã phát triển. Thông tin kết quả có thể hơi chủ quan. Để tăng tính khách quan của nó, các phương pháp đánh giá của chuyên gia được sử dụng, phân tích có ý nghĩa được thực hiện để loại bỏ thông tin trùng lặp, xác định các mâu thuẫn và sự mơ hồ, v.v.

Mô hình IS và phương pháp thiết kế

Đặc điểm chính của sự phát triển của hệ thống thông tin hiện đại là sự tập trung phức tạp ở các giai đoạn ban đầu của việc phân tích yêu cầu và thiết kế các đặc tả của hệ thống. Sự mờ nhạt và không đầy đủ của các yêu cầu hệ thống, các vấn đề chưa được giải quyết và các lỗi được thực hiện ở các giai đoạn phân tích và thiết kế, dẫn đến các vấn đề khó khăn, thường là không thể giải quyết ở các giai đoạn tiếp theo và cuối cùng dẫn đến sự thất bại của toàn bộ công việc.

Hai lĩnh vực hoạt động liên quan trực tiếp đến việc thiết kế IS: 1) thiết kế thực tế của IS của các tổ chức cụ thể dựa trên các thành phần phần cứng và phần mềm làm sẵn bằng cách sử dụng các công cụ phát triển đặc biệt; 2) thiết kế các thành phần và công cụ IS đã đề cập theo định hướng để tái sử dụng trong quá trình phát triển của nhiều hệ thống thông tin cụ thể. tám

Thuật ngữ "tích hợp hệ thống" được sử dụng để chỉ định hướng đầu tiên. Trong trường hợp này, nhà phát triển IS phải là chuyên gia trong lĩnh vực kỹ thuật hệ thống, có kiến ​​thức tốt về các tiêu chuẩn quốc tế, trạng thái và xu hướng phát triển của công nghệ thông tin và sản phẩm phần mềm, thông thạo các công cụ phát triển ứng dụng (CASE-tools ) và sẵn sàng nhận thức và phân tích các quy trình ứng dụng tự động với sự hợp tác của các chuyên gia trong lĩnh vực chủ đề liên quan.

Hướng thứ hai liên quan nhiều hơn đến việc phát triển toán học và phần mềm để thực hiện các chức năng IS - các mô hình, phương pháp, thuật toán, chương trình dựa trên kiến ​​thức về các phương pháp phân tích và tổng hợp các giải pháp thiết kế, công nghệ lập trình, hệ điều hành, v.v.

Cả ở giai đoạn khảo sát và ở các giai đoạn tiếp theo, nên tuân thủ một số nguyên tắc xác định và trình bày các kết quả thu được, dựa trên một hoặc một phương pháp luận khác để chính thức hóa các thông số kỹ thuật. Việc chính thức hóa là cần thiết để những người thực hiện và khách hàng hiểu rõ ràng về các yêu cầu, hạn chế và quyết định được đưa ra.

Trong thiết kế khái niệm, một số thông số kỹ thuật được sử dụng, trong đó các mô hình chuyển đổi, lưu trữ và truyền tải thông tin chiếm vị trí trung tâm. Các mô hình thu được trong quá trình nghiên cứu lĩnh vực chủ đề, bao gồm khảo sát về tổ chức, là các mô hình hoạt động của tổ chức. đã được coi là mô hình của IS được thiết kế.

Có các mô hình chức năng, thông tin, hành vi và cấu trúc 9. Mô hình chức năng của hệ thống mô tả tập hợp các chức năng được thực hiện bởi hệ thống. Thông tin mô hình phản ánh cấu trúc dữ liệu - thành phần và mối quan hệ của chúng. Các mô hình hành vi mô tả các quá trình thông tin (động lực của hoạt động), chúng bao gồm các phạm trù như trạng thái của hệ thống, một sự kiện, sự chuyển đổi từ trạng thái này sang trạng thái khác, các điều kiện chuyển tiếp, một chuỗi các sự kiện. Mô hình cấu trúc đặc trưng cho hình thái của hệ thống (cấu tạo của nó) - thành phần của các hệ thống con, mối quan hệ của chúng.

Do đó, các chức năng (trả lời câu hỏi "Làm gì?"), Cùng với dữ liệu ban đầu ("Làm gì?"), Các ràng buộc (thời gian, nguồn lực tài chính và vật chất, văn bản quy định hoặc quy tắc kinh doanh, v.v.), phương tiện thực hiện ("Làm gì?") và kết quả ("Làm gì?") mô tả IS dự kiến.

Có một số cách để xây dựng và biểu diễn mô hình, khác nhau đối với các loại mô hình khác nhau. Cơ sở là phân tích cấu trúc - một phương pháp nghiên cứu hệ thống, bắt đầu với tổng quan chung của nó và sau đó đi vào chi tiết, hình thành một cấu trúc phân cấp với số lượng cấp độ ngày càng tăng. Tất cả các phương pháp luận tiếp cận cấu trúc phổ biến nhất đều dựa trên một số nguyên tắc chung. Các nguyên tắc cơ bản là:

    nguyên tắc “chia để trị” - nguyên tắc giải quyết các vấn đề phức tạp bằng cách chia nhỏ chúng thành nhiều nhiệm vụ độc lập nhỏ hơn dễ hiểu và dễ giải quyết;

    nguyên tắc sắp xếp thứ bậc - nguyên tắc tổ chức các bộ phận cấu thành của vấn đề thành cấu trúc cây có thứ bậc với việc bổ sung các chi tiết mới ở mỗi cấp độ.

Việc lựa chọn hai nguyên tắc cơ bản không có nghĩa là các nguyên tắc còn lại là thứ yếu, vì việc bỏ qua bất kỳ nguyên tắc nào trong số đó có thể dẫn đến những hậu quả khó lường (bao gồm cả sự thất bại của toàn bộ dự án). Các nguyên tắc chính của những nguyên tắc này là:

    nguyên tắc trừu tượng - là làm nổi bật các khía cạnh thiết yếu của hệ thống và trừu tượng hóa từ không thiết yếu;

    nguyên tắc chính thức hóa - nằm ở chỗ cần có một phương pháp luận chặt chẽ để giải quyết vấn đề;

    nguyên tắc nhất quán - nằm ở tính hợp lệ và nhất quán của các yếu tố;

    nguyên tắc cấu trúc dữ liệu - là dữ liệu phải được cấu trúc và tổ chức phân cấp.

Hiện nay, khoảng 90 loại phân tích hệ thống cấu trúc đã được biết đến, có thể được phân loại theo trường phái (để mô hình hóa hệ thống phần mềm hoặc hệ thống nói chung), theo trình tự xây dựng mô hình (tuyên bố tính ưu việt của mô hình chức năng hoặc thông tin), theo loại hệ thống mục tiêu (hệ thống thông tin hoặc hệ thống thời gian thực) 10. Mặc dù có nhiều phương pháp như vậy, nhưng hầu như tất cả chúng đều sử dụng ba nhóm công cụ:

    DFD (Sơ đồ luồng dữ liệu) - sơ đồ luồng dữ liệu hoặc sơ đồ SADT (Kỹ thuật phân tích và thiết kế có cấu trúc) minh họa các chức năng mà hệ thống phải thực hiện;

    ERD (Entity-Relationship Sơ đồ) - sơ đồ mối quan hệ-thực thể mô hình hóa mối quan hệ giữa các dữ liệu;

    STD (Sơ đồ chuyển đổi trạng thái) - sơ đồ chuyển đổi trạng thái mô hình hóa hành vi phụ thuộc vào thời gian của hệ thống (các khía cạnh thời gian thực).

Ngoài các mô hình này, ở giai đoạn thiết kế cấu trúc, kỹ thuật bản đồ cấu trúc được sử dụng để mô tả các mối quan hệ giữa các mô-đun (bản đồ cấu trúc Constantine) và cấu trúc bên trong của các mô-đun (bản đồ cấu trúc Jackson).

Sự khác biệt đáng kể nhất giữa các loại phân tích cấu trúc nằm ở các phương pháp và phương tiện của mô hình chức năng, vì đối với mô hình thông tin và hành vi hiện thực tế không có giải pháp thay thế ERD và STD tương ứng. Tiếp theo, hãy xem xét các khái niệm cơ bản liên quan đến các kỹ thuật thiết kế trên.