Hiển thị xml trên World Wide Web. Khái niệm cơ bản về XML
Tiêu chuẩn xác định hai cấp độ hiệu lực của tài liệu XML:
- Được xây dựng tốt(Đúng ngữ pháp). Một tài liệu được định dạng tốt tuân theo tất cả các quy tắc cú pháp XML chung áp dụng cho bất kỳ tài liệu XML nào. Và nếu, ví dụ: thẻ bắt đầu không có thẻ kết thúc tương ứng, thì điều này xây dựng không đúng cách Tài liệu XML. Một tài liệu không được định dạng tốt không thể được coi là một tài liệu XML; Bộ xử lý XML (trình phân tích cú pháp) không nên xử lý nó theo cách thông thường và có nghĩa vụ phân loại tình huống là một lỗi nghiêm trọng.
- Có giá trị(Có giá trị). Một tài liệu hợp lệ cũng tuân theo một số quy tắc ngữ nghĩa. Đây là hoạt động kiểm tra bổ sung chặt chẽ hơn về tính đúng đắn của tài liệu để tuân thủ các quy tắc bên ngoài đã xác định trước, nhưng đã có sẵn, nhằm giảm thiểu số lượng lỗi, ví dụ, cấu trúc và thành phần của một tài liệu nhất định hoặc một họ tài liệu. Các quy tắc này có thể được phát triển bởi cả người dùng và các nhà phát triển bên thứ ba, chẳng hạn như các nhà phát triển từ điển hoặc các tiêu chuẩn trao đổi dữ liệu. Thông thường, các quy tắc như vậy được lưu trữ trong các tệp đặc biệt - các lược đồ, nơi cấu trúc của tài liệu, tất cả các tên được phép của các phần tử, thuộc tính và nhiều thứ khác được mô tả một cách chi tiết nhất. Và nếu một tài liệu, chẳng hạn, chứa tên phần tử không được xác định trước trong các lược đồ, thì tài liệu XML được coi là không hợp lệ; bộ xử lý XML xác thực (trình xác thực), khi kiểm tra sự tuân thủ các quy tắc và lược đồ, có nghĩa vụ (theo lựa chọn của người dùng) báo cáo lỗi.
Hai khái niệm này không có bản dịch chuẩn hóa đầy đủ sang tiếng Nga, đặc biệt là khái niệm có giá trị cũng có thể được dịch là có giá trị, hợp pháp, đáng tin cậy, Phù hợp, hoặc thậm chí được kiểm tra để tuân thủ các quy tắc, tiêu chuẩn, luật pháp... Một số lập trình viên sử dụng giấy theo dõi được thiết lập tốt trong cuộc sống hàng ngày " Validny».
Cú pháp XML
Phần này chỉ đề cập đến xây dựng chính xác Các tài liệu XML, nghĩa là, cú pháp của chúng.
XML là một cấu trúc phân cấp được thiết kế để lưu trữ bất kỳ dữ liệu nào; về mặt trực quan, cấu trúc này có thể được biểu diễn dưới dạng cây. Yêu cầu cú pháp bắt buộc quan trọng nhất là tài liệu chỉ có một phần tử gốc(phần tử gốc) (cách gọi khác là phần tử tài liệu). Điều này có nghĩa là văn bản hoặc dữ liệu khác của toàn bộ tài liệu phải được đặt giữa thứ duy nhất thẻ gốc bắt đầu và thẻ đóng tương ứng của nó.
Ví dụ đơn giản nhất sau đây là một tài liệu XML được định dạng tốt: Dòng đầu tiên của tài liệu XML được gọi là Khai báo XML(Khai báo XML) là một chuỗi tùy chọn cho biết phiên bản của tiêu chuẩn XML (thường là 1.0), mã hóa ký tự và các phụ thuộc bên ngoài cũng có thể được chỉ định tại đây. Đặc tả yêu cầu bộ xử lý XML hỗ trợ các bảng mã Unicode UTF-8 và UTF-16 (UTF-32 là tùy chọn). Các bảng mã khác dựa trên tiêu chuẩn ISO / IEC 8859 được công nhận là có thể chấp nhận được, được hỗ trợ và sử dụng rộng rãi (nhưng không bắt buộc), các bảng mã khác cũng được chấp nhận, ví dụ, Russian Windows-1251, KOI-8.
Một lời bình luận có thể đặt ở bất cứ đâu trên cây. Nhận xét XML được đặt bên trong một cặp thẻ ... Không thể sử dụng hai ký tự gạch nối (-) ở bất kỳ đâu trong nhận xét.
Dưới đây là ví dụ về một công thức nấu ăn đơn giản được gắn thẻ XML:
Kết cấu
Phần còn lại của tài liệu XML này bao gồm các yếu tố một số trong số đó có thuộc tính và Nội dung. Yếu tố thường bao gồm thẻ bắt đầu và thẻ kết thúc đóng khung văn bản và các phần tử khác. Thẻ mở bao gồm tên phần tử trong dấu ngoặc nhọn, ví dụ: “
Trong ví dụ trên, phần tử "thành phần" có hai thuộc tính: "số lượng", có giá trị "3" và "đơn vị", có giá trị "kính". Theo quan điểm của đánh dấu XML, các thuộc tính đã cho không có ý nghĩa gì, mà chỉ là một tập hợp các ký tự.
Ngoài văn bản, một phần tử có thể chứa các phần tử khác:
Trong trường hợp này, phần tử "Hướng dẫn" chứa ba phần tử "bước". XML không cho phép các phần tử chồng chéo. Ví dụ: đoạn mã dưới đây không chính xác vì các phần tử "em" và "strong" chồng chéo lên nhau.
Bình thường có dấu đánh dấu và làm nổi bật tận tụy
Mỗi tài liệu XML phải chứa chính xác một phần tử gốc(phần tử gốc hoặc phần tử tài liệu), vì vậy đoạn mã sau không thể được coi là một tài liệu XML hợp lệ.
Để biểu thị một phần tử không có nội dung được gọi là phần tử trống, cần thiết sử dụng một dạng bản ghi đặc biệt, bao gồm một thẻ, trong đó dấu gạch chéo được đặt sau tên phần tử. Nếu một phần tử không được khai báo trống trong DTD, nhưng nó không có nội dung trong tài liệu, thì cho phépáp dụng hình thức nhập cảnh này. Ví dụ:
XML định nghĩa hai phương thức để viết các ký tự đặc biệt: tham chiếu thực thể và tham chiếu ký tự. Bản chất(thực thể) trong XML là dữ liệu được đặt tên, thường là dạng văn bản, cụ thể là các ký tự đặc biệt. Tham chiếu thực thể(tham chiếu đối tượng) được chỉ định nơi đối tượng phải có và bao gồm dấu và ("&"), tên của đối tượng và dấu chấm phẩy (";"). XML có một số thực thể được xác định trước chẳng hạn như "lt" (bạn có thể tham khảo nó bằng cách viết "< ») для левой угловой скобки и « amp » (ссылка - « & ») для амперсанда, возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков. Ниже приведён пример использования предопределённой сущности для избежания использования знака амперсанда в названии:
Danh sách đầy đủ các thực thể được xác định trước bao gồm & ("&"),< («<»), >(">"), "(" ""), Và "(" "") - hai ký tự cuối cùng hữu ích để viết các dấu phân cách trong các giá trị thuộc tính. Bạn có thể xác định các thực thể của mình trong tài liệu DTD.
Đôi khi cần phải xác định một khoảng trắng không ngắt, rất thường được sử dụng trong HTML và được biểu thị là không có thực thể được xác định trước như vậy trong XML, nó được viết ra và việc sử dụng nó gây ra lỗi. Việc thiếu bản chất rất phổ biến này đối với nhiều lập trình viên thường gây ngạc nhiên và điều này gây ra một số khó khăn khi chuyển các phát triển HTML của họ sang XML.
Tham chiếu theo số ký hiệu(Tham chiếu ký tự số) trông giống như một tham chiếu thực thể, nhưng thay vì tên thực thể, ký tự # được biểu thị và một số (theo ký hiệu thập phân hoặc thập lục phân) là số ký tự trong bảng mã Unicode. Đây thường là những ký tự không thể được mã hóa trực tiếp, chẳng hạn như một chữ cái Ả Rập trong tài liệu được mã hóa ASCII. Dấu và có thể được biểu diễn như sau:
Có nhiều quy tắc khác về cách viết một tài liệu XML được định dạng tốt, nhưng mục đích của phần tổng quan ngắn gọn này chỉ là để cho bạn thấy những điều cơ bản cần thiết để hiểu cấu trúc của một tài liệu XML.
Môn lịch sử
Có thể coi năm ra đời của XML là 1996, khi phiên bản nháp của đặc tả ngôn ngữ xuất hiện, hoặc khi đặc tả này được phê duyệt. Tất cả bắt đầu với sự xuất hiện vào năm 1986 của ngôn ngữ SGML.
SGML (Ngôn ngữ đánh dấu tổng quát tiêu chuẩn) đã tự khẳng định mình là một siêu ngôn ngữ linh hoạt, phức tạp và toàn diện để tạo ngôn ngữ đánh dấu. Mặc dù thực tế là khái niệm siêu văn bản đã xuất hiện vào năm 1965 (và các nguyên tắc cơ bản được xây dựng vào năm 1945), SGML không có một mô hình siêu văn bản. Việc tạo ra SGML có thể được gọi một cách an toàn là một nỗ lực để nắm bắt được tính rộng lớn, vì nó kết hợp các tính năng hiếm khi được sử dụng tất cả lại với nhau. Đây là nhược điểm chính của nó - sự phức tạp và do đó, chi phí cao của ngôn ngữ này chỉ giới hạn việc sử dụng ngôn ngữ này cho các công ty lớn có đủ khả năng mua phần mềm thích hợp và thuê các chuyên gia được trả lương cao. Ngoài ra, các công ty nhỏ hiếm khi gặp các vấn đề phức tạp như liên quan đến SGML trong giải pháp của họ.
SGML được sử dụng rộng rãi nhất để tạo ra các ngôn ngữ đánh dấu khác, nhờ sự trợ giúp của nó mà ngôn ngữ đánh dấu cho các tài liệu siêu văn bản - HTML, đã được tạo ra, đặc tả của ngôn ngữ này đã được phê duyệt vào năm 1992. Sự xuất hiện của nó gắn liền với nhu cầu sắp xếp một loạt các tài liệu đang phát triển nhanh chóng trên Internet. Sự phát triển bùng nổ về số lượng kết nối Internet và do đó, các máy chủ Web đã dẫn đến nhu cầu mã hóa các tài liệu điện tử mà SGML không thể đáp ứng được do độ khó học cao. Sự ra đời của HTML, một ngôn ngữ đánh dấu rất đơn giản, đã nhanh chóng giải quyết vấn đề này: tính dễ học và các công cụ tài liệu phong phú đã khiến nó trở thành ngôn ngữ phổ biến nhất đối với người dùng Internet. Nhưng khi số lượng và chất lượng của các tài liệu trên Web ngày càng tăng, thì nhu cầu về chúng cũng tăng theo và tính đơn giản của HTML đã trở thành nhược điểm chính của nó. Số lượng thẻ hạn chế và sự thờ ơ hoàn toàn với cấu trúc của tài liệu đã thúc đẩy các nhà phát triển trực thuộc tập đoàn W3C tạo ra một ngôn ngữ đánh dấu không phức tạp như SGML và không nguyên thủy như HTML. Kết quả là, XML ra đời bằng cách kết hợp tính đơn giản của HTML với logic của đánh dấu SGML và đáp ứng nhu cầu của Internet.
Ưu điểm và nhược điểm
Phẩm giá
nhược điểm
- Sự mơ hồ của mô hình hóa.
- XML không hỗ trợ ngôn ngữ mẹ đẻ cho các kiểu dữ liệu. Nó không có kiểu gõ mạnh, nghĩa là các khái niệm "số nguyên", "chuỗi", "ngày tháng", "boolean", v.v.
- Mô hình dữ liệu phân cấp do XML cung cấp bị hạn chế so với mô hình quan hệ và đồ thị hướng đối tượng và mô hình dữ liệu mạng.
Ánh xạ XML trên World Wide Web
Có ba cách phổ biến nhất để chuyển đổi tài liệu XML sang dạng xem người dùng có thể nhìn thấy:
- Áp dụng các kiểu CSS;
- Áp dụng Chuyển đổi XSLT;
- Viết bộ xử lý tài liệu XML bằng ngôn ngữ lập trình.
Không có CSS hoặc XSL, tài liệu XML xuất hiện dưới dạng văn bản thuần túy trong hầu hết các trình duyệt Web. Một số trình duyệt như Internet Explorer, Mozilla và Mozilla Firefox hiển thị cấu trúc tài liệu dưới dạng cây, cho phép thu gọn và mở rộng các nút bằng cách nhấp chuột.
Áp dụng các kiểu CSS
Quá trình này tương tự như áp dụng CSS vào một tài liệu HTML để hiển thị.
Để áp dụng CSS khi được hiển thị trong trình duyệt, tài liệu XML phải chứa một liên kết cụ thể đến biểu định kiểu. Ví dụ:
Điều này khác với cách tiếp cận HTML trong đó phần tử được sử dụng .
Áp dụng Chuyển đổi XSLT
XSL là công nghệ mô tả cách định dạng hoặc chuyển đổi dữ liệu trong tài liệu XML. Tài liệu được chuyển đổi thành định dạng phù hợp để hiển thị trong trình duyệt. Trình duyệt là cách sử dụng XSL phổ biến nhất, nhưng hãy nhớ rằng bạn có thể sử dụng XSL để chuyển đổi XML thành bất kỳ định dạng nào, chẳng hạn
Mục đích của bài học
Làm quen với công nghệ XML. Khám phá khả năng biểu diễn các tài liệu XML trong HTML. Sử dụng JavaScript để điều hướng bảng XML và tìm kiếm dữ liệu theo điều kiện. Văn học được đề xuất.
Thông tin lý thuyết ngắn gọn
Công nghệ XML (eXtensible Markup Language) được tạo ra vào cuối những năm 90 của thế kỷ trước. Các lợi ích chính của văn bản XML:
□ có cấu trúc cơ sở dữ liệu, máy tính và con người có thể truy cập được;
□ được xử lý thuận tiện bằng các ngôn ngữ lập trình hiện đại;
□ dễ dàng dịch sang HTML.
Hãy xem xét ví dụ sau về cơ sở dữ liệu văn bản được viết bằng XML:
Đây là một ví dụ về một tài liệu XML được định dạng tốt với các thẻ là các phần tử Các yếu tố trong văn bản được sắp xếp giống như một cái cây với một yếu tố đầu Ba người đàn ông trên thuyền. Nhập văn bản này vào bất kỳ trình soạn thảo nào và lưu nó dưới dạng tệp văn bản đơn giản với phần mở rộng xml - ví dụ: đặt tên tệp này là textbd.xml. Bạn có thể xem tệp này bằng Internet Explorer giống như khi bạn xem tệp HTML. Trong trường hợp có lỗi, trình thông dịch XML sẽ cung cấp thông tin chi tiết về vị trí và bản chất của lỗi. Bây giờ chúng tôi sẽ hướng dẫn cách dịch đầu ra này thành dạng bảng HTML, được thực hiện bằng các công cụ HTML. Hãy tạo tệp HTML sau (Liệt kê 2.12). Liệt kê 2.12. Tài liệu HTML để hiển thị bảng XML
Tên sách | Tác giả | Giá |
---|
Tên sách | Tác giả | Giá |
---|
Tên sách | Tác giả | Giá |
---|