图片 1

您可能听 IT 部门的人员说过“标准格式”的 XML。标准格式的 XML
文件遵循一组管理 XML 的、非常严格的规则。如果文件不遵循这些规则,XML
就会停止运行。例如,在上面的代码示例中,每一个开始标记都有对应的结束标记,因此该示例遵循一种标准格式的规则。如果您删除一个标记,然后尝试在一个
Office
程序中打开该文件,您将会看到一条错误消息,并且该程序会阻止您使用该文件。

如何在DTD中声明实体
<!-- 6.1 Named entity for site name: -->
<!ENTITY dw "developerWorks">

<!-- 6.2 External entity for re-use: -->
<!ENTITY bio SYSTEM "dw-author-bio.xml">

<!-- 6.3 Parameter entity for use in DTD -->
<!ENTITY % English "en-US|en-CA|en-UK">

架构可能非常复杂,教您怎样创建架构并不属于本文的范畴。(另外,IT
部门人员应该知道如何创建架构。)不过,了解架构的外观还是有用的。下面的架构定义了
… 标记集的规则。

您不必了解创建标准格式 XML 的规则,但确实需要记住:只有在 XML
数据采用了标准格式的情况下,才可以在程序和系统之间共享该数据。如果某个
XML 文件无法打开,则该文件很可能不是标准格式的。

构建 XML

XML 文件由 内容标记 组成。通常,标记包围内容。


-示例架构中的行项目被称为“声明”。如果需要有关宠物的其他信息,IT
部门可能需要向架构中添加声明。您可以根据业务需求的变化来更改 XML 系统。
-声明对数据结构具有较强的控制能力。例如, 声明表示 和
等标记必须按照上面列出的顺序显示。声明也可以控制用户输入的数据类型。例如,上面的架构要求猫的年龄必须为正数,而对于
ALTERED 和 DECLAWED 标记则必须为布尔值。 -当 XML
文件中的数据遵循架构所提供的规则时,数据就是有效数据。根据架构检查 XML
数据文件的过程称为“验证”。架构的突出优点是可以帮助防止数据损坏。使用架构也可以很容易地发现损坏的数据,因为
XML 遇到问题时将会停止运行。

除了使用标准格式的标记数据之外,XML
系统通常还使用其他两种组件:架构和转换。以下部分将介绍这两种组件的工作方式。

创建根元素

一个文件只能有一个根元素,并且需要使用 “包装器”
包含它。一个文件只能有一个根元素,并且需要使用 “包装器”
包含它。内容和其他标记必须放在 根元素 中间。

不必对术语“架构”望而生畏。架构只不过是一种包含某些规则的 XML
文件,这些规则用来定义 XML
数据文件中能包含哪些内容,不能包含哪些内容。架构文件通常使用 .xsd
文件扩展名,而 XML 数据文件使用 .xml 扩展名。

图片 2

创建 XML 文件

XML 文档的第一行通常是一个 XML 声明。
形式:<?xml version="1.0" encoding="utf-8"?>
作用:将文件识别为 XML 文件,有助于工具和人类识别 XML(不会误认为是 SGML
或其他标记)。
PS:什么情况下通常忽略这个可选信息?打算将多个小的 XML 文件合并为一个大
XML 文件。

如果不理解上面示例中的内容,不必担心。只需要记住以下事项:

XML 还不受平台的限制,这意味着,无论硬件或操作系统是什么,为使用 XML
而构建的任何程序都可以读取和处理 XML 数据。例如,利用正确的 XML
标记,就可以使用桌面程序打开和处理大型机中的数据。另外,无论是谁创建了
XML 数据体,您都可以通过若干 Microsoft Office 2003 和 Microsoft Office
专业版 2007 程序(包括 Microsoft Office Access 2007、Microsoft Office
Word 2007、Microsoft Office InfoPath 2007 和 Microsoft Office Excel
2007)处理相同的数据。由于 XML
具有可移植性,它已成为用于在数据库和用户桌面之间交换数据的最受欢迎的技术之一。

最近接触到了TVML,平时也会使用过XML。在这里也整理XML简易语法规则以便回顾查阅。文章主要介绍
XML 文档的基础结构,以及创建构造良好的 XML
需要遵循的规则,包括命名约定、正确的标记嵌套、属性规则、声明和实体。

程序可以使用架构来验证数据。架构为数据提供了结构框架,可以帮助创建者和任何其他用户理解数据。例如,如果用户输入无效数据,程序就会提示用户输入正确的数据。只要
XML 文件中的数据遵循给定架构中的规则,任何支持 XML
的程序都可以使用该架构读取、解释和处理这些数据。例如,如下图所示,Excel
和 Word 都可以根据 CAT 架构来验证 数据。

嵌套元素

把某个元素放到其他元素的内部。这些新的元素称为
元素,包含它们的元素称为 元素。
PS:注意两个错误嵌套(1.任何子元素都要完全包含在其父元素的开始和结束标记内部。2.每个同胞(Sibling)元素必须在下一个同胞元素开始之前结束。)

2.命名实体

命名实体在 DTD 或内部子集(即文档中 <!DOCTYPE>
语句的一部分)中声明,在文档中用作引用。在 XML
文档解析过程中,实体引用将由它的表示替代。
简单来说,实体就是宏,它们在我们处理文档时得到扩展。
<!ENTITY ndash "&#8211;">
&#8211 为 “–”
如上所示,命名实体由字符实体替代。我们在文档中使用 – 时,它由 Unicode
字符 U+2013(短横线 – 字符)替代。由于 –
的替代文本是一个字符引用,因此它等同于输入一个短横线字符。

Author

发表评论

电子邮件地址不会被公开。 必填项已用*标注