XML入门的常见问题(四)
在XML对象模型中如何处理空白字符?
有些时候,XML对象模型将显示包含空白字符的TEXT节点。空白字符被截断后,多半会带来一些混乱。例如下面的XML例子:
]>
Smith
John
生成下列树:
ProcessingInstruction:xml
DocType:person
ELEMENT:person
TEXT:
ELEMENT:lastname
TEXT:
ELEMENT:firstname
TEXT:
名字和姓氏两边是只包含空白字符的TEXT节点,因为“person”元素的内容模型是MIXED;它包含#PCDATA关键字。MIXED内容模型指定元素之间可以有文本存在。因此,下面的内容也是正确的:
MylastnameisSmithandmyfirstnameis
John
结果是类似于下面的树:
ELEMENT:person
TEXT:Mylastnameis
ELEMENT:lastname
TEXT:andmyfirstnameis
ELEMENT:firstname
TEXT:
如果没有单词“is”之后和之前的空白字符,以及之后和单词“and”之前的空白字符,那么句子便无法理解。因此,对于MIXED内容模型来说,文字组合、空白字符和元素都是相关的。对于非MIXED内容模型来说则不是这样。
要使只有空白字符的TEXT节点消失,请从“person”元素声明中删除#PCDATA关键字:
结果是下面清晰的树:
ProcessingInstruction:xml
DocType:person
ELEMENT:person
ELEMENT:lastname
ELEMENT:firstname
XML声明做什么?
XML声明必须列在XML文档的顶部:
它指定下面的项目:
该文档是XML文档。在丢失或者还没有指定MIME类型时MIME探测器可以用它来检测文件是否为类型text/xml。
文档符合XML1.0规范。在以后XML有其他版本时这一点很重要。
文档字符编码。编码属性是可选的,默认为UTF-8。
注意:XML声明必须在XML文档的第一行,因此下面的XML文件:
产生下面的分析错误:
无效的xml声明。
行0000002:
位置 0000007:------^
注意:XML声明是可选的。如果需要在顶部指定注释或者处理指令,那么请不要放入XML声明。但是,默认的编码将为UTF-8。
如何以可读格式打印我的XML文档?
在用DOM从零开始构造文档以产生XML文件时,任何内容都在一行上,相互之间没有空格。这是默认的行为。
构造在InternetExplorer5中的默认XSL样式表,以可读格式显示和打印XML文档。例如,如果已经安装了IE5,请尝试查看nospace.xml文件。浏览器中应该显示下面的树:
-
-
XYZ
12.56
在XML中没有插入空白字符。
打印可读XML是非常有趣的,特别是有定义不同类型内容模型的DTD时。例如,在混合内容模型(#PCDATA)下不能插入空格,因为它可能改变内容的含义。比如请考虑下面的XML:
Elephant
这最好不输出为:
E
lephant
因为单词边界不再正确。
所有这些都使自动化打印成为问题。如果不需要打印可读XML,那么可以使用DOM在适当的位置插入空白字符作为文本节点。
如何在DTD中使用名称空间?要在DTD中使用名称空间,请在使用它的元素的ATTLIST声明中声明它,如下所示:
名称空间类型必须为#FIXED。属性的名称空间也是这样:
名称空间和XML架构
DTD和XML架构不能混合。例如,下面的
xmlns:xCDATA#FIXED"x-schema:myschema.xml"
将不导致使用在myschema.xml中定义的架构定义。对DTD和XML架构的使用是互斥的。
如何在VisualBasic中使用XMLDSO?
使用下面的XML作为例子:
MarkHanson
2067654583
JaneSmith
4258081111
可以按如下方式绑定到ADO记录集:
创建新的VB6.0项目。
添加对MicrosoftActiveXDataObjects2.1或更高版本、MicrosoftDataAdapterLibrary和MicrosoftXML2.0版的引用。
用下面的代码将XML数据加载到XMLDSO控件中:
DimdsoAsNewXMLDSOControl
DimdocAsIXMLDOMDocument
Setdoc=dso.XMLDocument
doc.Load("d:\test.xml")
用下面的代码将DSO映射到使用DataAdapter的新记录集对象中:
DimdaAsNewDataAdapter
Setda.Object=dso
DimrsAsNewADODB.Recordset
Setrs.DataSource=da
访问数据:
MsgBoxrs.Fields("name").Value
结果显示字符串“MarkHanson”
如何在Java中使用XMLDOM?
必须已经安装MSXML.DLL的IE5版本。在VisualJ++6.0中,从项目菜单选择添加COM包装程序,然后从COM对象列表中选择“MicrosoftXML1.0”。该操作将把所需的Java包装程序构造到称为“msxml”的新软件包中。这些预先构造的Java包装程序也可以下载。类可以按如下方法使用:
importcom.ms.com.*;
importmsxml.*;
publicclassClass1
{
publicstaticvoidmain(String[]args)
{
DOMDocumentdoc=newDOMDocument();
doc.load(newVariant("file://d:/samples/ot.xml"));
System.out.println("Loaded"+doc.getDocumentElement().getNodeName());
}
}
代码示例将从sunreligion示例中加载3.8MB测试文件“ot.xml”。Variant类用于包装Win32VARIANT基本类型。
因为在每次检索节点时实际上都获得了新的包装程序,因此不能在节点上使用指针比较。因此,不要使用下面的代码,
IXMLDOMNoderoot1=doc.getDocumentElement();
IXMLDOMNoderoot2=doc.getDocumentElement();
if(root1==root2)...
而要使用下面的代码:
if(ComLib.isEqualUnknown(root1,root2))....
.class包装程序的总大小大约为160KB。但是,为了与W3C规范完全符合,应该只使用IXMLDOM*包装程序。下面的类是旧的IE4.0XML接口,可以从msxml文件夹中删除它们:
IXMLAttribute*,
IXMLDocument*,XMLDocument*
IXMLElement*,
IXMLError*,
IXMLElementCollection*,
tagXMLEMEM_TYPE*
_xml_error*
这使大小减少为147KB。同时还可以删除下面的项目:
DOMFreeThreadedDocument
在Java应用程序中从多个线程访问XML文档。
XMLHttpRequest
用XMLDAVHTTP扩展与服务器通信。
IXTLRuntime
定义XSL样式表脚本对象。
XMLDSOControl
绑定到HTML页面中的XML数据。
XMLDOMDocumentEvents
在分析过程中返回回调。
这可以将大小减少到116KB。要使它更小,请考虑DOM本身有两层的事实:核心层包括:
DOMDocument,IXMLDOMDocument
IXMLDOMNode*
IXMLDOMNodeList*
IXMLDOMNamedNodeMap*
IXMLDOMDocumentFragment*
IXMLDOMImplementation
IXMLDOMParseError
和用户可能需要保留的DTD信息:
IXMLDOMDocumentType
IXMLDOMEntity
IXMLDOMNotation
XML文档中的所有节点类型都是IXMLDOMNode,它提供全部功能,但是存在每种节点类型的更高级别的包装程序。因此,如果修改DOMDocument包装程序并将这些特定类型更改为使用IXMLDOMNode,那么所有下面的接口都可以删除:
IXMLDOMAttribute
IXMLDOMCDATASection
IXMLDOMCharacterData
IXMLDOMComment
IXMLDOMElement
IXMLDOMProcessingInstruction
IXMLDOMEntityReference
IXMLDOMText
删除这些将使大小减少到61KB。但是,对IXMLDOMElement来说,getAttribute和setAttribute方法都是有用的。否则需要使用:
IXMLDOMNode.getAttributes().setNamedItem(...)
相关文章
- Java操作XML文件
- XML简单入门_XML文件都有哪些应用
- Vue中使用XML和JSON格式互转插件
- ORA-42040: cannot online redefine table “string”.”string” with column of binary XML type ORACLE 报错 故障修复 远程处理
- mybatis 详解(二)——入门实例(基于XML)编程语言
- Oracle 视图 ALL_XML_SCHEMA_SUBSTGRP_HEAD 官方解释,作用,如何使用详细说明
- MyBatis实现映射器的2种方式:XML文件形式和注解形式
- XML数据导入MSSQL:实现简便迅速(xml导入mssql)
- Oracle 数据库管理中的 XML 文件定义(.xml oracle)
- XML配置,实现Redis安全访问(xml配置redis密码)
- MySQL处理XML小于符号的方法(mysql xml小于)
- 使用MySQL实现XML数据导入(mysql xml 导入)
- MySQL和XML 如何高效存储数据(mysql xml 存储)
- 解决Oracle中XML乱码问题(oracle中xml乱码)
- 使用MySQL处理XML文件时如何比较大小(mysql xml 大于)
- 使用MySQL的XML函数解析数据(mysql xml函数)
- 利用Oracle XML组件让数据处理更高效(oracle xml组件)
- XML指南――XML浏览器(Netscape、Explorer)
- XML与HTML的结合(上)
- XML入门的常见问题(一)
- js跨浏览器实现将字符串转化为xml对象的方法
- c#正反序列化XML文件示例(xml序列化)
- C#针对xml基本操作及保存配置文件应用实例
- 用javascript读取xml文件读取节点数据