充实过好每一天！: 2007

批处理 for应用

作者:未知
时间:2005-09-13 21:50
出处:Blog.ChinaUnix.net
责编:chinaitpower

摘要：批处理 for应用

CSDN Blog推出文章指数概念，文章指数是对Blog文章综合评分后推算出的，综合评分项分别是该文章的点击量，回复次数，被网摘收录数量，文章长度和文章类型；满分100，每月更新一次。

裕作小记：

这几天在埋头写自己的3D文件浏览器（稍后发布），突发奇想的要把自己的内部格式转化成XML，于是，把以前在研究所时用过的ExPat翻了出来。 ExPat是基于事件的XML解释器，速度挺快的，但结构方面有点不敢恭维－－当年写配置文件的导出导入部分花了我足足1个星期！而且由于它是基于事件发生的次序（SAX），似乎有时会发生一些无法控制的情况－－例如进入某Level后忘了记录，结果……后面的程序全部死掉！这时想起同事之前推荐的 TinyXML，结果……用了不到3小时就把我的3D格式导出来了～～呵呵。以下是一篇转贴的TinyXML基础，稍后我会写一篇TinyXML的实战例子，敬请留意 :-)

PS：由于没找到正式的出处，所以把全文引用如下，并没有写上引用出处－－如果哪位朋友知道，请告知在下。
－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

TinyXml学习笔记

张弛com>

一、 TinyXml的特点

TinyXml是一个基于DOM模型的、非验证的轻量级C++解释器。

1. SAX和DOM

目前XML的解析主要有两大模型：SAX和DOM。

其中SAX是基于事件的，其基本工作流程是分析XML文档，当发现了一个新的元素时，产生一个对应事件，并调用相应的用户处理函数。这种方式占用内存少，速度快，但用户程序相应得会比较复杂。

而DOM（文档对象模型），则是在分析时，一次性的将整个XML文档进行分析，并在内存中形成对应的树结构，同时，向用户提供一系列的接口来访问和编辑该树结构。这种方式占用内存大，速度往往慢于SAX，但可以给用户提供一个面向对象的访问接口，对用户更为友好。

另据说，一些同时提供了SAX和DOM接口的库，是在底层先实现SAX，再在SAX的基础上实现DOM。

目前我知道的XML解析库有下面几个：

名称	访问接口	是否支持验证	备注
Expat	SAX/Local	不清楚	Local指它还有一套自己访问模型
LibXML2	SAX/DOM	是
TinyXml	DOM	否
XML4C	SAX/DOM	是	和Xerces-C是一家，不过用了ICU，国际化似乎更好
Xerces-C	SAX/DOM	是
XML Booster	Local	不清楚	这个库不是特别了解，好像是类似yacc那样，可以生成一个特定的解析器，估计效率应该很高（看名字也像）。

2. 验证和非验证

对于一个特定的XML文档而言，其正确性分为两个层次。首先是其格式应该符合XML的基本格式要求，比如第一行要有声明，标签的嵌套层次必须前后一致等等，符合这些要求的文件，就是一个合格的XML文件，称作well-formatted。但除此之外，一个XML文档因其内容的不同还必须在语义上符合相应的标准，这些标准由相应的DTD文件或者Schema文件来定义，符合了这些定义要求的XML文件，称作valid。

因此，解析器也分为两种，一种是验证的，即会跟据XML文件中的声明，用相应的DTD文件对XML文件进行校验，检查它是否满足DTD文件的要求。另一种是忽略DTD文件，只要基本格式正确，就可以进行解析。

就我所知，验证的解析器通常都是比较重量级的。TinyXml不支持验证，但是体积很小，用在解析格式较为简单的XML文件，比如配置文件时，特别的合适。

二、 TinyXml的构建和使用

1. 获取

TinyXml首页在http://www.grinninglizard.com/tinyxml/index.html，从这里可以找到最新版本的源代码，目前的版本是2.3.4。

2. 构建

TinyXml在构建时可以选择是否支持STL，选择的话，则可以使用std::string，所以通常应该打开这个选项。

在Windows上，TinyXml的源码包里提供了VC6的工程文件，直接用它就可以生成两个静态库（带STL和不带STL），非常容易。唯一需要注意的是，默认生成的库是单线程的，如果用在多线程的项目中，需要改动一下配置，生成相应的多线程库。

在Unix平台上，TinyXml的源码包里只提供了一个Makefile，对于典型的Linux系统，或装了gcc和gmake的其他Unix，这个Makefile足够用了，我在RH9和RHEL4上测试，简单的make就成功了。需要注意的有以下几点：默认的编译是不支持STL的，可以通过编辑Makefile的TINYXML_USE_STL := NO那一行，把NO改成YES就可以支持STL了；还有默认只生成了一个测试程序，没有生成任何库，如果要生成静态库的话，可以用ar命令，将生成的几个目标文件打包就行了，如果要生成动态库，则需要加上-fpic参数重新编译。

3. 使用

构建了相应的库之后，在使用了它们的工程中，只要在连接时把他们连上就行了。需要注意的是，如果需要STL支持，在编译用到了TinyXml的文件时，需要定义一个宏TIXML_USE_STL，对gcc，可以使用参数-DTIXML_USE_STL，对cl.exe（VC），可以使用参数/DTIXML_USE_STL，如果嫌麻烦，可以直接定义在 tinyxml.h文件里。

三、 TinyXml的编程模型

1. 类之间的关系

TinyXml实现的时DOM访问模型，因此提供了一系列的类对应XML文件中的各个节点。主要类间的关系如下图所示：

类结构图

TiXmlBase：其他类的基类，是个抽象类

TiXmlNode：表示一个节点，包含节点的一般方法，如访问自节点、兄弟节点、编辑自身、编辑子节电

TiXmlDocument：表示整个XML文档，不对应其中某个特定的节点。

TiXmlElement：表示元素节点，可以包含子节点和TiXmlAttribute

TiXmlComment：表示注释

TiXmlDeclaration：表示声明

TiXmlText：表示文本节点

TiXmlUnknown：表示未知节点，通常是出错了

TiXmlAttribute：表示一个元素的属性

下面是一个简单的例子：

version="1.0" encoding="utf-8" ?>

<book>

<name>TinyXml How To

<description>Some words…

整个文档，对应TiXmlDocument

book,name,price, description，都对应TiXmlElement

第一行对应一个TiXmlDeclaration

第二行对应一个TiXmlComment

“TinyXml How To”对应一个TiXmlText

unit则是price的一个TiXmlAttribute

这些类与XML文件中的相应元素都有很好的对应关系，因此相信参照TinyXml的文档，可以很容易的掌握各个方法的使用。

2. 需要注意的问题

各类之间的转换

由于各个节点类都从TiXmlNode继承，在使用时常常需要将TiXmlNode*类型的指针转换为其派生类的指针，在进行这种转换时，应该首先使用由TiXmlNode类提供的一系列转换函数，如ToElement(void)，而不是c++的dynamic_cast

检查返回值

由于TinyXml是一个非校验的解析器，因此当解析一个文件时，很可能文件并不包含我们预期的某个节点，在这种情况下，TinyXml将返回空指针。因此，必须要对返回值进行检查，否则将很容易出现内存访问的错误。

如何重头建立一个XML文件

先建立一个TiXmlDocument对象，然后，载入某个模板，或者直接插入一个节点作为根节点，接着就可以像打开一个已有的XML文件那样对它进行操作了。

四、总结

TinyXml最大的特点就是它很小，可以很方便的静态连接到程序里。对于像配置文件、简单的数据文件这类文件的解析，它很适合。但是由于它是非验证的，因此需要在程序里做许多检查工做，加重了程序编写的负担。因此对于复杂的XML文件，我觉得最好还是用验证的解析器来处理。

实战TinyXML

作者：裕作

（本文为原创，转贴请注明出处：http://blog.csdn.net/KyosukeNo1）

这几天在埋头写自己的3D文件浏览器（稍后发布），突发奇想的要把自己的内部格式转化成XML，于是，把以前在研究所时用过的ExPat翻了出来。 ExPat是基于事件的XML解释器，速度挺快的，但结构方面有点不敢恭维－－当年写配置文件的导出导入部分花了我足足1个星期！而且由于它是基于事件发生的次序（SAX），似乎有时会发生一些无法控制的情况－－例如进入某Level后忘了记录，结果……后面的程序全部死掉！这时想起同事之前推荐的 TinyXML，结果……用了不到3小时就把我的文件导出来了～～呵呵。在阅读本文之前，请先看看我Blog里转贴的《TinyXML学习笔记》，相信它能给各位一个关于TinyXML的初步概念。

言归正传，本文目的在于补全之前《TinyXML学习》的不足，尽量把常用的示例代码列出让大家参考。此外，在本篇最后会给出一个完整的文件读写例子，供读者参考。

1. 编程环境的设置。新建一个项目，起名叫TestTXML。到http://sourceforge.net/projects/tinyxml/ 下载TinyXML的官方例子，并编译第一个Project tinyxml（注意，最好编译Release的版本，代码比较小。然后把生成的tinyxml.lib（如果是Debug版本，叫tinyxmld.lib）连同tinystr.h和tinyxml.h一起Copy到TestTXML项目的目录中。在TestTXML项目里的头文件加入对TinyXML的引用：

#pragma comment(lib,"tinyxml.lib") // 链接Library

#include "tinyxml.h" // TinyXML的头文件

2. 建立一个XML文件：

char* sFilePath = "ikk_doc.xml"; // 文件名称

TiXmlDocument xmlDoc( sFilePath ); // 建立一个XML文件

TiXmlDeclaration Declaration( "1.0","gb2312", "yes" ); // 声明XML的属性

xmlDoc.InsertEndChild( Declaration ); // 写入基本的XML头结构

xmlDoc.SaveFile(); // 把XML文件写入硬盘

这时，在硬盘上的TestXML项目目录里，ikk_doc.xml文件已经被创建出来了。

3. 在XML文件里插入Element

所谓的Element，就是在XML里面的Tag，例如在裕作”>简历内容中，“Resume”就是Element的名字，上述的整个字符串就是一个Element。在TinyXML里，插入Element的步骤如下：

TiXmlElement* pElm = NULL;

pElm = new TiXmlElement( "resumes" ); //定义当前的子节点 pElmParent.InsertEndChild( *pElm ); // 把子节点插入父节点中

4. 在element里插入属性。在刚才例子中，name=”裕作”就是Resume的属性，其中name是属性的名字，”裕作”是属性的值。在当前子节点内插入属性的方法如下：

pElm->SetAttribute( "name", resume.sName );

5. 在XML里插入文本。在裕作”>简历内容中，“简历内容”就是一段文本，事实上，在TinyXML里，它是被当作一个Text类型的子节点来插入的。还而言之，就是在Resume的子节点中，插入这个Text子节点。插入例子如下：

TiXmlText* pText = NULL;
pText = new TiXmlText( "简历内容" ); // 定义文本的内容

pElmChild->InsertEndChild( *pText ); //把text子节点插入父节点中

在具备了以上背景知识之后，我们已经可以用TinyXML读写一个XML文件了。本文最后的程序将写入，然后重新读取一个XML文件到我们的结构里。这个XML文件的内容如下：

裕作">

男

编程

吹牛

裕作 The Great">

男

编程

以下程序将建立ikk_doc.xml文件，然后重新把内容读取进内存：

#pragma comment(lib,"tinyxml.lib")

#include "string.h"

#include "stdio.h"

#include "tinyxml.h"

#define XML_FILE "ikk_doc.xml"

#define NAME_LENGTH 256 // 名字类字符的分配长度

#define SAFE_DELETE(x) {if(x) delete x; x=NULL;} // 安全删除new分配出来的变量空间

#define SAFE_DELETE_ARRAY(x) {if(x) delete[] x; x=NULL;} // 安全删除new分配出来的数组空间

#define XML_HEADER "" // XML文件头的定义

typedef unsigned int uint32;

// 技能的结构

typedef struct skill_s {

uint32 nLevel; // 技能的程度

char sName[ NAME_LENGTH ]; // 技能的名称

skill_s() {

nLevel = 0;

sName[0] = 0;

}

} skill_t;

// 简历的结构

typedef struct resume_s {

char sName[ NAME_LENGTH ]; // 名字

bool isMan; // 是否男性

uint32 nAge; // 年龄

uint32 nNumSkill; // 技能的数目

skill_t* pSkill; // 技能的结构

resume_s() {

sName[0] = 0;

isMan = false;

nAge = 0;

nNumSkill = 0;

pSkill = NULL;

}

} resume_t;

void exportSkill( TiXmlElement* pElmParent, skill_t skill )

{

int i;

char sBuf[NAME_LENGTH]; // 一个临时存放的字符串

TiXmlElement* pElm = NULL; // 一个指向Element的指针

TiXmlText* pText = NULL; // 一个指向Text的指针

pElm = new TiXmlElement( "skill" );

// 插入等级（以属性形式）

sprintf( sBuf, "%d", skill.nLevel ); // 把Skill的登记变成字符串临时存进sBuf里

pElm->SetAttribute( "level", sBuf ); // 把等级插入Skill里

// 插入技能名称（以子Element形式）

pText = new TiXmlText( skill.sName ); // 建立一个Skill的子Element（一个Text形式的子元素）

pElm->InsertEndChild( *pText ); // 把这个Skill的子Element插入Skill里

SAFE_DELETE( pText ); // 删除这个Text

// 最后把整个Resume的子节点插入到父节点中

pElmParent->InsertEndChild( *pElm );

}

void importSkill( TiXmlElement* pElm, skill_t* pSkill )

{

int i;

char sBuf[NAME_LENGTH]; // 一个临时存放的字符串

TiXmlElement* pElmChild = NULL; // 一个指向Element的指针

TiXmlText* pText = NULL; // 一个指向Text的指针

// 读取level

pSkill->nLevel = atoi( pElm->Attribute( "level" ) );

// 读取技能名称

strcpy( pSkill->sName, pElm->FirstChild()->Value() );

}

void exportResume( TiXmlElement* pElmParent, resume_t resume )

{

int i;

char sBuf[NAME_LENGTH]; // 一个临时存放的字符串

TiXmlElement* pElm = NULL; // 一个指向Element的指针

TiXmlElement* pElmChild = NULL; // 一个指向Element的指针

TiXmlText* pText = NULL; // 一个指向Text的指针

pElm = new TiXmlElement( "resume" );

// 插入名字（以属性形式）

pElm->SetAttribute( "name", resume.sName );

// 插入性别（以子Element形式）

pElmChild = new TiXmlElement( "gender" ); // 建立一个子Element叫Gender

if( resume.isMan )

pText = new TiXmlText( "男" ); // 建立一个Gender的子Element（一个Text形式的子元素）

else

pText = new TiXmlText( "女" ); // 建立一个Gender的子Element（一个Text形式的子元素）

pElmChild->InsertEndChild( *pText ); // 把这个Gender的子Element插入Gender里

pElm->InsertEndChild( *pElmChild ); // 把Gender插入到主Element里

SAFE_DELETE( pElmChild ); // 删除已经用完的Gender

SAFE_DELETE( pText ); // 删除这个Text

// 插入年龄（以子Element形式）

pElmChild = new TiXmlElement( "age" ); // 建立一个子Element叫Age

sprintf( sBuf, "%d", resume.nAge ); // 把Age变成字符串临时存进sBuf里

pText = new TiXmlText( sBuf ); // 建立一个Age的子Element（一个Text形式的子元素）

pElmChild->InsertEndChild( *pText ); // 把这个Age的子Element插入Age里

pElm->InsertEndChild( *pElmChild ); // 把Age插入到主Element里

SAFE_DELETE( pElmChild ); // 删除已经用完的Age

SAFE_DELETE( pText ); // 删除这个Text

// 插入技能子节点

pElmChild = new TiXmlElement( "skills" ); // 建立一个子Element叫Skills

sprintf( sBuf, "%d", resume.nNumSkill ); // 把Skill的数目变成字符串临时存进sBuf里

pElmChild->SetAttribute( "num", sBuf ); // 把这个Skills的属性插入Skills里

for( i=0; i

{

exportSkill( pElmChild, resume.pSkill[i] ); // 插入一项技能

}

pElm->InsertEndChild( *pElmChild ); // 把Skills插入到主Element里

SAFE_DELETE( pElmChild ); // 删除已经用完的Skills

SAFE_DELETE( pText ); // 删除这个Text

// 最后把整个Resume的子节点插入到父节点中

pElmParent->InsertEndChild( *pElm );

SAFE_DELETE( pElm ); // 删除子节点

}

void importResume( TiXmlElement* pElm, resume_t* pResume )

{

int i;

char sBuf[NAME_LENGTH]; // 一个临时存放的字符串

TiXmlElement* pElmChild = NULL; // 一个指向Element的指针

TiXmlElement* pElmGrandChild = NULL; // 一个指向Element的指针

TiXmlText* pText = NULL; // 一个指向Text的指针

// 读入"resume"子节点

strcpy( pResume->sName, pElm->Attribute( "name" ) );

// 读入"gender"子节点

pElmChild = pElm->FirstChildElement( "gender" );

if( strcmp( "男", pElmChild->FirstChild()->Value() ) == 0 )

pResume->isMan = true;

else

pResume->isMan = false;

// 读入"age"子节点

pElmChild = pElm->FirstChildElement( "age" );

pResume->nAge = atoi( pElmChild->FirstChild()->Value() );

// 读入"skills"子节点

pElmChild = pElm->FirstChildElement( "skills" );

pResume->nNumSkill = atoi( pElmChild->Attribute( "num" ) );

pResume->pSkill = new skill_t[pResume->nNumSkill];

pElmGrandChild = pElmChild->FirstChildElement( "skill" ); // 指向第一个Skill

for( i=0; inNumSkill; i++ ) {

importSkill( pElmGrandChild, &(pResume->pSkill[i]) ); // 读取一个Skill

pElmGrandChild = pElmGrandChild->NextSiblingElement(); // 指向下一个Skill

}

bool readXML( char* sFilePath, int* nNumResume, resume_t** ppResume ) {

int i; // 用做循环的变量

TiXmlElement* pElmChild = NULL; // 一个指向Element的指针

TiXmlDocument xmlDoc( sFilePath ); // 输入XML路径

if( !xmlDoc.LoadFile() ) // 读取XML并检查是否读入正确

return false;

TiXmlElement* pElmRoot = NULL; // 根节点

pElmRoot = xmlDoc.FirstChildElement( "resumes" ); // 得到根节点

if( !pElmRoot ) {

return false;

}

*nNumResume = atoi( pElmRoot->Attribute( "num" ) ); // 读取Resume的数目

*ppResume = new resume_t[*nNumResume]; // 分配Resume的空间

pElmChild = pElmRoot->FirstChildElement( "resume" ); // 找出第一个Resume

for( i=0; i<*nNumResume; i++ ) {

importResume( pElmChild, &((*ppResume)[i]) ); // 读取Resume的内容

pElmChild = pElmChild->NextSiblingElement(); // 找出下一个Resume

}

return true;

}

bool writeXML( char* sFilePath, int nNumResume, resume_t* pResume )
{

if( !sFilePath || !pResume )

return false; // 确定指针存在

int i; // 用做循环的变量

char sBuf[NAME_LENGTH]; // 一个临时存放的字符串

TiXmlElement* pElm = NULL; // 一个指向Element的指针

TiXmlDeclaration Declaration( "1.0","gb2312", "yes" ); // 建立XML头结构

TiXmlDocument xmlDoc( sFilePath ); // 用存档的文件名字来建立一个XML文件

xmlDoc.InsertEndChild( Declaration ); // 把XML头结构插入当前文档

// 插入根节点“Resumes”
pElm = new TiXmlElement( "resumes" ); // 建立根节点“Resumes”
sprintf( sBuf, "%d", nNumResume ); // 把nNumResume变成字符串临时存进sBuf里

pElm->SetAttribute( "num", sBuf ); // 建立一个Resumes的子Element

for( i=0; i<2; i++ )
{
exportResume( pElm, pResume[i] ); // 在根节点上插入以上定义的2个简历
}
xmlDoc.InsertEndChild( *pElm );

xmlDoc.SaveFile();

SAFE_DELETE( pElm ); // 删除Element

return true;

}

void main()

{

int i, j;

// + == 设置两份简历 ==========================================================

int nNumResume = 2;

resume_t* pResume = new resume_t[ nNumResume ];

// 1. 初始化第一份简历

strcpy( pResume[0].sName, "裕作" );

pResume[0].isMan = true;

pResume[0].nAge = 26;

pResume[0].nNumSkill = 2;

pResume[0].pSkill = new skill_t[2];

{ // 设置技能列表结构

strcpy( pResume[0].pSkill[0].sName, "编程" );

strcpy( pResume[0].pSkill[1].sName, "吹牛" );

pResume[0].pSkill[0].nLevel = 99;

pResume[0].pSkill[1].nLevel = 1;

}

// 2. 初始化第二份简历

strcpy( pResume[1].sName, "裕作 The Great" );

pResume[1].isMan = true;

pResume[1].nAge = 0;

pResume[1].nNumSkill = 1;

pResume[1].pSkill = new skill_t[1];

{ // 设置技能列表结构

strcpy( pResume[1].pSkill[0].sName, "编程" );

pResume[1].pSkill[0].nLevel = 100;

}

// - == 设置两份简历 ==========================================================

// 把简历以XML形式写入磁盘

if( !writeXML( XML_FILE, nNumResume, pResume ) )

{

printf( "ERROR: can't write the file." );

return;

}

// 删除Resume

nNumResume = 0;

SAFE_DELETE_ARRAY( pResume );

// 重新读入XML文件里的Resume数据

if( !readXML( XML_FILE, &nNumResume, &pResume ) )

{

printf( "ERROR: can't read the file." );

return;

}

// 把所有简历输出到屏幕

if( pResume ) // 确定有Resume

{

for( i=0; i

printf( "简历：======================\n" );

printf( "\t名字：%s\n", pResume[i].sName );

if( pResume[i].isMan )

printf( "\t性别：男\n" );

else

printf( "\t性别：女\n" );

printf( "\t年龄：%d\n", pResume[i].nAge );

printf( "\t职业技能：\n" );

for( j=0; j

printf( "\t\t技能名称：%s\n", pResume[i].pSkill[j].sName );

printf( "\t\t技能等级：%d\n", pResume[i].pSkill[j].nLevel );

}

订阅：评论 (Atom)

充实过好每一天！

2007年11月8日星期四

批处理 for应用

一、 TinyXml的特点

1. SAX和DOM

2. 验证和非验证

二、 TinyXml的构建和使用

1. 获取

2. 构建

3. 使用

三、 TinyXml的编程模型

1. 类之间的关系

2. 需要注意的问题

四、总结

实战TinyXML

博客归档

我的简介

充实过好每一天！

2007年11月8日星期四

批处理 for应用

一、 TinyXml的特点

1. SAX和DOM

2. 验证和非验证

二、 TinyXml的构建和使用

1. 获取

2. 构建

3. 使用

三、 TinyXml的编程模型

1. 类之间的关系

2. 需要注意的问题

四、 总结

实战TinyXML

博客归档

我的简介

四、总结