批处理 for应用 |
作者:未知 时间:2005-09-13 21:50 出处:Blog.ChinaUnix.net 责编:chinaitpower |
摘要:批处理 for应用 |
![]() ![]() ![]() ![]() ![]() 裕作小记: 张弛 一、 TinyXml的特点TinyXml是一个基于DOM模型的、非验证的轻量级C++解释器。 1. SAX和DOM目前XML的解析主要有两大模型:SAX和DOM。 其中SAX是基于事件的,其基本工作流程是分析XML文档,当发现了一个新的元素时,产生一个对应事件,并调用相应的用户处理函数。这种方式占用内存少,速度快,但用户程序相应得会比较复杂。 而DOM(文档对象模型),则是在分析时,一次性的将整个XML文档进行分析,并在内存中形成对应的树结构,同时,向用户提供一系列的接口来访问和编辑该树结构。这种方式占用内存大,速度往往慢于SAX,但可以给用户提供一个面向对象的访问接口,对用户更为友好。 另据说,一些同时提供了SAX和DOM接口的库,是在底层先实现SAX,再在SAX的基础上实现DOM。 目前我知道的XML解析库有下面几个:
2. 验证和非验证对于一个特定的XML文档而言,其正确性分为两个层次。首先是其格式应该符合XML的基本格式要求,比如第一行要有声明,标签的嵌套层次必须前后一致等等,符合这些要求的文件,就是一个合格的XML文件,称作well-formatted。但除此之外,一个XML文档因其内容的不同还必须在语义上符合相应的标准,这些标准由相应的DTD文件或者Schema文件来定义,符合了这些定义要求的XML文件,称作valid。 因此,解析器也分为两种,一种是验证的,即会跟据XML文件中的声明,用相应的DTD文件对XML文件进行校验,检查它是否满足DTD文件的要求。另一种是忽略DTD文件,只要基本格式正确,就可以进行解析。 就我所知,验证的解析器通常都是比较重量级的。TinyXml不支持验证,但是体积很小,用在解析格式较为简单的XML文件,比如配置文件时,特别的合适。 二、 TinyXml的构建和使用1. 获取TinyXml首页在http://www.grinninglizard.com/tinyxml/index.html,从这里可以找到最新版本的源代码,目前的版本是2.3.4。 2. 构建TinyXml在构建时可以选择是否支持STL,选择的话,则可以使用std::string,所以通常应该打开这个选项。 在Windows上,TinyXml的源码包里提供了VC6的工程文件,直接用它就可以生成两个静态库(带STL和不带STL),非常容易。唯一需要注意的是,默认生成的库是单线程的,如果用在多线程的项目中,需要改动一下配置,生成相应的多线程库。 在Unix平台上,TinyXml的源码包里只提供了一个Makefile,对于典型的Linux系统,或装了gcc和gmake的其他Unix,这个Makefile足够用了,我在RH9和RHEL4上测试,简单的make就成功了。需要注意的有以下几点:默认的编译是不支持STL的,可以通过编辑Makefile的TINYXML_USE_STL := NO那一行,把NO改成YES就可以支持STL了;还有默认只生成了一个测试程序,没有生成任何库,如果要生成静态库的话,可以用ar命令,将生成的几个目标文件打包就行了,如果要生成动态库,则需要加上-fpic参数重新编译。 3. 使用构建了相应的库之后,在使用了它们的工程中,只要在连接时把他们连上就行了。需要注意的是,如果需要STL支持,在编译用到了TinyXml的文件时,需要定义一个宏TIXML_USE_STL,对gcc,可以使用参数-DTIXML_USE_STL,对cl.exe(VC),可以使用参数/DTIXML_USE_STL,如果嫌麻烦,可以直接定义在 tinyxml.h文件里。 三、 TinyXml的编程模型1. 类之间的关系TinyXml实现的时DOM访问模型,因此提供了一系列的类对应XML文件中的各个节点。主要类间的关系如下图所示: TiXmlBase:其他类的基类,是个抽象类 TiXmlNode:表示一个节点,包含节点的一般方法,如访问自节点、兄弟节点、编辑自身、编辑子节电 TiXmlDocument:表示整个XML文档,不对应其中某个特定的节点。 TiXmlElement:表示元素节点,可以包含子节点和TiXmlAttribute TiXmlComment:表示注释 TiXmlDeclaration:表示声明 TiXmlText:表示文本节点 TiXmlUnknown:表示未知节点,通常是出错了 TiXmlAttribute:表示一个元素的属性 下面是一个简单的例子: version="1.0" encoding="utf-8" ?> <book> <name>TinyXml How To <description>Some words… 整个文档,对应TiXmlDocument book,name,price, description,都对应TiXmlElement 第一行对应一个TiXmlDeclaration 第二行对应一个TiXmlComment “TinyXml How To”对应一个TiXmlText unit则是price的一个TiXmlAttribute 这些类与XML文件中的相应元素都有很好的对应关系,因此相信参照TinyXml的文档,可以很容易的掌握各个方法的使用。 2. 需要注意的问题各类之间的转换 由于各个节点类都从TiXmlNode继承,在使用时常常需要将TiXmlNode*类型的指针转换为其派生类的指针,在进行这种转换时,应该首先使用由TiXmlNode类提供的一系列转换函数,如ToElement(void),而不是c++的dynamic_cast 检查返回值 由于TinyXml是一个非校验的解析器,因此当解析一个文件时,很可能文件并不包含我们预期的某个节点,在这种情况下,TinyXml将返回空指针。因此,必须要对返回值进行检查,否则将很容易出现内存访问的错误。 如何重头建立一个XML文件 先建立一个TiXmlDocument对象,然后,载入某个模板,或者直接插入一个节点作为根节点,接着就可以像打开一个已有的XML文件那样对它进行操作了。 四、 总结TinyXml最大的特点就是它很小,可以很方便的静态连接到程序里。对于像配置文件、简单的数据文件这类文件的解析,它很适合。但是由于它是非验证的,因此需要在程序里做许多检查工做,加重了程序编写的负担。因此对于复杂的XML文件,我觉得最好还是用验证的解析器来处理。 实战TinyXML实战TinyXML 作者:裕作 (本文为原创,转贴请注明出处:http://blog.csdn.net/KyosukeNo1) 这几天在埋头写自己的3D文件浏览器(稍后发布),突发奇想的要把自己的内部格式转化成XML,于是,把以前在研究所时用过的ExPat翻了出来。 ExPat是基于事件的XML解释器,速度挺快的,但结构方面有点不敢恭维--当年写配置文件的导出导入部分花了我足足1个星期!而且由于它是基于事件发生的次序(SAX),似乎有时会发生一些无法控制的情况--例如进入某Level后忘了记录,结果……后面的程序全部死掉!这时想起同事之前推荐的 TinyXML,结果……用了不到3小时就把我的文件导出来了~~呵呵。在阅读本文之前,请先看看我Blog里转贴的《TinyXML学习笔记》,相信它能给各位一个关于TinyXML的初步概念。 言归正传,本文目的在于补全之前《TinyXML学习》的不足,尽量把常用的示例代码列出让大家参考。此外,在本篇最后会给出一个完整的文件读写例子,供读者参考。 1. 编程环境的设置。新建一个项目,起名叫TestTXML。到http://sourceforge.net/projects/tinyxml/ 下载TinyXML的官方例子,并编译第一个Project tinyxml(注意,最好编译Release的版本,代码比较小。然后把生成的tinyxml.lib(如果是Debug版本,叫tinyxmld.lib)连同tinystr.h和tinyxml.h一起Copy到TestTXML项目的目录中。在TestTXML项目里的头文件加入对TinyXML的引用: #pragma comment(lib,"tinyxml.lib") // 链接Library #include "tinyxml.h" // TinyXML的头文件 2. 建立一个XML文件: char* sFilePath = "ikk_doc.xml"; // 文件名称 TiXmlDocument xmlDoc( sFilePath ); // 建立一个XML文件 TiXmlDeclaration Declaration( "1.0","gb2312", "yes" ); // 声明XML的属性 xmlDoc.InsertEndChild( Declaration ); // 写入基本的XML头结构 xmlDoc.SaveFile(); // 把XML文件写入硬盘 这时,在硬盘上的TestXML项目目录里,ikk_doc.xml文件已经被创建出来了。 3. 在XML文件里插入Element 所谓的Element,就是在XML里面的Tag,例如在 TiXmlElement* pElm = NULL; pElm = new TiXmlElement( "resumes" ); //定义当前的子节点 pElmParent.InsertEndChild( *pElm ); // 把子节点插入父节点中 4. 在element里插入属性。在刚才例子中,name=”裕作”就是Resume的属性,其中name是属性的名字,”裕作”是属性的值。在当前子节点内插入属性的方法如下: pElm->SetAttribute( "name", resume.sName ); 5. 在XML里插入文本。在 TiXmlText* pText = NULL; pElmChild->InsertEndChild( *pText ); //把text子节点插入父节点中 在具备了以上背景知识之后,我们已经可以用TinyXML读写一个XML文件了。本文最后的程序将写入,然后重新读取一个XML文件到我们的结构里。这个XML文件的内容如下:
以下程序将建立ikk_doc.xml文件,然后重新把内容读取进内存: #pragma comment(lib,"tinyxml.lib") #include "string.h" #include "stdio.h" #include "tinyxml.h" #define XML_FILE "ikk_doc.xml" #define NAME_LENGTH 256 // 名字类字符的分配长度 #define SAFE_DELETE(x) {if(x) delete x; x=NULL;} // 安全删除new分配出来的变量空间 #define SAFE_DELETE_ARRAY(x) {if(x) delete[] x; x=NULL;} // 安全删除new分配出来的数组空间 #define XML_HEADER "" // XML文件头的定义 typedef unsigned int uint32; // 技能的结构 typedef struct skill_s { uint32 nLevel; // 技能的程度 char sName[ NAME_LENGTH ]; // 技能的名称 skill_s() { nLevel = 0; sName[0] = 0; } } skill_t; // 简历的结构 typedef struct resume_s { char sName[ NAME_LENGTH ]; // 名字 bool isMan; // 是否男性 uint32 nAge; // 年龄 uint32 nNumSkill; // 技能的数目 skill_t* pSkill; // 技能的结构 resume_s() { sName[0] = 0; isMan = false; nAge = 0; nNumSkill = 0; pSkill = NULL; } } resume_t; void exportSkill( TiXmlElement* pElmParent, skill_t skill ) { int i; char sBuf[NAME_LENGTH]; // 一个临时存放的字符串 TiXmlElement* pElm = NULL; // 一个指向Element的指针 TiXmlText* pText = NULL; // 一个指向Text的指针 pElm = new TiXmlElement( "skill" ); // 插入等级(以属性形式) sprintf( sBuf, "%d", skill.nLevel ); // 把Skill的登记变成字符串临时存进sBuf里 pElm->SetAttribute( "level", sBuf ); // 把等级插入Skill里 // 插入技能名称(以子Element形式) pText = new TiXmlText( skill.sName ); // 建立一个Skill的子Element(一个Text形式的子元素) pElm->InsertEndChild( *pText ); // 把这个Skill的子Element插入Skill里 SAFE_DELETE( pText ); // 删除这个Text // 最后把整个Resume的子节点插入到父节点中 pElmParent->InsertEndChild( *pElm ); } void importSkill( TiXmlElement* pElm, skill_t* pSkill ) { int i; char sBuf[NAME_LENGTH]; // 一个临时存放的字符串 TiXmlElement* pElmChild = NULL; // 一个指向Element的指针 TiXmlText* pText = NULL; // 一个指向Text的指针 // 读取level pSkill->nLevel = atoi( pElm->Attribute( "level" ) ); // 读取技能名称 strcpy( pSkill->sName, pElm->FirstChild()->Value() ); } void exportResume( TiXmlElement* pElmParent, resume_t resume ) { int i; char sBuf[NAME_LENGTH]; // 一个临时存放的字符串 TiXmlElement* pElm = NULL; // 一个指向Element的指针 TiXmlElement* pElmChild = NULL; // 一个指向Element的指针 TiXmlText* pText = NULL; // 一个指向Text的指针 pElm = new TiXmlElement( "resume" ); // 插入名字(以属性形式) pElm->SetAttribute( "name", resume.sName ); // 插入性别(以子Element形式) pElmChild = new TiXmlElement( "gender" ); // 建立一个子Element叫Gender if( resume.isMan ) pText = new TiXmlText( "男" ); // 建立一个Gender的子Element(一个Text形式的子元素) else pText = new TiXmlText( "女" ); // 建立一个Gender的子Element(一个Text形式的子元素) pElmChild->InsertEndChild( *pText ); // 把这个Gender的子Element插入Gender里 pElm->InsertEndChild( *pElmChild ); // 把Gender插入到主Element里 SAFE_DELETE( pElmChild ); // 删除已经用完的Gender SAFE_DELETE( pText ); // 删除这个Text // 插入年龄(以子Element形式) pElmChild = new TiXmlElement( "age" ); // 建立一个子Element叫Age sprintf( sBuf, "%d", resume.nAge ); // 把Age变成字符串临时存进sBuf里 pText = new TiXmlText( sBuf ); // 建立一个Age的子Element(一个Text形式的子元素) pElmChild->InsertEndChild( *pText ); // 把这个Age的子Element插入Age里 pElm->InsertEndChild( *pElmChild ); // 把Age插入到主Element里 SAFE_DELETE( pElmChild ); // 删除已经用完的Age SAFE_DELETE( pText ); // 删除这个Text // 插入技能子节点 pElmChild = new TiXmlElement( "skills" ); // 建立一个子Element叫Skills sprintf( sBuf, "%d", resume.nNumSkill ); // 把Skill的数目变成字符串临时存进sBuf里 pElmChild->SetAttribute( "num", sBuf ); // 把这个Skills的属性插入Skills里 for( i=0; i { exportSkill( pElmChild, resume.pSkill[i] ); // 插入一项技能 } pElm->InsertEndChild( *pElmChild ); // 把Skills插入到主Element里 SAFE_DELETE( pElmChild ); // 删除已经用完的Skills SAFE_DELETE( pText ); // 删除这个Text // 最后把整个Resume的子节点插入到父节点中 pElmParent->InsertEndChild( *pElm ); SAFE_DELETE( pElm ); // 删除子节点 } void importResume( TiXmlElement* pElm, resume_t* pResume ) { int i; char sBuf[NAME_LENGTH]; // 一个临时存放的字符串 TiXmlElement* pElmChild = NULL; // 一个指向Element的指针 TiXmlElement* pElmGrandChild = NULL; // 一个指向Element的指针 TiXmlText* pText = NULL; // 一个指向Text的指针 // 读入"resume"子节点 strcpy( pResume->sName, pElm->Attribute( "name" ) ); // 读入"gender"子节点 pElmChild = pElm->FirstChildElement( "gender" ); if( strcmp( "男", pElmChild->FirstChild()->Value() ) == 0 ) pResume->isMan = true; else pResume->isMan = false; // 读入"age"子节点 pElmChild = pElm->FirstChildElement( "age" ); pResume->nAge = atoi( pElmChild->FirstChild()->Value() ); // 读入"skills"子节点 pElmChild = pElm->FirstChildElement( "skills" ); pResume->nNumSkill = atoi( pElmChild->Attribute( "num" ) ); pResume->pSkill = new skill_t[pResume->nNumSkill]; pElmGrandChild = pElmChild->FirstChildElement( "skill" ); // 指向第一个Skill for( i=0; i importSkill( pElmGrandChild, &(pResume->pSkill[i]) ); // 读取一个Skill pElmGrandChild = pElmGrandChild->NextSiblingElement(); // 指向下一个Skill } } bool readXML( char* sFilePath, int* nNumResume, resume_t** ppResume ) { int i; // 用做循环的变量 TiXmlElement* pElmChild = NULL; // 一个指向Element的指针 TiXmlDocument xmlDoc( sFilePath ); // 输入XML路径 if( !xmlDoc.LoadFile() ) // 读取XML并检查是否读入正确 return false; TiXmlElement* pElmRoot = NULL; // 根节点 pElmRoot = xmlDoc.FirstChildElement( "resumes" ); // 得到根节点 if( !pElmRoot ) { return false; } *nNumResume = atoi( pElmRoot->Attribute( "num" ) ); // 读取Resume的数目 *ppResume = new resume_t[*nNumResume]; // 分配Resume的空间 pElmChild = pElmRoot->FirstChildElement( "resume" ); // 找出第一个Resume for( i=0; i<*nNumResume; i++ ) { importResume( pElmChild, &((*ppResume)[i]) ); // 读取Resume的内容 pElmChild = pElmChild->NextSiblingElement(); // 找出下一个Resume } return true; } bool writeXML( char* sFilePath, int nNumResume, resume_t* pResume ) if( !sFilePath || !pResume ) return false; // 确定指针存在 int i; // 用做循环的变量 char sBuf[NAME_LENGTH]; // 一个临时存放的字符串 TiXmlElement* pElm = NULL; // 一个指向Element的指针 TiXmlDeclaration Declaration( "1.0","gb2312", "yes" ); // 建立XML头结构 TiXmlDocument xmlDoc( sFilePath ); // 用存档的文件名字来建立一个XML文件 xmlDoc.InsertEndChild( Declaration ); // 把XML头结构插入当前文档 pElm->SetAttribute( "num", sBuf ); // 建立一个Resumes的子Element
xmlDoc.SaveFile(); SAFE_DELETE( pElm ); // 删除Element return true; } void main() { int i, j; // + == 设置两份简历 ========================================================== int nNumResume = 2; resume_t* pResume = new resume_t[ nNumResume ]; // 1. 初始化第一份简历 strcpy( pResume[0].sName, "裕作" ); pResume[0].isMan = true; pResume[0].nAge = 26; pResume[0].nNumSkill = 2; pResume[0].pSkill = new skill_t[2]; { // 设置技能列表结构 strcpy( pResume[0].pSkill[0].sName, "编程" ); strcpy( pResume[0].pSkill[1].sName, "吹牛" ); pResume[0].pSkill[0].nLevel = 99; pResume[0].pSkill[1].nLevel = 1; } // 2. 初始化第二份简历 strcpy( pResume[1].sName, "裕作 The Great" ); pResume[1].isMan = true; pResume[1].nAge = 0; pResume[1].nNumSkill = 1; pResume[1].pSkill = new skill_t[1]; { // 设置技能列表结构 strcpy( pResume[1].pSkill[0].sName, "编程" ); pResume[1].pSkill[0].nLevel = 100; } // - == 设置两份简历 ========================================================== // 把简历以XML形式写入磁盘 if( !writeXML( XML_FILE, nNumResume, pResume ) ) { printf( "ERROR: can't write the file." ); return; } // 删除Resume nNumResume = 0; SAFE_DELETE_ARRAY( pResume ); // 重新读入XML文件里的Resume数据 if( !readXML( XML_FILE, &nNumResume, &pResume ) ) { printf( "ERROR: can't read the file." ); return; } // 把所有简历输出到屏幕 if( pResume ) // 确定有Resume { for( i=0; i printf( "简历:======================\n" ); printf( "\t名字:%s\n", pResume[i].sName ); if( pResume[i].isMan ) printf( "\t性别:男\n" ); else printf( "\t性别:女\n" ); printf( "\t年龄:%d\n", pResume[i].nAge ); printf( "\t职业技能:\n" ); for( j=0; j printf( "\t\t技能名称:%s\n", pResume[i].pSkill[j].sName ); printf( "\t\t技能等级:%d\n", pResume[i].pSkill[j].nLevel ); } } } }
订阅:
博文 (Atom)
|