使用xerces-c++库编写XSD校验XML的类

2024-04-22 12:48

本文主要是介绍使用xerces-c++库编写XSD校验XML的类,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

由于需要写个XSD来校验XML功能的类, 上网搜索了很多资料, 都不能完全满足需要, 于是在多方参考了网络上的文章后, 自己进一步改进了一下。

直接贴代码,备忘。

 

相关库的官方说明地址:  http://xerces.apache.org/xerces-c/

 

----------------------------------------------------------------------

头文件 IXMLValidation.h

 

#ifndef _IXML_VALIDATION_H_
#define _IXML_VALIDATION_H_

#include <iostream>
#include <list>
#include <string>
#include <xercesc/util/OutOfMemoryException.hpp>
#include <xercesc/dom/DOM.hpp>
#include <xercesc/parsers/XercesDOMParser.hpp>
#include <xercesc/framework/XMLGrammarDescription.hpp>
#include <xercesc/sax/ErrorHandler.hpp>
#include <xercesc/sax/SAXParseException.hpp>

using std::cerr;
using std::endl;

XERCES_CPP_NAMESPACE_USE

class StrX
{
 char* fLocalForm;
public :
 StrX(const XMLCh* const toTranscode) { fLocalForm = XMLString::transcode(toTranscode); }
 ~StrX() { XMLString::release(&fLocalForm); }
 const char* localForm() const { return fLocalForm; }
};

 

class DOMTreeErrorReporter : public ErrorHandler
{
public:
 DOMTreeErrorReporter();
 virtual ~DOMTreeErrorReporter();
 void warning(const SAXParseException& toCatch) {}
 void resetErrors() {}
 void error(const SAXParseException& toCatch);
 void fatalError(const SAXParseException& toCatch);
 bool getErrFlag(){ return m_errFlag; }
 std::string getErrMsg(){ return m_errMsg; }
private:

 std::string m_errMsg; 
 bool m_errFlag;
};

 

class IXMLValidation
{
public:
 IXMLValidation(std::string& grammar);
 ~IXMLValidation();
 int validation(std::string & xmlStr,std::string &errMsg);
sprivate:
 std::string m_grammar;
};


#endif

 

----------------------------------------------------------------------------------------

代码文件 IXMLValidation.cpp

 

#include "IXMLValidation.h"
#include <fstream>
#include <unistd.h>
#include <memory>
#include <sstream>
#include <xercesc/framework/MemBufInputSource.hpp>

std::ostream&
operator<<(std::ostream& target, const StrX& toDump)
{
 target << toDump.localForm();
 return target;
}

DOMTreeErrorReporter::DOMTreeErrorReporter()
{
 m_errFlag = false;
}
DOMTreeErrorReporter::~DOMTreeErrorReporter()
{
}

void DOMTreeErrorReporter::error(const SAXParseException& toCatch) {
 //cerr << "Error at file /"" << StrX(toCatch.getSystemId())
 // << "/", line " << toCatch.getLineNumber()
 // << ", column " << toCatch.getColumnNumber() << endl
 // << " Message: " << StrX(toCatch.getMessage()) << endl;
 std::ostringstream os;
 os << "Error at " << StrX(toCatch.getSystemId())
            << ". line " << toCatch.getLineNumber()
  << ", column " << toCatch.getColumnNumber()
  << ", Message: " << StrX(toCatch.getMessage()) << endl;
 m_errMsg += os.str();
 m_errFlag = true;
}
void DOMTreeErrorReporter::fatalError(const SAXParseException& toCatch) {
 //cerr << "Fatal Error at file /"" << StrX(toCatch.getSystemId())
 // << "/", line " << toCatch.getLineNumber()
 // << ", column " << toCatch.getColumnNumber() << endl
 // << " Message: " << StrX(toCatch.getMessage()) << endl;
 std::ostringstream os;
 os << "Fatal Error at " << StrX(toCatch.getSystemId())
        << ". line " << toCatch.getLineNumber()
  << ", column " << toCatch.getColumnNumber()
  << ", Message: " << StrX(toCatch.getMessage()) << endl;
 m_errMsg += os.str();
 m_errFlag = true;
}


IXMLValidation::IXMLValidation(std::string& grammar)
    :m_grammar(grammar)
{
 try
 {
  XMLPlatformUtils::Initialize();
 }
 catch(const XMLException& e)
 {
  StrX tmp_e(e.getMessage());
  cerr << "Xerces initialization error: " << tmp_e.localForm() << endl;
  throw; //return 2;
 }
}
IXMLValidation::~IXMLValidation()
{
}


int IXMLValidation::validation(std::string & xmlStr,std::string &errMsg)
{
    int result;

    std::auto_ptr<XercesDOMParser > parser(new XercesDOMParser);
    std::auto_ptr<DOMTreeErrorReporter> errReporter( new DOMTreeErrorReporter);
    parser->setErrorHandler(&(*errReporter));
    parser->setDoNamespaces(true);
    parser->setCreateEntityReferenceNodes(true);
    parser->useCachedGrammarInParse(true);
    parser->setDoSchema(true);
    //parser->setDoValidation(true); //deprecated
    parser->setValidationScheme(AbstractDOMParser::Val_Always);
    parser->setValidationSchemaFullChecking(true);

    MemBufInputSource inputSrc((XMLByte*)m_grammar.c_str(), (XMLSize_t)m_grammar.length(), "xsd");
    if ( parser->loadGrammar(inputSrc, Grammar::SchemaGrammarType, true) == 0 )
    {
        errMsg = "Error loading grammar " ;
        return 4;
    }
    char xml_fname[100];
    result = 1;
    try
    {
        MemBufInputSource inputXml((XMLByte*)xmlStr.c_str(),(XMLSize_t)xmlStr.length(), "xml");
        parser->parse(inputXml);
        result = errReporter->getErrFlag() ? 9 : 0; // 0 成功, !0 失败
        errMsg = errReporter->getErrMsg();
    }
    catch ( const OutOfMemoryException& )
    {
        errMsg = "Out of memory exception." ;
    }
    catch ( const XMLException& e )
    {
        std::ostringstream os;
        os << "An error occurred during parsing, Message: " << StrX(e.getMessage()) ;
        errMsg = os.str();
    }
    catch ( const DOMException& e )
    {
        const unsigned int maxChars = 2047;
        XMLCh errText[maxChars + 1];
        std::ostringstream os;
        os << "DOM Exception code is: " << e.code << ". ";
        if ( DOMImplementation::loadDOMExceptionMsg(e.code, errText, maxChars) )
            os << "Message is: " << StrX(errText);
        errMsg = os.str();
    }
    catch (...)
    {
        errMsg = "An error occurred during parsing.";
    }
    return result;
}

 

 

------------------------------------------------------------------

使用举例: main.cpp

 

#include "IXMLValidation.h"
#include <iostream>
#include <string>
#include <fstream>
using namespace std;
int main()
{
 std::ifstream of("test.xsd");
 std::string xsdStr ;
 char *s = NULL;
 int n;
 of.seekg(0, ios::end);
 n = of.tellg(); // 文件大小
 s = new char[n+1];
 of.seekg(0, ios::beg);
 of.read(s, n);
 s[n] = '/0';
 xsdStr = s;
 of.close();
 
 IXMLValidation xmlValid(xsdStr);
 
 std::ifstream of2("test.xml");
 std::string xmlStr ;
 of2.seekg(0, ios::end);
 n = of2.tellg(); // 文件大小
 delete s;
 s = new char[n+1];
 of2.seekg(0, ios::beg);
 of2.read(s, n);
 s[n] = '/0';
 xmlStr = s;
 of2.close();
 std::string errMsg;
  
  
 int ret = xmlValid.validation(xmlStr,errMsg);
 cout << ret << endl;
 if( ret )
  cout << "validation fail:" << endl << errMsg << endl;
 else
  cout << "validation success." << endl;
 return 0;
}

 

 

 

这篇关于使用xerces-c++库编写XSD校验XML的类的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/925823

相关文章

如何使用 Python 读取 Excel 数据

《如何使用Python读取Excel数据》:本文主要介绍使用Python读取Excel数据的详细教程,通过pandas和openpyxl,你可以轻松读取Excel文件,并进行各种数据处理操... 目录使用 python 读取 Excel 数据的详细教程1. 安装必要的依赖2. 读取 Excel 文件3. 读

解决Maven项目idea找不到本地仓库jar包问题以及使用mvn install:install-file

《解决Maven项目idea找不到本地仓库jar包问题以及使用mvninstall:install-file》:本文主要介绍解决Maven项目idea找不到本地仓库jar包问题以及使用mvnin... 目录Maven项目idea找不到本地仓库jar包以及使用mvn install:install-file基

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数?getopt模块基础实际应用示例与其他参数处理方式的比较常见问http

Python利用ElementTree实现快速解析XML文件

《Python利用ElementTree实现快速解析XML文件》ElementTree是Python标准库的一部分,而且是Python标准库中用于解析和操作XML数据的模块,下面小编就来和大家详细讲讲... 目录一、XML文件解析到底有多重要二、ElementTree快速入门1. 加载XML的两种方式2.

C 语言中enum枚举的定义和使用小结

《C语言中enum枚举的定义和使用小结》在C语言里,enum(枚举)是一种用户自定义的数据类型,它能够让你创建一组具名的整数常量,下面我会从定义、使用、特性等方面详细介绍enum,感兴趣的朋友一起看... 目录1、引言2、基本定义3、定义枚举变量4、自定义枚举常量的值5、枚举与switch语句结合使用6、枚

使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)

《使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)》PPT是一种高效的信息展示工具,广泛应用于教育、商务和设计等多个领域,PPT文档中常常包含丰富的图片内容,这些图片不仅提升了... 目录一、引言二、环境与工具三、python 提取PPT背景图片3.1 提取幻灯片背景图片3.2 提取

C++如何通过Qt反射机制实现数据类序列化

《C++如何通过Qt反射机制实现数据类序列化》在C++工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作,所以本文就来聊聊C++如何通过Qt反射机制实现数据类序列化吧... 目录设计预期设计思路代码实现使用方法在 C++ 工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作。由于数据类

使用Python实现图像LBP特征提取的操作方法

《使用Python实现图像LBP特征提取的操作方法》LBP特征叫做局部二值模式,常用于纹理特征提取,并在纹理分类中具有较强的区分能力,本文给大家介绍了如何使用Python实现图像LBP特征提取的操作方... 目录一、LBP特征介绍二、LBP特征描述三、一些改进版本的LBP1.圆形LBP算子2.旋转不变的LB

Maven的使用和配置国内源的保姆级教程

《Maven的使用和配置国内源的保姆级教程》Maven是⼀个项目管理工具,基于POM(ProjectObjectModel,项目对象模型)的概念,Maven可以通过一小段描述信息来管理项目的构建,报告... 目录1. 什么是Maven?2.创建⼀个Maven项目3.Maven 核心功能4.使用Maven H

Python中__init__方法使用的深度解析

《Python中__init__方法使用的深度解析》在Python的面向对象编程(OOP)体系中,__init__方法如同建造房屋时的奠基仪式——它定义了对象诞生时的初始状态,下面我们就来深入了解下_... 目录一、__init__的基因图谱二、初始化过程的魔法时刻继承链中的初始化顺序self参数的奥秘默认