利用MSXML解析xml文件

2024-03-14 14:08
文章标签 xml 解析 msxml

本文主要是介绍利用MSXML解析xml文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

利用MSXML解析xml文件

     一般情况我们装载操作xml文件,不会频繁。因此很容易忽略其中的内存泄露问题。但是如果操作不当其中的内存浪费还是令人难以容忍的。

 

      最近做一个文件下栽处理的程序,其中下栽的连接信息是通过解析xml来获得。因此对于xml文件的装载和解析频率非常的高。刚开始采用的方式是初始化库CoInitialize, 利用CoCreateInstance创建IXMLDOMDocument然后装载。可是到实际使用的时候才发现内存消耗的太严重了,就几个任务下去程序占用的内存是以M为单位往上涨个不停。最郁闷的是用CMemoryState来观察,也只是看到了不断的申请内存,并不报泄露。刚开始的时候还怀疑是设计的存储数据的结构本身有问题。仔细查来查去,针对数据结构做了几个小测试程序—— 很不幸的是,还真的有点问题。等把问题解决了 只是稍微好点。

 

       看样子主要问题还不是出在这里。于是做了个测试程序,把每段代码都拿过来做一个循环一千遍的操作,看内存的状态。这一看吓一跳:就一个pDoc->load(_bstr_t(lpszPath)); 就内存消耗疯涨了。想了想大致猜到了问题出那里了,每一次使用IXMLDOMDocument装载之后都要释放(Release)的,看解析的时候原因同样如此。虽然我对整个的这些IXMLDOMNodeList  IXMLDOMElement IXMLDOMNode都有释放的,但是在想法上也是针对于他们本身,在最后的时候选择释放的,而实际上是在每次取得这些内容并解析之后如果不在需要的话都是需要释放的。把所有这些地方都改过来,果然就Okay了。

 

    回想起以前在做类似处理的时候由于都是单一性的操作,并且内存也不报泄露。就这么自己把自己给忽悠咯。以前在查资料的时候也没有仔细的注意到,好象强调这个的也不多。

下面给出修订后的xml处理的代码:

#define  XML_NODE_TAG   "XmlNodeName"

 

MSXML2::IXMLDOMDocument * pDoc = NULL;  

 BOOL LoadToc(LPCTSTR lpszPath)

{//装载

     HRESULT hr = NULL;

      //TRACE("/nLoadXML %s /n",lpszPath);

     //TRACE(_T("/nInit MSXML com lib..../n"));  

     try

     {

           if (NULL!=pDoc)

          {   

              pDoc->Release();  

          }

          else

          {

               hr = CoInitialize(NULL);

               if(!SUCCEEDED(hr))

                return FALSE;

          } 

          // ASSERT(lpszPath!=NULL);

          if (lpszPath == NULL) return FALSE; 

          CoCreateInstance (MSXML::CLSID_DOMDocument,

               NULL, CLSCTX_INPROC_SERVER | CLSCTX_LOCAL_SERVER,

               MSXML::IID_IXMLDOMDocument,

               (LPVOID *)&pDoc);

          if(!pDoc)    

               return FALSE;

          pDoc->put_async(VARIANT_FALSE); 

          hr = pDoc->load(_bstr_t(lpszPath));  

          if(!hr)

          {

            pDoc = NULL;

            return FALSE;

        }

       Parse(pDoc);

   }

  catch (...)

 {

    pDoc = NULL;

 }

 //TRACE(_T("success/n")); 

 return TRUE;

}

 

BOOL Parse(MSXML2::IXMLDOMDocument * pDoc)

{  

    MSXML2::IXMLDOMNodeList    *pList  = NULL;

    MSXML2::IXMLDOMNode *pNode        = NULL;

    MSXML2::IXMLDOMElement *pRoot = NULL;  

    unsigned short buff[NODE_BUFF_MAX_LENGTH];

    memset(buff,0,NODE_BUFF_MAX_LENGTH);  

    pDoc->get_documentElement(&pRoot);

[/img]
ifdef POWER_CHECK

    if(pRoot->hasChildNodes() != -1)//-1 is True

    {

        pRoot->Release();

        return FALSE;

    }


[img][/img]

    pRoot->get_childNodes(&pList);

    long lCount;

    pList->get_length(&lCount);

    for(int iCount=0;iCount <lCount;iCount ++)

    {          

        pList->get_item(iCount,&pNode);          

        if (pNode == NULL) continue;

        memset(buff,0,NODE_BUFF_MAX_LENGTH);

        GetNodeName(pNode,buff);      

        if(wcscmp(buff,XML_NODE_TAG)==0)

        {      

            //将数据从xml文件里面解析出来......      

            pNode->Release();//因为是循环体也可以把这些综合起来放到循环体的开始部分处理  

            //但是在资源不使用的时候立刻释放是一个比较保险且妥当的办法

          continue;

            continue;

            continue;

        }      

        else

        {          

            //TRACE(_T("UnKnowNode:"));

            //wprintf(buff);

            //TRACE(_T("/n"));

            pNode->Release();

            continue;

        }      

    }  

    pList->Release();  

    pRoot->Release();

    return TRUE;

}

 

inline BOOL GetNodeName(MSXML2::IXMLDOMNode *pNode, const unsigned short* lpsz )

{

    BSTR  sNodeType = NULL;

    BSTR  sNodeName = NULL;

    if (NULL==pNode )

        return FALSE;

    if (NULL==lpsz) return FALSE;

    pNode->get_nodeTypeString(&sNodeType);

    if(!wcscmp(sNodeType,L"element"))          

        pNode->get_nodeName(&sNodeName);

    else if(!wcscmp(sNodeType,L"text"))      

        pNode->get_text(&sNodeName);

    else   

        pNode->get_nodeName(&sNodeName);  

    wcscpy((unsigned short *)lpsz,(const unsigned short *)sNodeName);  

    SysFreeString(sNodeType);

    SysFreeString(sNodeName);  

    return TRUE;

}

 

 

这篇关于利用MSXML解析xml文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/808650

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

OWASP十大安全漏洞解析

OWASP(开放式Web应用程序安全项目)发布的“十大安全漏洞”列表是Web应用程序安全领域的权威指南,它总结了Web应用程序中最常见、最危险的安全隐患。以下是对OWASP十大安全漏洞的详细解析: 1. 注入漏洞(Injection) 描述:攻击者通过在应用程序的输入数据中插入恶意代码,从而控制应用程序的行为。常见的注入类型包括SQL注入、OS命令注入、LDAP注入等。 影响:可能导致数据泄

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

Spring 源码解读:自定义实现Bean定义的注册与解析

引言 在Spring框架中,Bean的注册与解析是整个依赖注入流程的核心步骤。通过Bean定义,Spring容器知道如何创建、配置和管理每个Bean实例。本篇文章将通过实现一个简化版的Bean定义注册与解析机制,帮助你理解Spring框架背后的设计逻辑。我们还将对比Spring中的BeanDefinition和BeanDefinitionRegistry,以全面掌握Bean注册和解析的核心原理。

CSP 2023 提高级第一轮 CSP-S 2023初试题 完善程序第二题解析 未完

一、题目阅读 (最大值之和)给定整数序列 a0,⋯,an−1,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105 和 1≤ai≤108。 一个序列的非空连续子序列可以用两个下标 ll 和 rr(其中0≤l≤r<n0≤l≤r<n)表示,对应的序列为 al,al+1,⋯,ar​。两个非空连续子序列不同,当且仅当下标不同。 例如,当原序列为 [1,2,1,2] 时,要计算子序列 [

intellij idea generatorConfig.xml

generatorConfig.xml <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE generatorConfigurationPUBLIC "-//mybatis.org//DTD MyBatis Generator Configuration 1.0//EN""http://mybatis.org/dtd/mybatis-ge

多线程解析报表

假如有这样一个需求,当我们需要解析一个Excel里多个sheet的数据时,可以考虑使用多线程,每个线程解析一个sheet里的数据,等到所有的sheet都解析完之后,程序需要提示解析完成。 Way1 join import java.time.LocalTime;public class Main {public static void main(String[] args) thro

ZooKeeper 中的 Curator 框架解析

Apache ZooKeeper 是一个为分布式应用提供一致性服务的软件。它提供了诸如配置管理、分布式同步、组服务等功能。在使用 ZooKeeper 时,Curator 是一个非常流行的客户端库,它简化了 ZooKeeper 的使用,提供了高级的抽象和丰富的工具。本文将详细介绍 Curator 框架,包括它的设计哲学、核心组件以及如何使用 Curator 来简化 ZooKeeper 的操作。 1

Unity3D自带Mouse Look鼠标视角代码解析。

Unity3D自带Mouse Look鼠标视角代码解析。 代码块 代码块语法遵循标准markdown代码,例如: using UnityEngine;using System.Collections;/// MouseLook rotates the transform based on the mouse delta./// Minimum and Maximum values can