关于使用cspreadsheet读写EXCEL表格数据的问题

2024-09-08 12:08

本文主要是介绍关于使用cspreadsheet读写EXCEL表格数据的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  前几天项目有读写EXCEL表格的需求,我就找了大概有几种,大致分为:COM方法、ODBC方法、OLE方法、纯底层格式分析方法。由于COM方法要求必须安装有OFFICE的EXCEL组件,纯底层格式分析方法又很多功能需要自行去完善,所有最终选择了数据库的方法,用数据库的方法去存取xls格式的数据。网上有一个高手写的CSpreedSheet,看了一下提供的接口,感觉挺好用的。在使用的过程中发现几个问题,做如下探讨:

    1 cspreadsheet的构造问题:

    CSpreadSheet(CString File, CString SheetOrSeparator, bool Backup = true);

    第一个参数不用多说,是xls文件的全路径;

    第二个参数也不用多说,是xls其中某一个表格的名字,不过有趣的是,如果你不确定表格的名称,可以用空字符串代替,它便会默认读取第一个表格;

    第三个参数默认为true,我觉得这个参数是很有问题的。这个参数为true的原始意义是读取表格时额外做个备份,但是如果你的xls表格不是每列每行都全有数据的时候,它便会严重破坏你的表格数据,这可能是作者的无心之失,实验的数据可能全是满值的结果吧。这个问题想改也很容易,就是删除表格重新写入的过程。所以我构造这个对象的时候最后一个参数为false,我不需要有备份,这样便会省去删除表格又重新写的麻烦了。

    2 AddCell问题,四参数的那个:

    bool AddCell(CString CellValue, CString column, long row = 0, bool Auto = true);

    如果你想添加一个新列,就必须得到你想添加在哪一列,分析当最后一个参数添加新列的方式:

    (1)当最后一个参数为true时具体代号在EXCEL中可以看出,第一列是“A”,第二列为“B”,以此类推,传入的第二个参数必须是“A”、“B”...如果你想在没有数据的下一列生成新列,方法就是先用GetTotalColumns()获得总的列数,然后“A”代表65,新的一列的值为 65 + 总列数 - 1,再转换成ASCII字符传进去就OK了。

    (2)当最后一个参数为false时,第二个参数就只能传入列头了,比如xls表其中一个列头名为Age,则传入第二个参数就传入“Age”,只能代替原有表格的数据,但是当你想添加新列,列头名为Tel的时候,就不能做了,原因是作者没有考虑到最后一个参数为false的时候,添加新列的情况。

    这个问题也很简单,我做了如下修改,便可以用AddCell("Tel","Tel",0,false)用新表头来创建新列了,

bool CSpreadSheet::AddCell(CString CellValue, CString column, long row, bool Auto)
{
 short columnIndex = CalculateColumnNumber(column, Auto);
 if (columnIndex == 0)
 {

    columnIndex = m_aFieldNames.GetSize()+1;
 }

 if (AddCell(CellValue, columnIndex, row))
 {
  return true;
 }
 return false;
}

    这样修改的目的就是当在原有的列头中搜索,没有发现就认定为新的列,返回一个列的列号。

    3 第三个问题相信有很多朋友都遇到过,就是用cspreadsheet生成的表格,每个格子里的数据左上方会有一个上逗号的标志:“’” 虽然不影响读取数据,但影响了美观。

    起初我怀疑是写入表格的时候所有数据前有个多余的“’”符号,但我跟踪代码后并没有发现,后来找了个新的读写EXCEL的开源库 ExcelFormat_src,发现写入的也是有“’”符号,这两种都是用的数据库方式。所以,我断定这个数据库方式特点,“’”符号代表是字符串类型的。

    出现这个情况的原因就是CSpreadSheet将所有的数据类型都按一种称为万能类型的字符串类型,这种处理方式虽然简单,但是却忽略了每一列的数据类型,在数据库中每一列代表每一个字段。

    于是我将CSpreadSheet源代码修改了一下,用来区别开字符串类型和数字类型,加入了PUBLIC成员变量vector<BOOL> vecNumOrAlp;

    它的含义就是为了表征每一列的数据类型,FALSE时为字符串类型,TRUE为数值类型。

    然后修改AddRow函数的代码:

    将m_stempSql.Format("\"%s\"%s", RowValues.GetAt(i), m_sSeparator);替换为:

    if(!vecNumOrAlp[i])

        m_stempSql.Format("\"%s\"%s", RowValues.GetAt(i), m_sSeparator);

    else

    {

        float f = atof((LPCSTR)RowValues.GetAt(i));

        m_stempSql.Format("\"%.7f\"%s", f, m_sSeparator);

    }

    修改Commit()代码如下:

    将m_stempSql = m_stempSql + "[" + m_aFieldNames.GetAt(j) +"]" + " char(255), ";替换为:

   

    if(!vecNumOrAlp[i])

        m_stempSql = m_stempSql + "[" + m_aFieldNames.GetAt(j) +"]" + " text, ";

    else

         m_stempSql = m_stempSql + "[" + m_aFieldNames.GetAt(j) +"]" + " double, ";   

 

    经过如此修改,就可以区分出数值类型和字符串类型的,而且数字类型的左上角不会有”‘“符号了。当然,如果牵扯到其他类型,比如日期型,可以将vecNumOrAlp的BOOL类型改成结构体或枚举类型的,用来表征不同的数据类型。

    至此我所遇到的 CSpreadSheet问题都已经解决了,如果有朋友哪里有更好的建议或者不明白的,可以随时和我探讨,使CSpreadSheet用起来更加方便,更加完美。   关于使用cspreadsheet读写EXCEL表格数据的问题

 

 

    最近又发现点新问题,在这给大家分享一下!

    1 CSpreadSheet由于采用的是数据库方式,所以有一个字段数量限制,这是微软的ADO访问数据库的一个限制,最多255个字段,多了就不行了,详情请参照微软核心代码dbcore.一般情况下,是用不到这么多字段的,所以很少人能够发现,如果用到这么大的,很遗憾,只能选用其他的exl组件了。

    2 AddRow()函数问题。这个问题也有很多人没有注意到,它的效率极其低下!当然如果添加行数比较少的话,没什么影响,但是当你添加上百行数据的时候,这个函数的问题就凸现出来了。原因就在于AddRow()函数调用了Commit()。Commit()函数的步骤相信看过代码的人都能了解: 1 删除DROP表;2 创建CREATE TABLE表 ;3 往表里循环写数据。 也就是说每次添加行都要执行这3步,显然是不合理的,如果你只想添加第500行数据,但程序一定要将500行数据全部写入,这样效率就很低了。这个问题解释到这 解决方案很简单:每次添加新行时,不进行前两步,第三步也只写入新行。 代码就不在此贴出了,相信大多数人都会改,如果有人需要的话,也可以在我的博客留言。

这篇关于关于使用cspreadsheet读写EXCEL表格数据的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1148071

相关文章

Kotlin Map映射转换问题小结

《KotlinMap映射转换问题小结》文章介绍了Kotlin集合转换的多种方法,包括map(一对一转换)、mapIndexed(带索引)、mapNotNull(过滤null)、mapKeys/map... 目录Kotlin 集合转换:map、mapIndexed、mapNotNull、mapKeys、map

nginx中端口无权限的问题解决

《nginx中端口无权限的问题解决》当Nginx日志报错bind()to80failed(13:Permissiondenied)时,这通常是由于权限不足导致Nginx无法绑定到80端口,下面就来... 目录一、问题原因分析二、解决方案1. 以 root 权限运行 Nginx(不推荐)2. 为 Nginx

解决1093 - You can‘t specify target table报错问题及原因分析

《解决1093-Youcan‘tspecifytargettable报错问题及原因分析》MySQL1093错误因UPDATE/DELETE语句的FROM子句直接引用目标表或嵌套子查询导致,... 目录报js错原因分析具体原因解决办法方法一:使用临时表方法二:使用JOIN方法三:使用EXISTS示例总结报错原

一文详解如何使用Java获取PDF页面信息

《一文详解如何使用Java获取PDF页面信息》了解PDF页面属性是我们在处理文档、内容提取、打印设置或页面重组等任务时不可或缺的一环,下面我们就来看看如何使用Java语言获取这些信息吧... 目录引言一、安装和引入PDF处理库引入依赖二、获取 PDF 页数三、获取页面尺寸(宽高)四、获取页面旋转角度五、判断

Windows环境下解决Matplotlib中文字体显示问题的详细教程

《Windows环境下解决Matplotlib中文字体显示问题的详细教程》本文详细介绍了在Windows下解决Matplotlib中文显示问题的方法,包括安装字体、更新缓存、配置文件设置及编码調整,并... 目录引言问题分析解决方案详解1. 检查系统已安装字体2. 手动添加中文字体(以SimHei为例)步骤

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口

C++中assign函数的使用

《C++中assign函数的使用》在C++标准模板库中,std::list等容器都提供了assign成员函数,它比操作符更灵活,支持多种初始化方式,下面就来介绍一下assign的用法,具有一定的参考价... 目录​1.assign的基本功能​​语法​2. 具体用法示例​​​(1) 填充n个相同值​​(2)

Spring StateMachine实现状态机使用示例详解

《SpringStateMachine实现状态机使用示例详解》本文介绍SpringStateMachine实现状态机的步骤,包括依赖导入、枚举定义、状态转移规则配置、上下文管理及服务调用示例,重点解... 目录什么是状态机使用示例什么是状态机状态机是计算机科学中的​​核心建模工具​​,用于描述对象在其生命

SpringSecurity整合redission序列化问题小结(最新整理)

《SpringSecurity整合redission序列化问题小结(最新整理)》文章详解SpringSecurity整合Redisson时的序列化问题,指出需排除官方Jackson依赖,通过自定义反序... 目录1. 前言2. Redission配置2.1 RedissonProperties2.2 Red

nginx 负载均衡配置及如何解决重复登录问题

《nginx负载均衡配置及如何解决重复登录问题》文章详解Nginx源码安装与Docker部署,介绍四层/七层代理区别及负载均衡策略,通过ip_hash解决重复登录问题,对nginx负载均衡配置及如何... 目录一:源码安装:1.配置编译参数2.编译3.编译安装 二,四层代理和七层代理区别1.二者混合使用举例