关于使用cspreadsheet读写EXCEL表格数据的问题

2024-09-08 12:08

本文主要是介绍关于使用cspreadsheet读写EXCEL表格数据的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  前几天项目有读写EXCEL表格的需求,我就找了大概有几种,大致分为:COM方法、ODBC方法、OLE方法、纯底层格式分析方法。由于COM方法要求必须安装有OFFICE的EXCEL组件,纯底层格式分析方法又很多功能需要自行去完善,所有最终选择了数据库的方法,用数据库的方法去存取xls格式的数据。网上有一个高手写的CSpreedSheet,看了一下提供的接口,感觉挺好用的。在使用的过程中发现几个问题,做如下探讨:

    1 cspreadsheet的构造问题:

    CSpreadSheet(CString File, CString SheetOrSeparator, bool Backup = true);

    第一个参数不用多说,是xls文件的全路径;

    第二个参数也不用多说,是xls其中某一个表格的名字,不过有趣的是,如果你不确定表格的名称,可以用空字符串代替,它便会默认读取第一个表格;

    第三个参数默认为true,我觉得这个参数是很有问题的。这个参数为true的原始意义是读取表格时额外做个备份,但是如果你的xls表格不是每列每行都全有数据的时候,它便会严重破坏你的表格数据,这可能是作者的无心之失,实验的数据可能全是满值的结果吧。这个问题想改也很容易,就是删除表格重新写入的过程。所以我构造这个对象的时候最后一个参数为false,我不需要有备份,这样便会省去删除表格又重新写的麻烦了。

    2 AddCell问题,四参数的那个:

    bool AddCell(CString CellValue, CString column, long row = 0, bool Auto = true);

    如果你想添加一个新列,就必须得到你想添加在哪一列,分析当最后一个参数添加新列的方式:

    (1)当最后一个参数为true时具体代号在EXCEL中可以看出,第一列是“A”,第二列为“B”,以此类推,传入的第二个参数必须是“A”、“B”...如果你想在没有数据的下一列生成新列,方法就是先用GetTotalColumns()获得总的列数,然后“A”代表65,新的一列的值为 65 + 总列数 - 1,再转换成ASCII字符传进去就OK了。

    (2)当最后一个参数为false时,第二个参数就只能传入列头了,比如xls表其中一个列头名为Age,则传入第二个参数就传入“Age”,只能代替原有表格的数据,但是当你想添加新列,列头名为Tel的时候,就不能做了,原因是作者没有考虑到最后一个参数为false的时候,添加新列的情况。

    这个问题也很简单,我做了如下修改,便可以用AddCell("Tel","Tel",0,false)用新表头来创建新列了,

bool CSpreadSheet::AddCell(CString CellValue, CString column, long row, bool Auto)
{
 short columnIndex = CalculateColumnNumber(column, Auto);
 if (columnIndex == 0)
 {

    columnIndex = m_aFieldNames.GetSize()+1;
 }

 if (AddCell(CellValue, columnIndex, row))
 {
  return true;
 }
 return false;
}

    这样修改的目的就是当在原有的列头中搜索,没有发现就认定为新的列,返回一个列的列号。

    3 第三个问题相信有很多朋友都遇到过,就是用cspreadsheet生成的表格,每个格子里的数据左上方会有一个上逗号的标志:“’” 虽然不影响读取数据,但影响了美观。

    起初我怀疑是写入表格的时候所有数据前有个多余的“’”符号,但我跟踪代码后并没有发现,后来找了个新的读写EXCEL的开源库 ExcelFormat_src,发现写入的也是有“’”符号,这两种都是用的数据库方式。所以,我断定这个数据库方式特点,“’”符号代表是字符串类型的。

    出现这个情况的原因就是CSpreadSheet将所有的数据类型都按一种称为万能类型的字符串类型,这种处理方式虽然简单,但是却忽略了每一列的数据类型,在数据库中每一列代表每一个字段。

    于是我将CSpreadSheet源代码修改了一下,用来区别开字符串类型和数字类型,加入了PUBLIC成员变量vector<BOOL> vecNumOrAlp;

    它的含义就是为了表征每一列的数据类型,FALSE时为字符串类型,TRUE为数值类型。

    然后修改AddRow函数的代码:

    将m_stempSql.Format("\"%s\"%s", RowValues.GetAt(i), m_sSeparator);替换为:

    if(!vecNumOrAlp[i])

        m_stempSql.Format("\"%s\"%s", RowValues.GetAt(i), m_sSeparator);

    else

    {

        float f = atof((LPCSTR)RowValues.GetAt(i));

        m_stempSql.Format("\"%.7f\"%s", f, m_sSeparator);

    }

    修改Commit()代码如下:

    将m_stempSql = m_stempSql + "[" + m_aFieldNames.GetAt(j) +"]" + " char(255), ";替换为:

   

    if(!vecNumOrAlp[i])

        m_stempSql = m_stempSql + "[" + m_aFieldNames.GetAt(j) +"]" + " text, ";

    else

         m_stempSql = m_stempSql + "[" + m_aFieldNames.GetAt(j) +"]" + " double, ";   

 

    经过如此修改,就可以区分出数值类型和字符串类型的,而且数字类型的左上角不会有”‘“符号了。当然,如果牵扯到其他类型,比如日期型,可以将vecNumOrAlp的BOOL类型改成结构体或枚举类型的,用来表征不同的数据类型。

    至此我所遇到的 CSpreadSheet问题都已经解决了,如果有朋友哪里有更好的建议或者不明白的,可以随时和我探讨,使CSpreadSheet用起来更加方便,更加完美。   关于使用cspreadsheet读写EXCEL表格数据的问题

 

 

    最近又发现点新问题,在这给大家分享一下!

    1 CSpreadSheet由于采用的是数据库方式,所以有一个字段数量限制,这是微软的ADO访问数据库的一个限制,最多255个字段,多了就不行了,详情请参照微软核心代码dbcore.一般情况下,是用不到这么多字段的,所以很少人能够发现,如果用到这么大的,很遗憾,只能选用其他的exl组件了。

    2 AddRow()函数问题。这个问题也有很多人没有注意到,它的效率极其低下!当然如果添加行数比较少的话,没什么影响,但是当你添加上百行数据的时候,这个函数的问题就凸现出来了。原因就在于AddRow()函数调用了Commit()。Commit()函数的步骤相信看过代码的人都能了解: 1 删除DROP表;2 创建CREATE TABLE表 ;3 往表里循环写数据。 也就是说每次添加行都要执行这3步,显然是不合理的,如果你只想添加第500行数据,但程序一定要将500行数据全部写入,这样效率就很低了。这个问题解释到这 解决方案很简单:每次添加新行时,不进行前两步,第三步也只写入新行。 代码就不在此贴出了,相信大多数人都会改,如果有人需要的话,也可以在我的博客留言。

这篇关于关于使用cspreadsheet读写EXCEL表格数据的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1148071

相关文章

Python虚拟环境终极(含PyCharm的使用教程)

《Python虚拟环境终极(含PyCharm的使用教程)》:本文主要介绍Python虚拟环境终极(含PyCharm的使用教程),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录一、为什么需要虚拟环境?二、虚拟环境创建方式对比三、命令行创建虚拟环境(venv)3.1 基础命令3

Python Transformer 库安装配置及使用方法

《PythonTransformer库安装配置及使用方法》HuggingFaceTransformers是自然语言处理(NLP)领域最流行的开源库之一,支持基于Transformer架构的预训练模... 目录python 中的 Transformer 库及使用方法一、库的概述二、安装与配置三、基础使用:Pi

关于pandas的read_csv方法使用解读

《关于pandas的read_csv方法使用解读》:本文主要介绍关于pandas的read_csv方法使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录pandas的read_csv方法解读read_csv中的参数基本参数通用解析参数空值处理相关参数时间处理相关

使用Node.js制作图片上传服务的详细教程

《使用Node.js制作图片上传服务的详细教程》在现代Web应用开发中,图片上传是一项常见且重要的功能,借助Node.js强大的生态系统,我们可以轻松搭建高效的图片上传服务,本文将深入探讨如何使用No... 目录准备工作搭建 Express 服务器配置 multer 进行图片上传处理图片上传请求完整代码示例

SpringBoot条件注解核心作用与使用场景详解

《SpringBoot条件注解核心作用与使用场景详解》SpringBoot的条件注解为开发者提供了强大的动态配置能力,理解其原理和适用场景是构建灵活、可扩展应用的关键,本文将系统梳理所有常用的条件注... 目录引言一、条件注解的核心机制二、SpringBoot内置条件注解详解1、@ConditionalOn

Python中使用正则表达式精准匹配IP地址的案例

《Python中使用正则表达式精准匹配IP地址的案例》Python的正则表达式(re模块)是完成这个任务的利器,但你知道怎么写才能准确匹配各种合法的IP地址吗,今天我们就来详细探讨这个问题,感兴趣的朋... 目录为什么需要IP正则表达式?IP地址的基本结构基础正则表达式写法精确匹配0-255的数字验证IP地

MySQL 中查询 VARCHAR 类型 JSON 数据的问题记录

《MySQL中查询VARCHAR类型JSON数据的问题记录》在数据库设计中,有时我们会将JSON数据存储在VARCHAR或TEXT类型字段中,本文将详细介绍如何在MySQL中有效查询存储为V... 目录一、问题背景二、mysql jsON 函数2.1 常用 JSON 函数三、查询示例3.1 基本查询3.2

使用Python实现全能手机虚拟键盘的示例代码

《使用Python实现全能手机虚拟键盘的示例代码》在数字化办公时代,你是否遇到过这样的场景:会议室投影电脑突然键盘失灵、躺在沙发上想远程控制书房电脑、或者需要给长辈远程协助操作?今天我要分享的Pyth... 目录一、项目概述:不止于键盘的远程控制方案1.1 创新价值1.2 技术栈全景二、需求实现步骤一、需求

Spring LDAP目录服务的使用示例

《SpringLDAP目录服务的使用示例》本文主要介绍了SpringLDAP目录服务的使用示例... 目录引言一、Spring LDAP基础二、LdapTemplate详解三、LDAP对象映射四、基本LDAP操作4.1 查询操作4.2 添加操作4.3 修改操作4.4 删除操作五、认证与授权六、高级特性与最佳

SpringBatch数据写入实现

《SpringBatch数据写入实现》SpringBatch通过ItemWriter接口及其丰富的实现,提供了强大的数据写入能力,本文主要介绍了SpringBatch数据写入实现,具有一定的参考价值,... 目录python引言一、ItemWriter核心概念二、数据库写入实现三、文件写入实现四、多目标写入