开发手账(一)

2023-11-21 20:04
文章标签 开发 手账

本文主要是介绍开发手账(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、 关于设计

(一)数据库

  1. 确定外键标识,需判断该外键是否有可能被修改。如菜单id,菜单code,菜单名,前两者都可做外键,后面一个则不应做外键。

二、关于组件

(一)POI

1. 文档页数统计

import lombok.extern.slf4j.Slf4j;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.ofdrw.reader.OFDReader;
import org.springframework.web.multipart.MultipartFile;import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.nio.file.Path;
import java.nio.file.Paths;
@Slf4j
public class LvDocPageCounter {public static final String DOCUMENT_PAGE_TEMP = "DOCUMENT_PAGE_TEMP";public static int getPageCount(String filePath) {String fileType = getFileType(filePath);try {switch (fileType) {case "pdf":return getPdfPageCount(filePath);case "docx":return getDocxPageCount(filePath);case "doc":return getDocPageCount(filePath);case "ofd":return getOfdPageCount(filePath);// Add more cases for other document types as neededdefault:log.warn("不支持的文件类型:{}", filePath);return 1;
//                throw new IllegalArgumentException("Unsupported file type");}} catch (Exception e) {log.warn("读取文件异常:{},{}", filePath,e);return 0;}}/*** 文件类型* @param filePath* @return*/private static String getFileType(String filePath) {int dotIndex = filePath.lastIndexOf('.');if (dotIndex == -1 || dotIndex == filePath.length() - 1) {log.warn("文件名中没有找到扩展名:{}", filePath);return "";}return filePath.substring(dotIndex + 1).toLowerCase();}/*** 获取PDF文档页数* @param filePath* @return* @throws IOException*/private static int getPdfPageCount(String filePath) throws IOException {try (PDDocument document = Loader.loadPDF(new File(filePath))) {
//            PDDocument document = new PDDocument();int numberOfPages = document.getNumberOfPages();document.close();return numberOfPages;}}/*** 获取doc文档页数* @param filePath* @return* @throws IOException*/private static int getDocPageCount(String filePath) throws IOException {
//        try (InputStream inputStream = new FileInputStream(filePath);
//             HWPFDocument document = new HWPFDocument(inputStream)) {
//            int pageCount = document.getSummaryInformation().getPageCount();
//            document.close();
//            return pageCount;
//        }try (InputStream inputStream = new FileInputStream(filePath)) {com.aspose.words.Document doc = new com.aspose.words.Document(inputStream);int num = doc.getPageCount();doc.cleanup();return num;} catch (Exception e) {e.printStackTrace();return 0;}}/*** 获取docx页数* @param filePath* @return* @throws IOException*/private static int getDocxPageCount(String filePath) throws IOException {
//        try (InputStream inputStream = new FileInputStream(filePath);
//             XWPFDocument document = new XWPFDocument(inputStream)) {
//            int pages = document.getProperties().getExtendedProperties().getUnderlyingProperties().getPages();
//            document.close();
//            return pages;
//        }try (InputStream inputStream = new FileInputStream(filePath)) {com.aspose.words.Document doc = new com.aspose.words.Document(inputStream);int num = doc.getPageCount();doc.cleanup();return num;} catch (Exception e) {e.printStackTrace();return 0;}}/*** pdf页数* @param filePath* @return* @throws IOException*/private static int getOfdPageCount(String filePath) throws IOException {Path ofdFile = Paths.get(filePath);OFDReader ofdReader = new OFDReader(ofdFile);int numberOfPages = ofdReader.getNumberOfPages();ofdReader.close();return numberOfPages;}/*** 获取缓存文件页数* @param inputStream* @param originalFilename* @return*/public static Integer getPageCount(MultipartFile inputStream, String originalFilename) {try (InputStream inputStream1 = inputStream.getInputStream()) {return getPageCount(inputStream1,originalFilename);} catch (IOException e) {log.warn("读取文件异常:{},{}", originalFilename,e);return 0;}}// Add methods for other document types as needed
}

2. 文本提取

import cn.hutool.core.io.FileUtil;
import lombok.extern.slf4j.Slf4j;
import org.apache.commons.io.FilenameUtils;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.ofdrw.converter.export.TextExporter;import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.concurrent.atomic.AtomicInteger;/*** @author yilv* @version 1.0* @description: TODO* @date 2023/11/16 16:12*/
@Slf4j
public class LvDocTxTHunter {private static AtomicInteger  UPPER_LIMIT=new AtomicInteger(50);/*** 读取文档内容* @param filePath* @return*/public static String readText(String filePath) {int pageCount = LvDocPageCounter.getPageCount(filePath);if (pageCount >UPPER_LIMIT.get()) {log.warn("文件过大:{},{}", filePath,pageCount);return "";}String fileType = getFileType(filePath);try {switch (fileType) {case "pdf":return readPdfText(filePath);case "doc":return readDocText(filePath);case "docx":return readDocxText(filePath);case "ofd":return readOfdText(filePath);// Add more cases for other document types as neededdefault:log.warn("不支持的文件类型:{}", filePath);return "";}} catch (IOException e) {log.warn("读取文件异常:{},{}", filePath,e);return "";}}/*** 获取文件类型* @param filePath* @return*/private static String getFileType(String filePath) {int dotIndex = filePath.lastIndexOf('.');if (dotIndex == -1 || dotIndex == filePath.length() - 1) {log.warn("文件名中没有找到扩展名:{}", filePath);return "";}return filePath.substring(dotIndex + 1).toLowerCase();}/*** 获取pdf文本* @param filePath* @return* @throws IOException*/private static String readPdfText(String filePath) throws IOException {try (PDDocument document = Loader.loadPDF(filePath)) {String text = new PDFTextStripper().getText(document);document.close();return text;}}/*** 获取doc文本* @param filePath* @return* @throws IOException*/private static String readDocText(String filePath) throws IOException {try (InputStream inputStream = new FileInputStream(filePath);HWPFDocument document = new HWPFDocument(inputStream)) {WordExtractor extractor = new WordExtractor(document);String text = extractor.getText();document.close();return text;}}/*** 获取docx文本* @param filePath* @return* @throws IOException*/private static String readDocxText(String filePath) throws IOException {try (InputStream inputStream = new FileInputStream(filePath);XWPFDocument document = new XWPFDocument(inputStream)) {XWPFWordExtractor extractor = new XWPFWordExtractor(document);String text = extractor.getText();document.close();return text;}}/*** pdf页数* @param filePath* @return* @throws IOException*/private static String readOfdText(String filePath) throws IOException {Path txtPath = Paths.get("DOCUMENT_PAGE_TEMP", FilenameUtils.getBaseName(filePath) + ".txt");TextExporter textExporter = new TextExporter(Paths.get(filePath), txtPath);textExporter.export();String s = FileUtil.readUtf8String(txtPath.toFile());textExporter.close();return s;}/*** 获取文件文本* @param tempFile* @return*/public static String readText(File tempFile) {return readText(tempFile.getPath());}// Add methods for other document types as needed
}

3. 文案转换

  • ofd转换
    • ①启动加载字体
    /*** 前置系统数据加载*/private static void systemInit() {FontLoader preload = FontLoader.Preload();preload.scanFontDir(Paths.get(FileUtil.local, "font"));Field namePathMapping = ReflectUtil.getField(FontLoader.class, "fontNamePathMapping");Map<String, String> fontNamePathMapping = (Map<String, String>) ReflectUtil.getFieldValue(preload,namePathMapping);System.out.println("加载字体:" + JSONUtil.toJsonStr(fontNamePathMapping.keySet()));}
    • ②使用ofdrw进行pdf转换
    /*** 将OFD转换为PDF** @param ofdPath OFD路径* @param distPath 输出路径* @param pdfPath 输出PDF路径* @throws IOException*/public static void convertOfdToPDFByBridge(String ofdPath, String distPath, String pdfPath) throws IOException {log.debug("解析文件:{}",ofdPath);Path ofdFilePath = Paths.get(ofdPath);Path dir = Paths.get(distPath);PDFExporterIText exporter = new PDFExporterIText(ofdFilePath, Paths.get(pdfPath));exporter.export();exporter.close();}

这篇关于开发手账(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/404759

相关文章

基于Python开发电脑定时关机工具

《基于Python开发电脑定时关机工具》这篇文章主要为大家详细介绍了如何基于Python开发一个电脑定时关机工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 简介2. 运行效果3. 相关源码1. 简介这个程序就像一个“忠实的管家”,帮你按时关掉电脑,而且全程不需要你多做

Java中的Opencv简介与开发环境部署方法

《Java中的Opencv简介与开发环境部署方法》OpenCV是一个开源的计算机视觉和图像处理库,提供了丰富的图像处理算法和工具,它支持多种图像处理和计算机视觉算法,可以用于物体识别与跟踪、图像分割与... 目录1.Opencv简介Opencv的应用2.Java使用OpenCV进行图像操作opencv安装j

基于Qt开发一个简单的OFD阅读器

《基于Qt开发一个简单的OFD阅读器》这篇文章主要为大家详细介绍了如何使用Qt框架开发一个功能强大且性能优异的OFD阅读器,文中的示例代码讲解详细,有需要的小伙伴可以参考一下... 目录摘要引言一、OFD文件格式解析二、文档结构解析三、页面渲染四、用户交互五、性能优化六、示例代码七、未来发展方向八、结论摘要

在 VSCode 中配置 C++ 开发环境的详细教程

《在VSCode中配置C++开发环境的详细教程》本文详细介绍了如何在VisualStudioCode(VSCode)中配置C++开发环境,包括安装必要的工具、配置编译器、设置调试环境等步骤,通... 目录如何在 VSCode 中配置 C++ 开发环境:详细教程1. 什么是 VSCode?2. 安装 VSCo

C#图表开发之Chart详解

《C#图表开发之Chart详解》C#中的Chart控件用于开发图表功能,具有Series和ChartArea两个重要属性,Series属性是SeriesCollection类型,包含多个Series对... 目录OverviChina编程ewSeries类总结OverviewC#中,开发图表功能的控件是Char

鸿蒙开发搭建flutter适配的开发环境

《鸿蒙开发搭建flutter适配的开发环境》文章详细介绍了在Windows系统上如何创建和运行鸿蒙Flutter项目,包括使用flutterdoctor检测环境、创建项目、编译HAP包以及在真机上运... 目录环境搭建创建运行项目打包项目总结环境搭建1.安装 DevEco Studio NEXT IDE

Python开发围棋游戏的实例代码(实现全部功能)

《Python开发围棋游戏的实例代码(实现全部功能)》围棋是一种古老而复杂的策略棋类游戏,起源于中国,已有超过2500年的历史,本文介绍了如何用Python开发一个简单的围棋游戏,实例代码涵盖了游戏的... 目录1. 围棋游戏概述1.1 游戏规则1.2 游戏设计思路2. 环境准备3. 创建棋盘3.1 棋盘类

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设