Java中富文本转markdown

2023-12-08 03:01
文章标签 java 文本 markdown 中富

本文主要是介绍Java中富文本转markdown,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

实现富文本即html语法转md,要求是尽可能展示效果一样,可以有少许误差,另外只实现了html中的body转md,其他标签如head等未实现。

大致思路是:通过jsoup工具获取html节点,再穷举替换。前提是熟悉html以及md语法

依赖如下:

        <dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.16.1</version></dependency>

代码如下:

import lombok.Data;
import org.apache.commons.lang3.StringUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;import java.util.ArrayList;
import java.util.List;public class Html2MarkdownUtil {public static void main(String[] args) {String html = "<p style=\"padding: 0; margin: 10px 0; line-height: 1.5; font-size: 16px;\"><b style=\"padding: 0; margin: 0;\">Hello<font color=\"#c24f4a\" style=\"padding: 0; margin: 0;\">world</font></b></p>";System.out.println(parseHtml2Markdown(html));}/*** 解析html2md** @param html html* @return {@link String}*/public static String parseHtml2Markdown(String html) {Document doc = Jsoup.parse(html);StringBuilder sb = new StringBuilder();for (Element element : doc.body().children()) {HtmlElement htmlElement = new HtmlElement(element);sb.append(htmlElement.getMarkdownText());}return sb.toString();}/*** 标记文本** @param element 要素* @return {@link String}*/public static String toMarkdownText(Element element) {StringBuilder sb = new StringBuilder();String tagName = element.tagName().toLowerCase();String text = element.ownText();switch (tagName) {case "h1":sb.append("# ").append(text);break;case "h2":sb.append("## ").append(text);break;case "h3":sb.append("### ").append(text);break;case "h4":sb.append("#### ").append(text);break;case "h5":sb.append("##### ").append(text);break;case "h6":sb.append("###### ").append(text);break;case "p":case "font":case "b":case "span":sb.append(text);break;case "ul":for (Element child : element.children()) {sb.append("* ").append(child.text().trim()).append("\n");}break;case "ol":int index = 1;for (Element child : element.children()) {sb.append(index).append(". ").append(child.text().trim()).append("\n");index++;}break;case "a":sb.append("[").append(text).append("](").append(element.attr("href")).append(")");break;case "strong":sb.append("**").append(text).append("**");break;case "em":sb.append("_").append(text).append("_");break;case "blockquote":sb.append("> ").append(text);break;case "img":sb.append("![");if (element.hasAttr("alt")) {sb.append(element.attr("alt"));}sb.append("](").append(element.attr("src")).append(")");break;default:break;}return sb.toString();}@Datapublic static class HtmlElement {private Element element;private String tagName;private String ownText;private boolean isNewline;private List<HtmlElement> children;public HtmlElement(Element element) {this.element = element;this.tagName = element.tagName().toLowerCase();this.ownText = element.ownText();this.isNewline = isNewline();if (!StringUtils.equalsAny(this.tagName, "ul", "ol")) {Elements children = element.children();if (children.size() > 0) {this.children = new ArrayList<>();for (Element child : children) {this.children.add(new HtmlElement(child));}}}}public boolean isNewline() {return StringUtils.equalsAny(tagName, "h1", "h2", "h3", "h4", "h5", "h6", "p", "ul", "ol", "blockquote");}public String getMarkdownText() {StringBuilder sb = new StringBuilder();sb.append(toMarkdownText(element));if (children != null && children.size() > 0) {for (HtmlElement child : children) {sb.append(child.getMarkdownText());}}if (isNewline) {sb.append("\n");}return sb.toString();}}
}

这篇关于Java中富文本转markdown的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/468320

相关文章

Spring Boot中的路径变量示例详解

《SpringBoot中的路径变量示例详解》SpringBoot中PathVariable通过@PathVariable注解实现URL参数与方法参数绑定,支持多参数接收、类型转换、可选参数、默认值及... 目录一. 基本用法与参数映射1.路径定义2.参数绑定&nhttp://www.chinasem.cnbs

JAVA中安装多个JDK的方法

《JAVA中安装多个JDK的方法》文章介绍了在Windows系统上安装多个JDK版本的方法,包括下载、安装路径修改、环境变量配置(JAVA_HOME和Path),并说明如何通过调整JAVA_HOME在... 首先去oracle官网下载好两个版本不同的jdk(需要登录Oracle账号,没有可以免费注册)下载完

Spring StateMachine实现状态机使用示例详解

《SpringStateMachine实现状态机使用示例详解》本文介绍SpringStateMachine实现状态机的步骤,包括依赖导入、枚举定义、状态转移规则配置、上下文管理及服务调用示例,重点解... 目录什么是状态机使用示例什么是状态机状态机是计算机科学中的​​核心建模工具​​,用于描述对象在其生命

Spring Boot 结合 WxJava 实现文章上传微信公众号草稿箱与群发

《SpringBoot结合WxJava实现文章上传微信公众号草稿箱与群发》本文将详细介绍如何使用SpringBoot框架结合WxJava开发工具包,实现文章上传到微信公众号草稿箱以及群发功能,... 目录一、项目环境准备1.1 开发环境1.2 微信公众号准备二、Spring Boot 项目搭建2.1 创建

Java中Integer128陷阱

《Java中Integer128陷阱》本文主要介绍了Java中Integer与int的区别及装箱拆箱机制,重点指出-128至127范围内的Integer值会复用缓存对象,导致==比较结果为true,下... 目录一、Integer和int的联系1.1 Integer和int的区别1.2 Integer和in

SpringSecurity整合redission序列化问题小结(最新整理)

《SpringSecurity整合redission序列化问题小结(最新整理)》文章详解SpringSecurity整合Redisson时的序列化问题,指出需排除官方Jackson依赖,通过自定义反序... 目录1. 前言2. Redission配置2.1 RedissonProperties2.2 Red

IntelliJ IDEA2025创建SpringBoot项目的实现步骤

《IntelliJIDEA2025创建SpringBoot项目的实现步骤》本文主要介绍了IntelliJIDEA2025创建SpringBoot项目的实现步骤,文中通过示例代码介绍的非常详细,对大家... 目录一、创建 Spring Boot 项目1. 新建项目2. 基础配置3. 选择依赖4. 生成项目5.

JSONArray在Java中的应用操作实例

《JSONArray在Java中的应用操作实例》JSONArray是org.json库用于处理JSON数组的类,可将Java对象(Map/List)转换为JSON格式,提供增删改查等操作,适用于前后端... 目录1. jsONArray定义与功能1.1 JSONArray概念阐释1.1.1 什么是JSONA

Java JDK1.8 安装和环境配置教程详解

《JavaJDK1.8安装和环境配置教程详解》文章简要介绍了JDK1.8的安装流程,包括官网下载对应系统版本、安装时选择非系统盘路径、配置JAVA_HOME、CLASSPATH和Path环境变量,... 目录1.下载JDK2.安装JDK3.配置环境变量4.检验JDK官网下载地址:Java Downloads

Spring boot整合dubbo+zookeeper的详细过程

《Springboot整合dubbo+zookeeper的详细过程》本文讲解SpringBoot整合Dubbo与Zookeeper实现API、Provider、Consumer模式,包含依赖配置、... 目录Spring boot整合dubbo+zookeeper1.创建父工程2.父工程引入依赖3.创建ap