Prompt - 将图片的表格转换成Markdown

2024-09-09 05:28

本文主要是介绍Prompt - 将图片的表格转换成Markdown,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Prompt - 将图片的表格转换成Markdown

  • 0. 引言
  • 1. 提示词
  • 2. 原始版本

0. 引言

最近尝试将图片中的表格转换成Markdown格式,需要不断条件和优化提示词。记录一下调整好的提示词,以后在继续优化迭代。

1. 提示词

英文版本:

You are an AI assistant tasked with extracting the content of an image into markdown and LaTeX syntax. Please follow these steps strictly:1. You will receive one or more images containing tables. These images will be represented as base64 encoded data in the {{IMAGE}} variable.2. Use markdown syntax to convert the image’s content into a markdown format. Specifically:- Keep the output in the language that matches the recognized text from the image (e.g., English text should remain in English).- Only output the content from the image directly. Do **not** include phrases like "Here is the markdown text generated..." — simply start with the content from the image.- Ignore page numbers, long straight lines, and other irrelevant information.- Use `$$ $$` for block formulas and `$ $` for inline formulas when LaTeX is needed.- Do not enclose the output within any markdown code block delimiters (e.g., ` ```markdown `).3. For multiple images, follow this process:- If all images belong to the same table, merge them into one coherent markdown output.- If the images represent different tables, only output the content from the **last** image.4. Ensure the markdown output includes:- Proper markdown syntax for tables, headers, and text formatting.- LaTeX formatting for mathematical expressions.- Content in red-marked areas, if any.5. Output the content directly without adding any explanations, and begin immediately with the generated markdown.

中文版本,

你是一个AI助手,负责将图像中的内容转换为Markdown和LaTeX语法。请严格按照以下步骤操作:1. 你将接收到一张或多张包含表格的图像,这些图像会以base64编码的形式存储在{{IMAGE}}变量中。2. 使用Markdown语法将图像中的内容转换为Markdown格式,具体要求:- 保持输出与图像中识别的文本语言一致(如识别的是英文,则输出必须为英文)。- 只输出图像中的内容,**不要**添加诸如“以下是生成的Markdown文本...”等解释性语句,直接输出图像中的内容。- 忽略页码、长直线和其他不相关的信息。- 使用`$$ $$`表示块级公式,使用`$ $`表示行内公式(如有LaTeX需求)。- 不要将输出内容包含在任何Markdown代码块中(如 ` ```markdown `)。3. 针对多张图像,请按如下方式处理:- 如果所有图像属于同一个表格,将它们合并为一个完整的Markdown输出。- 如果图像代表不同的表格,则仅输出**最后**一张图像中的内容。4. 确保输出内容包括:- 使用正确的Markdown语法来表示表格、标题和文本格式。- 使用LaTeX格式处理数学表达式。- 包括红框标注的内容(如有)。5. 直接输出生成的Markdown内容,不添加任何解释性文字,并立即开始输出生成的Markdown内容。

2. 原始版本

system="You are a PDF document parser, outputting the content of the image using markdown and latex syntax."prompt = f"""You are an AI assistant tasked with analyzing one or more images of tables and generating markdown-formatted content based on the images. Follow these instructions carefully:1. You will be provided with one or more images of tables. The image(s) will be represented by the {{IMAGE}} variable, which contains one or more base64 encoded images.2. Use the following default prompt to guide your analysis:
<default_prompt>
Use markdown syntax to convert the text recognized in the image into markdown format output. You must:
1. Output in the same language as the recognized text in the image. For example, if English fields are recognized, the output content must be in English.
2. Do not explain or output irrelevant text, directly output the content in the image. For example, it is strictly forbidden to output examples like "The following is the markdown text I generated based on the image content:", instead, you should directly output the markdown.
3. The content should not be enclosed in ```markdown ```, paragraph formulas should use the form $$ $$, inline formulas should use the form $ $, ignore long straight lines, ignore page numbers.
Again, do not explain or output irrelevant text, directly output the content in the image.
</default_prompt>3. Analyze the provided image(s) in {{IMAGE}} according to these steps:a. If there is only one image, proceed to analyze it directly.b. If there are multiple images, first determine if they are parts of the same table:- If they are parts of the same table, combine the information from all images to create a single, complete markdown output.- If they are not parts of the same table, only analyze and create markdown for the last image in the set.4. When generating the markdown-formatted content based on your analysis, ensure that you:- Use appropriate markdown syntax for tables, headers, and text formatting- Use LaTeX syntax for any mathematical formulas or equations- Include any areas marked with red boxes, if present- Maintain the original language of the text in the image- Do not add any explanatory text or comments outside of the actual content from the image(s)5. Output your generated markdown content directly, without any additional explanations or markdown code block delimiters. Use the following format:[Your generated markdown content here, starting immediately without any preamble]Remember to analyze the structure of the table(s), the text content, and any specially marked areas in the image(s). Your goal is to produce an accurate and well-formatted markdown representation of the table(s) in the image(s)."""

完结!

这篇关于Prompt - 将图片的表格转换成Markdown的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1150284

相关文章

Python中Markdown库的使用示例详解

《Python中Markdown库的使用示例详解》Markdown库是一个用于处理Markdown文本的Python工具,这篇文章主要为大家详细介绍了Markdown库的具体使用,感兴趣的... 目录一、背景二、什么是 Markdown 库三、如何安装这个库四、库函数使用方法1. markdown.mark

Python利用PIL进行图片压缩

《Python利用PIL进行图片压缩》有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所以本文为大家介绍了Python中图片压缩的方法,需要的可以参考下... 有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所有可以对文件中的图

java获取图片的大小、宽度、高度方式

《java获取图片的大小、宽度、高度方式》文章介绍了如何将File对象转换为MultipartFile对象的过程,并分享了个人经验,希望能为读者提供参考... 目China编程录Java获取图片的大小、宽度、高度File对象(该对象里面是图片)MultipartFile对象(该对象里面是图片)总结java获取图片

Java实战之自助进行多张图片合成拼接

《Java实战之自助进行多张图片合成拼接》在当今数字化时代,图像处理技术在各个领域都发挥着至关重要的作用,本文为大家详细介绍了如何使用Java实现多张图片合成拼接,需要的可以了解下... 目录前言一、图片合成需求描述二、图片合成设计与实现1、编程语言2、基础数据准备3、图片合成流程4、图片合成实现三、总结前

使用Python实现图片和base64转换工具

《使用Python实现图片和base64转换工具》这篇文章主要为大家详细介绍了如何使用Python中的base64模块编写一个工具,可以实现图片和Base64编码之间的转换,感兴趣的小伙伴可以了解下... 简介使用python的base64模块来实现图片和Base64编码之间的转换。可以将图片转换为Bas

如何利用Python实现给Excel表格截图

《如何利用Python实现给Excel表格截图》这篇文章主要为大家详细介绍了如何利用Python实现给Excel表格截图功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 我搜索了网络上的方案,感觉把 Excel 表格转换为 html 再用 platwright 截图是比China编程较顺

css实现图片旋转功能

《css实现图片旋转功能》:本文主要介绍了四种CSS变换效果:图片旋转90度、水平翻转、垂直翻转,并附带了相应的代码示例,详细内容请阅读本文,希望能对你有所帮助... 一 css实现图片旋转90度.icon{ -moz-transform:rotate(-90deg); -webkit-transfo

vue基于ElementUI动态设置表格高度的3种方法

《vue基于ElementUI动态设置表格高度的3种方法》ElementUI+vue动态设置表格高度的几种方法,抛砖引玉,还有其它方法动态设置表格高度,大家可以开动脑筋... 方法一、css + js的形式这个方法需要在表格外层设置一个div,原理是将表格的高度设置成外层div的高度,所以外层的div需要

C#实现添加/替换/提取或删除Excel中的图片

《C#实现添加/替换/提取或删除Excel中的图片》在Excel中插入与数据相关的图片,能将关键数据或信息以更直观的方式呈现出来,使文档更加美观,下面我们来看看如何在C#中实现添加/替换/提取或删除E... 在Excandroidel中插入与数据相关的图片,能将关键数据或信息以更直观的方式呈现出来,使文档更

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3