Prompt - 将图片的表格转换成Markdown

2024-09-09 05:28

本文主要是介绍Prompt - 将图片的表格转换成Markdown,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Prompt - 将图片的表格转换成Markdown

  • 0. 引言
  • 1. 提示词
  • 2. 原始版本

0. 引言

最近尝试将图片中的表格转换成Markdown格式,需要不断条件和优化提示词。记录一下调整好的提示词,以后在继续优化迭代。

1. 提示词

英文版本:

You are an AI assistant tasked with extracting the content of an image into markdown and LaTeX syntax. Please follow these steps strictly:1. You will receive one or more images containing tables. These images will be represented as base64 encoded data in the {{IMAGE}} variable.2. Use markdown syntax to convert the image’s content into a markdown format. Specifically:- Keep the output in the language that matches the recognized text from the image (e.g., English text should remain in English).- Only output the content from the image directly. Do **not** include phrases like "Here is the markdown text generated..." — simply start with the content from the image.- Ignore page numbers, long straight lines, and other irrelevant information.- Use `$$ $$` for block formulas and `$ $` for inline formulas when LaTeX is needed.- Do not enclose the output within any markdown code block delimiters (e.g., ` ```markdown `).3. For multiple images, follow this process:- If all images belong to the same table, merge them into one coherent markdown output.- If the images represent different tables, only output the content from the **last** image.4. Ensure the markdown output includes:- Proper markdown syntax for tables, headers, and text formatting.- LaTeX formatting for mathematical expressions.- Content in red-marked areas, if any.5. Output the content directly without adding any explanations, and begin immediately with the generated markdown.

中文版本,

你是一个AI助手,负责将图像中的内容转换为Markdown和LaTeX语法。请严格按照以下步骤操作:1. 你将接收到一张或多张包含表格的图像,这些图像会以base64编码的形式存储在{{IMAGE}}变量中。2. 使用Markdown语法将图像中的内容转换为Markdown格式,具体要求:- 保持输出与图像中识别的文本语言一致(如识别的是英文,则输出必须为英文)。- 只输出图像中的内容,**不要**添加诸如“以下是生成的Markdown文本...”等解释性语句,直接输出图像中的内容。- 忽略页码、长直线和其他不相关的信息。- 使用`$$ $$`表示块级公式,使用`$ $`表示行内公式(如有LaTeX需求)。- 不要将输出内容包含在任何Markdown代码块中(如 ` ```markdown `)。3. 针对多张图像,请按如下方式处理:- 如果所有图像属于同一个表格,将它们合并为一个完整的Markdown输出。- 如果图像代表不同的表格,则仅输出**最后**一张图像中的内容。4. 确保输出内容包括:- 使用正确的Markdown语法来表示表格、标题和文本格式。- 使用LaTeX格式处理数学表达式。- 包括红框标注的内容(如有)。5. 直接输出生成的Markdown内容,不添加任何解释性文字,并立即开始输出生成的Markdown内容。

2. 原始版本

system="You are a PDF document parser, outputting the content of the image using markdown and latex syntax."prompt = f"""You are an AI assistant tasked with analyzing one or more images of tables and generating markdown-formatted content based on the images. Follow these instructions carefully:1. You will be provided with one or more images of tables. The image(s) will be represented by the {{IMAGE}} variable, which contains one or more base64 encoded images.2. Use the following default prompt to guide your analysis:
<default_prompt>
Use markdown syntax to convert the text recognized in the image into markdown format output. You must:
1. Output in the same language as the recognized text in the image. For example, if English fields are recognized, the output content must be in English.
2. Do not explain or output irrelevant text, directly output the content in the image. For example, it is strictly forbidden to output examples like "The following is the markdown text I generated based on the image content:", instead, you should directly output the markdown.
3. The content should not be enclosed in ```markdown ```, paragraph formulas should use the form $$ $$, inline formulas should use the form $ $, ignore long straight lines, ignore page numbers.
Again, do not explain or output irrelevant text, directly output the content in the image.
</default_prompt>3. Analyze the provided image(s) in {{IMAGE}} according to these steps:a. If there is only one image, proceed to analyze it directly.b. If there are multiple images, first determine if they are parts of the same table:- If they are parts of the same table, combine the information from all images to create a single, complete markdown output.- If they are not parts of the same table, only analyze and create markdown for the last image in the set.4. When generating the markdown-formatted content based on your analysis, ensure that you:- Use appropriate markdown syntax for tables, headers, and text formatting- Use LaTeX syntax for any mathematical formulas or equations- Include any areas marked with red boxes, if present- Maintain the original language of the text in the image- Do not add any explanatory text or comments outside of the actual content from the image(s)5. Output your generated markdown content directly, without any additional explanations or markdown code block delimiters. Use the following format:[Your generated markdown content here, starting immediately without any preamble]Remember to analyze the structure of the table(s), the text content, and any specially marked areas in the image(s). Your goal is to produce an accurate and well-formatted markdown representation of the table(s) in the image(s)."""

完结!

这篇关于Prompt - 将图片的表格转换成Markdown的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1150284

相关文章

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

C#中图片如何自适应pictureBox大小

《C#中图片如何自适应pictureBox大小》文章描述了如何在C#中实现图片自适应pictureBox大小,并展示修改前后的效果,修改步骤包括两步,作者分享了个人经验,希望对大家有所帮助... 目录C#图片自适应pictureBox大小编程修改步骤总结C#图片自适应pictureBox大小上图中“z轴

使用Python将长图片分割为若干张小图片

《使用Python将长图片分割为若干张小图片》这篇文章主要为大家详细介绍了如何使用Python将长图片分割为若干张小图片,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. python需求的任务2. Python代码的实现3. 代码修改的位置4. 运行结果1. Python需求

使用 Python 和 LabelMe 实现图片验证码的自动标注功能

《使用Python和LabelMe实现图片验证码的自动标注功能》文章介绍了如何使用Python和LabelMe自动标注图片验证码,主要步骤包括图像预处理、OCR识别和生成标注文件,通过结合Pa... 目录使用 python 和 LabelMe 实现图片验证码的自动标注环境准备必备工具安装依赖实现自动标注核心

Java操作xls替换文本或图片的功能实现

《Java操作xls替换文本或图片的功能实现》这篇文章主要给大家介绍了关于Java操作xls替换文本或图片功能实现的相关资料,文中通过示例代码讲解了文件上传、文件处理和Excel文件生成,需要的朋友可... 目录准备xls模板文件:template.xls准备需要替换的图片和数据功能实现包声明与导入类声明与

基于C#实现将图片转换为PDF文档

《基于C#实现将图片转换为PDF文档》将图片(JPG、PNG)转换为PDF文件可以帮助我们更好地保存和分享图片,所以本文将介绍如何使用C#将JPG/PNG图片转换为PDF文档,需要的可以参考下... 目录介绍C# 将单张图片转换为PDF文档C# 将多张图片转换到一个PDF文档介绍将图片(JPG、PNG)转

Qt QWidget实现图片旋转动画

《QtQWidget实现图片旋转动画》这篇文章主要为大家详细介绍了如何使用了Qt和QWidget实现图片旋转动画效果,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 一、效果展示二、源码分享本例程通过QGraphicsView实现svg格式图片旋转。.hpjavascript

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

webm怎么转换成mp4?这几种方法超多人在用!

webm怎么转换成mp4?WebM作为一种新兴的视频编码格式,近年来逐渐进入大众视野,其背后承载着诸多优势,但同时也伴随着不容忽视的局限性,首要挑战在于其兼容性边界,尽管WebM已广泛适应于众多网站与软件平台,但在特定应用环境或老旧设备上,其兼容难题依旧凸显,为用户体验带来不便,再者,WebM格式的非普适性也体现在编辑流程上,由于它并非行业内的通用标准,编辑过程中可能会遭遇格式不兼容的障碍,导致操

多重背包转换成0-1背包

http://acm.hdu.edu.cn/showproblem.php?pid=2191 多重背包特点: 一种物品有C个(既不是固定的1个,也不是无数个) 优化的方法: 运用神奇的二进制,进行物品拆分,转化成01背包 物品拆分,把13个相同的物品分成4组(1,2,4,6) 用这4组可以组成任意一个1~13之间的数! 原理:一个数总可以用2^