本文主要是介绍gpt4识别广告图片,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
本小项目,是根据多张拼接的图片,使用gpt4进行批量识别,并根据提示词分析
1、新建一个recognition_project目录,把图片放到default下,然后把脚本放到目录下
2、配置gpt的key
api_key是openai的key
base_url 是中转站或者openai的官网地址,如果你买的中转站的,就用中转站的地址即可
3、执行脚本即可
recognition_image.py
import base64
import requests
import datetime
import os
import time
from tqdm import tqdm# Function to encode the image
def encode_image(image_path):with open(image_path, "rb") as image_file:return base64.b64encode(image_file.read()).decode('utf-8')def recognition_image(image_file, base_url, api_key):# Path to your imageimages = image_file[0]file = image_file[1]# Getting the base64 stringbase64_image = encode_image(images)headers = {"Content-Type": "application/json","Authorization": f"Bearer {api_key}"}payload = {"model": "gpt-4-vision-preview","messages": [{"role": "user",
这篇关于gpt4识别广告图片的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!