Gradio测试-->Gradio映射-->可视化GPT4V API-->Gemini Pro、Claude和Qwen的API

2024-03-14 02:28

本文主要是介绍Gradio测试-->Gradio映射-->可视化GPT4V API-->Gemini Pro、Claude和Qwen的API,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Gradio测试

import gradio as gr
import timedef demo_test(text, image=None):time.sleep(1)  # 正确的暂停调用return text, image if image is not None else None# 创建 Gradio 接口
iface = gr.Interface(fn=demo_test,inputs=[gr.Textbox(label="输入文本"), gr.Image(type="pil", label="上传图片")],outputs=[gr.Textbox(label="输出文本"), gr.Image(type="pil", label="输出图片")]
)iface.launch(server_name="0.0.0.0", server_port=1234)

Gradio映射

本地机器运行:
-L:指定远程机器端口是1234,本地机器的端口号的8888。
用户名:远程机器的用户名
ip地址:远程机器的IP地址

ssh -CNg -L localhost:8888:0.0.0.0:1234  用户名@ip地址 -p PID

Gradio可视化GPT4V API

1. GPT4V

注意:需要设置代理端口

import gradio as gr
import requests
import os
import base64
import io# 设置代理,以确保能够连接到 API
# os.environ["http_proxy"] = "127.0.0.1:58591"
# os.environ["https_proxy"] = "127.0.0.1:58591"# 你的 OpenAI API 密钥
api_key = "sk-"# 函数:将 PIL 图像对象编码为 base64 格式
def encode_image(image):if image is None:return None  # 如果没有图片,则返回 Nonebuffered = io.BytesIO()try:image.save(buffered, format="JPEG")img_str = base64.b64encode(buffered.getvalue()).decode('utf-8')return img_strexcept Exception as e:print(f"编码图像时出错: {e}")return None# 函数:处理 GPT-4 API 请求
def demo_test(text, image=None):message_content = [{"type": "text", "text": text}]if image is not None:base64_image = encode_image(image)if base64_image is not None:message_content.append({"type": "image_url","image_url": {"url": f"data:image/jpeg;base64,{base64_image}"}})headers = {"Content-Type": "application/json","Authorization": f"Bearer {api_key}"}payload = {"model": "gpt-4-vision-preview","messages": [{"role": "user", "content": message_content}],"max_tokens": 3000}response = requests.post("https://api.openai.com/v1/chat/completions", headers=headers, json=payload)response_text = response.json()["choices"][0]["message"]["content"] if response.ok else "处理请求时出错"print(response_text)return response_text, image if image is not None else None# 创建 Gradio 接口
iface = gr.Interface(fn=demo_test,inputs=[gr.Textbox(label="输入文本"), gr.Image(type="pil", label="上传图片")],outputs=[gr.Textbox(label="输出文本"), gr.Image(type="pil", label="输出图片")]
)iface.launch()

Gemini Pro、Claude和Qwen的API

1. Gemini Pro

# setup
import google.generativeai as genaigenai.configure(api_key='')  # 填入自己的api_key# 查询模型
for m in genai.list_models():print(m.name)print(m.supported_generation_methods)
import PIL.Image
import os
# 创建模型实例
model = genai.GenerativeModel('gemini-pro-vision')
# 文件夹路径
folder_path = ''# 结果文件
results_file = ''count =0# 遍历文件夹中的图像
for filename in os.listdir(folder_path):if filename.endswith('.jpg') or filename.endswith('.png'):  # 检查文件是否为图像# 图像路径image_path = os.path.join(folder_path, filename)img = PIL.Image.open(image_path)# 使用模型进行提问question = "描述一下这张图像"response = model.generate_content([question, img], stream=True)response.resolve()# 将结果写入文件with open(results_file, 'a') as file:file.write(f"{filename} {response.text}\n")# 更新计数器count += 1# 每处理100张图像打印一次if count % 5 == 0:print(f"已处理 {count} 张图像")print("处理完成!")

2. Claude

2.1 注册

  1. 注册可以免费使用chat网页版
  2. 5刀Claude 3 Opus使用额度
    支付宝购买虚拟手机卡:https://sms-man.com/cn

2.2 API

3.Qwen

import os# 设置环境变量
os.environ['DASHSCOPE_API_KEY'] = 'sk-'# 之后您可以使用这个环境变量
api_key = os.environ['DASHSCOPE_API_KEY']from dashscope import MultiModalConversationdef call_with_local_file():"""Sample of use local file.linux&mac file schema: file:///home/images/test.pngwindows file schema: file://D:/images/abc.png"""local_file_path1 = 'file:///opt/data/private/434103892.jpg'messages = [{'role': 'system','content': [{'text': 'You are a helpful assistant.'}]}, {'role':'user','content': [{'image': local_file_path1},{'text': '图片里有什么东西?'},]}]response = MultiModalConversation.call(model='qwen-vl-max', messages=messages)# print(response)text_content = response['output']['choices'][0]['message']['content'][0]['text']print(text_content)if __name__ == '__main__':call_with_local_file()

这篇关于Gradio测试-->Gradio映射-->可视化GPT4V API-->Gemini Pro、Claude和Qwen的API的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/806935

相关文章

在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码

《在MyBatis的XML映射文件中<trim>元素所有场景下的完整使用示例代码》在MyBatis的XML映射文件中,trim元素用于动态添加SQL语句的一部分,处理前缀、后缀及多余的逗号或连接符,示... 在MyBATis的XML映射文件中,<trim>元素用于动态地添加SQL语句的一部分,例如SET或W

Python中的可视化设计与UI界面实现

《Python中的可视化设计与UI界面实现》本文介绍了如何使用Python创建用户界面(UI),包括使用Tkinter、PyQt、Kivy等库进行基本窗口、动态图表和动画效果的实现,通过示例代码,展示... 目录从像素到界面:python带你玩转UI设计示例:使用Tkinter创建一个简单的窗口绘图魔法:用

使用SpringBoot创建一个RESTful API的详细步骤

《使用SpringBoot创建一个RESTfulAPI的详细步骤》使用Java的SpringBoot创建RESTfulAPI可以满足多种开发场景,它提供了快速开发、易于配置、可扩展、可维护的优点,尤... 目录一、创建 Spring Boot 项目二、创建控制器类(Controller Class)三、运行

如何测试计算机的内存是否存在问题? 判断电脑内存故障的多种方法

《如何测试计算机的内存是否存在问题?判断电脑内存故障的多种方法》内存是电脑中非常重要的组件之一,如果内存出现故障,可能会导致电脑出现各种问题,如蓝屏、死机、程序崩溃等,如何判断内存是否出现故障呢?下... 如果你的电脑是崩溃、冻结还是不稳定,那么它的内存可能有问题。要进行检查,你可以使用Windows 11

Ubuntu 24.04 LTS怎么关闭 Ubuntu Pro 更新提示弹窗?

《Ubuntu24.04LTS怎么关闭UbuntuPro更新提示弹窗?》Ubuntu每次开机都会弹窗提示安全更新,设置里最多只能取消自动下载,自动更新,但无法做到直接让自动更新的弹窗不出现,... 如果你正在使用 Ubuntu 24.04 LTS,可能会注意到——在使用「软件更新器」或运行 APT 命令时,

最便宜的8口2.5G网管交换机! 水星SE109 Pro拆机测评

《最便宜的8口2.5G网管交换机!水星SE109Pro拆机测评》水星SE109Pro价格很便宜,水星SE109Pro,外观、接口,和SE109一样,区别Pro是网管型的,下面我们就来看看详细拆... 听说水星SE109 Pro开卖了,PDD卖 220元,于是买回来javascript拆机看看。推荐阅读:水

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

字节面试 | 如何测试RocketMQ、RocketMQ?

字节面试:RocketMQ是怎么测试的呢? 答: 首先保证消息的消费正确、设计逆向用例,在验证消息内容为空等情况时的消费正确性; 推送大批量MQ,通过Admin控制台查看MQ消费的情况,是否出现消费假死、TPS是否正常等等问题。(上述都是临场发挥,但是RocketMQ真正的测试点,还真的需要探讨) 01 先了解RocketMQ 作为测试也是要简单了解RocketMQ。简单来说,就是一个分

【测试】输入正确用户名和密码,点击登录没有响应的可能性原因

目录 一、前端问题 1. 界面交互问题 2. 输入数据校验问题 二、网络问题 1. 网络连接中断 2. 代理设置问题 三、后端问题 1. 服务器故障 2. 数据库问题 3. 权限问题: 四、其他问题 1. 缓存问题 2. 第三方服务问题 3. 配置问题 一、前端问题 1. 界面交互问题 登录按钮的点击事件未正确绑定,导致点击后无法触发登录操作。 页面可能存在

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测