Transformers和Langchain中几个组件的区别

2024-06-24 09:44

本文主要是介绍Transformers和Langchain中几个组件的区别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.对于Transformers框架的介绍

1.1 介绍: transformers 是由 Hugging Face 开发的一个开源库,它提供了大量预训练模型,主要用于自然语言处理(NLP)任务。这个库提供的模型可以用于文本分类、信息抽取、问答、文本生成等多种任务。

1.2 应用场景:

  1. 文本分类:使用 BERT、RoBERTa 等模型进行情感分析、意图识别等。
  2. 命名实体识别(NER):使用序列标注模型来识别文本中的具体实体(如人名、地点、组织名)。
  3. 机器翻译:使用像 T5 或 Marian NMT 这样的序列到序列的模型进行语言之间的翻译。
  4. 文本摘要:使用 GPT、BART 等模型生成文章的摘要。
  5. 问答系统:使用预训练的问答模型直接从文本中提取答案或使用知识库支持的问答。
  6. 文本生成:使用 GPT 系列模型进行文章生成、对话生成或任何其他形式的文本自动完成。

2.Langchain的介绍

2.1 介绍: Langchain 是一个高级库,用于构建语言理解应用。它主要关注于结合语言模型和其他技术(如搜索引擎、数据库)来构建复杂的语言理解系统。

2.2 应用场景:

  1. 聊天机器人:构建能够理解和生成人类语言的对话系统。
  2. 信息检索与问答系统:通过整合语言模型生成能力和文档搜索,创建能回答复杂问题的系统。【本质就是RAG】
  3. 内容创建和摘要:结合搜索和生成技术自动创建内容或摘要。
  4. 多模态任务:结合文本和其他数据源(如数据库)来执行任务。

3.二者区别

3.1 主要方向: Transformers主要提供的是对于模型的底层访问和操作,因此我们可以利用Transformers用于模型训练、评估与推理进而微调各种NLP模型。对比之下,Langchain提供的是更加高级的接口,符合应用系统中。

3.2 几个组件的区别:
3.2.1 Langchain:

from langchain_openai import ChatOpenAI, OpenAI
from langchain_community.vectorstores import DocArrayInMemorySearch
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnableParallel, RunnablePassthrough
from langchain_openai import OpenAIEmbeddings# 1.这行代码创建了一个 ChatOpenAI 的实例,使用的是 GPT-3.5 模型。
model = OpenAI(model="gpt-3.5-turbo-instruct")# 2.创建了一个【文档向量存储】(vectorstore),使用 【DocArrayInMemorySearch】 类从提供的文本列表中创建,
# 【向量的嵌入】使用了 OpenAIEmbeddings()
text = ["Fairy是一个英俊无比的男生,即便他身高不高但依旧有很多女生追他"
]
vectorstore = DocArrayInMemorySearch.from_texts(text,embedding=OpenAIEmbeddings(),
)

模型 (OpenAI):这通常指的是使用OpenAI提供的API来访问像GPT-3这样的强大模型,用于生成文本或处理语言任务。
嵌入 (OpenAIEmbeddings):用于生成文本的嵌入向量,这些向量可以用于文档相似度搜索或其他检索任务。这与 AutoModelForCausalLM 的用途不同,后者主要用于生成文本,而不是生成用于文档相似度计算的嵌入。

3.2.2 Transformers 中的模型和分词器:

MODEL_PATH = os.environ.get('MODEL_PATH', '/mnt/workspace/models/chatglm3-6b')
TOKENIZER_PATH = os.environ.get("TOKENIZER_PATH", MODEL_PATH)
tokenizer = AutoTokenizer.from_pretrained(TOKENIZER_PATH)
model = AutoModelForCausalLM.from_pretrained(MODEL_PATH).to(device).eval()  # 使用适合的模型类

作用:AutoModelForCausalLM 是一个专为因果语言建模设计的模型,通常用于文本生成任务。它的输出是 logits,即预测每个可能的下一个词的分数。而分词器 (AutoTokenizer)用于将原始文本转换成模型可以理解的格式(如token IDs)。这是处理任何NLP任务的标准步骤。【主要用于文本生成或特征提取】

这篇关于Transformers和Langchain中几个组件的区别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1089794

相关文章

JS常用组件收集

收集了一些平时遇到的前端比较优秀的组件,方便以后开发的时候查找!!! 函数工具: Lodash 页面固定: stickUp、jQuery.Pin 轮播: unslider、swiper 开关: switch 复选框: icheck 气泡: grumble 隐藏元素: Headroom

每天认识几个maven依赖(ActiveMQ+activemq-jaxb+activesoap+activespace+adarwin)

八、ActiveMQ 1、是什么? ActiveMQ 是一个开源的消息中间件(Message Broker),由 Apache 软件基金会开发和维护。它实现了 Java 消息服务(Java Message Service, JMS)规范,并支持多种消息传递协议,包括 AMQP、MQTT 和 OpenWire 等。 2、有什么用? 可靠性:ActiveMQ 提供了消息持久性和事务支持,确保消

如何在页面调用utility bar并传递参数至lwc组件

1.在app的utility item中添加lwc组件: 2.调用utility bar api的方式有两种: 方法一,通过lwc调用: import {LightningElement,api ,wire } from 'lwc';import { publish, MessageContext } from 'lightning/messageService';import Ca

uva 10061 How many zero's and how many digits ?(不同进制阶乘末尾几个0)+poj 1401

题意是求在base进制下的 n!的结果有几位数,末尾有几个0。 想起刚开始的时候做的一道10进制下的n阶乘末尾有几个零,以及之前有做过的一道n阶乘的位数。 当时都是在10进制下的。 10进制下的做法是: 1. n阶位数:直接 lg(n!)就是得数的位数。 2. n阶末尾0的个数:由于2 * 5 将会在得数中以0的形式存在,所以计算2或者计算5,由于因子中出现5必然出现2,所以直接一

native和static native区别

本文基于Hello JNI  如有疑惑,请看之前几篇文章。 native 与 static native java中 public native String helloJni();public native static String helloJniStatic();1212 JNI中 JNIEXPORT jstring JNICALL Java_com_test_g

Android fill_parent、match_parent、wrap_content三者的作用及区别

这三个属性都是用来适应视图的水平或者垂直大小,以视图的内容或尺寸为基础的布局,比精确的指定视图的范围更加方便。 1、fill_parent 设置一个视图的布局为fill_parent将强制性的使视图扩展至它父元素的大小 2、match_parent 和fill_parent一样,从字面上的意思match_parent更贴切一些,于是从2.2开始,两个属性都可以使用,但2.3版本以后的建议使

Collection List Set Map的区别和联系

Collection List Set Map的区别和联系 这些都代表了Java中的集合,这里主要从其元素是否有序,是否可重复来进行区别记忆,以便恰当地使用,当然还存在同步方面的差异,见上一篇相关文章。 有序否 允许元素重复否 Collection 否 是 List 是 是 Set AbstractSet 否

vue2 组件通信

props + emits props:用于接收父组件传递给子组件的数据。可以定义期望从父组件接收的数据结构和类型。‘子组件不可更改该数据’emits:用于定义组件可以向父组件发出的事件。这允许父组件监听子组件的事件并作出响应。(比如数据更新) props检查属性 属性名类型描述默认值typeFunction指定 prop 应该是什么类型,如 String, Number, Boolean,

javascript中break与continue的区别

在javascript中,break是结束整个循环,break下面的语句不再执行了 for(let i=1;i<=5;i++){if(i===3){break}document.write(i) } 上面的代码中,当i=1时,执行打印输出语句,当i=2时,执行打印输出语句,当i=3时,遇到break了,整个循环就结束了。 执行结果是12 continue语句是停止当前循环,返回从头开始。

kubelet组件的启动流程源码分析

概述 摘要: 本文将总结kubelet的作用以及原理,在有一定基础认识的前提下,通过阅读kubelet源码,对kubelet组件的启动流程进行分析。 正文 kubelet的作用 这里对kubelet的作用做一个简单总结。 节点管理 节点的注册 节点状态更新 容器管理(pod生命周期管理) 监听apiserver的容器事件 容器的创建、删除(CRI) 容器的网络的创建与删除