Transformer：开源机器学习项目，上千种预训练模型 | 开源日报 No.66

2023-11-07 09:15

文章标签 学习训练项目模型机器 transformer 开源日报千种 no.66

本文主要是介绍Transformer：开源机器学习项目，上千种预训练模型 | 开源日报 No.66，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

huggingface/transformers

Stars: 113.5k License: Apache-2.0

这个项目是一个名为 Transformers 的开源机器学习项目，它提供了数千种预训练模型，用于在文本、视觉和音频等不同领域执行任务。该项目主要功能包括：

文本处理：支持超过 100 种语言的文本分类、信息抽取、问答、摘要生成和翻译等任务。
图像处理：支持图像分类、目标检测和分割等任务。
音频处理：支持语音识别和音频分类等任务。

此外，Transformer 模型还可以对多个领域进行联合操作，例如表格问答、光学字符识别以及从扫描文件中提取信息等。该项目具有以下关键特点和核心优势：

提供 API 快速下载并使用预训练模型，可根据自己的数据集进行微调，并与社区共享。
支持 Jax，PyTorch 和 TensorFlow 三大流行深度学习库之间无缝集成，在加载推理前轻松地训练您的模型。

microsoft/TypeScript

Stars: 94.8k License: Apache-2.0

TypeScript 是一种用于应用规模 JavaScript 的语言。它为 JavaScript 添加了可选类型，支持大型 JavaScript 应用程序的工具，在任何浏览器、任何主机和任何操作系统上都可以使用。TypeScript 编译成易读且符合标准的 JavaScript 代码。

kubernetes/autoscaler

Stars: 7.1k License: Apache-2.0

这个项目是 Kubernetes Autoscaler，它包含了用于自动扩展的组件。
主要功能有：

Cluster Autoscaler：根据需要调整 Kubernetes 集群的大小，以确保所有 pod 有运行空间且没有不必要的节点。支持多个公共云提供商。
Vertical Pod Autoscaler：一套组件，可以自动调整在 Kubernetes 集群中运行的 pod 所请求的 CPU 和内存数量。当前状态为 beta 版本。
Addon Resizer：Vertical Pod Autoscaler 的简化版本，在基于 Kubernetes 集群中节点数目来修改 deployment 的资源需求量。当前状态为 beta 版本。

oceanbase/oceanbase

Stars: 6.3k License: NOASSERTION

OceanBase Database 是一个分布式关系型数据库，完全由蚂蚁集团开发。它构建在通用的服务器集群上，并基于 Paxos 协议和其分布式结构，提供高可用性和线性扩展性。OceanBase Database 不依赖特定的硬件架构。

透明伸缩性：可以将 OceanBase 集群无缝地扩展到 1500 个节点，处理 PB 级数据和万亿行记录。
超快速度：唯一刷新了 TPC-C 纪录 (707 百万 tmpC) 以及 TPC-H 纪录 (1526 万 QphH @30000GB) 的分布式数据库。
实时运营分析：统一系统支持事务处理与实时运营分析工作负载。
持续可用性：采用 Paxos 共识算法实现零 RPO 且低于8秒 RTO；支持城际/远程灾难恢复，在多个位置进行多活动并避免数据丢失
兼容 MySQL：高度兼容 MySQL，迁移过程中几乎没有或者只需要少量修改。
成本效益：前沿压缩技术节省 70%-90% 存储成本而不影响业务表现。多租户体系结构能够更好利用资源。

uBlockOrigin/uAssets

Stars: 2.9k License: GPL-3.0

uAssets 是用于 uBlock Origin (uBO) 资源的存储库。它接收有关新过滤器或导致网页破坏的现有过滤器的所有报告，并欢迎任何贡献者。

stas00/ml-engineering

Stars: 1.0k License: CC-BY-SA-4.0

这个项目是一个开放的方法论集合，旨在帮助成功训练大型语言模型和多模态模型。

提供了调试软件和硬件故障、容错性、性能优化等方面的指导
支持多节点网络通信和模型并行计算
包含有关张量精度/数据类型、训练超参数和初始化以及可重现性等内容的信息

这篇关于Transformer：开源机器学习项目，上千种预训练模型 | 开源日报 No.66的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/362636。 23002807@qq.com

相关文章

Node.js 数据库 CRUD 项目示例详解(完美解决方案)

Node.js 数据库 CRUD 项目示例详解(完美解决方案)

《Node.js数据库CRUD项目示例详解(完美解决方案)》：本文主要介绍Node.js数据库CRUD项目示例详解(完美解决方案),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考... 目录项目结构1. 初始化项目2. 配置数据库连接 (config/db.js)3. 创建模型 (models/

阅读更多...

springboot项目中常用的工具类和api详解

springboot项目中常用的工具类和api详解

《springboot项目中常用的工具类和api详解》在SpringBoot项目中,开发者通常会依赖一些工具类和API来简化开发、提高效率,以下是一些常用的工具类及其典型应用场景,涵盖Spring原生... 目录1. Spring Framework 自带工具类(1) StringUtils(2) Coll

阅读更多...

Python Transformer 库安装配置及使用方法

Python Transformer 库安装配置及使用方法

《PythonTransformer库安装配置及使用方法》HuggingFaceTransformers是自然语言处理（NLP）领域最流行的开源库之一,支持基于Transformer架构的预训练模... 目录python 中的 Transformer 库及使用方法一、库的概述二、安装与配置三、基础使用：Pi

阅读更多...

Spring Boot项目部署命令java -jar的各种参数及作用详解

Spring Boot项目部署命令java -jar的各种参数及作用详解

《SpringBoot项目部署命令java-jar的各种参数及作用详解》：本文主要介绍SpringBoot项目部署命令java-jar的各种参数及作用的相关资料,包括设置内存大小、垃圾回收... 目录前言一、基础命令结构二、常见的 Java 命令参数1. 设置内存大小2. 配置垃圾回收器3. 配置线程栈大小

阅读更多...

Spring Boot项目中结合MyBatis实现MySQL的自动主从切换功能

Spring Boot项目中结合MyBatis实现MySQL的自动主从切换功能

《SpringBoot项目中结合MyBatis实现MySQL的自动主从切换功能》：本文主要介绍SpringBoot项目中结合MyBatis实现MySQL的自动主从切换功能,本文分步骤给大家介绍的... 目录原理解析1. mysql主从复制（Master-Slave Replication）2. 读写分离3.

阅读更多...

Spring Security基于数据库的ABAC属性权限模型实战开发教程

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》：本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

阅读更多...

Java的IO模型、Netty原理解析

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容：标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO（blocking I/O）NI

阅读更多...

一文教你如何将maven项目转成web项目

一文教你如何将maven项目转成web项目

《一文教你如何将maven项目转成web项目》在软件开发过程中,有时我们需要将一个普通的Maven项目转换为Web项目,以便能够部署到Web容器中运行,本文将详细介绍如何通过简单的步骤完成这一转换过程... 目录准备工作步骤一：修改pom.XML1.1 添加packaging标签1.2 添加

阅读更多...

tomcat多实例部署的项目实践

tomcat多实例部署的项目实践

《tomcat多实例部署的项目实践》Tomcat多实例是指在一台设备上运行多个Tomcat服务,这些Tomcat相互独立,本文主要介绍了tomcat多实例部署的项目实践,具有一定的参考价值,感兴趣的可... 目录1.创建项目目录，测试文China编程件2js.创建实例的安装目录3.准备实例的配置文件4.编辑实例的

阅读更多...

基于Flask框架添加多个AI模型的API并进行交互

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》：本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

阅读更多...