AI新工具(20240210) Osam - Osam是一个启用本地运行的开源llm；Whishper

本文主要是介绍AI新工具(20240210) Osam - Osam是一个启用本地运行的开源llm；Whishper - Whishper是一个开源的语音工具，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Osam - Osam是一个启用本地运行的开源“一切分割”模型工具，支持多种接口和自定义视觉模型。

Osam是一个开源工具，它允许本地运行“可对任何内容进行分割”的模型(Segment-Anything Models)，灵感来源于Ollama。使用Osam，用户可以在本地环境中，而不是依赖于云服务，对图片进行内容分割。这种方法有助于保护数据隐私，同时也减少了因网络延迟可能产生的处理时间。

https://github.com/wkentaro/osam

Whishper - Whishper是一个开源的、100%本地化的音频转录和字幕制作套件，具备完整的网络界面。

Whishper是一个开源的本地音频转写和字幕套件，具备完整的网页用户界面（UI）。它可以将任何媒体（如音频、视频等）通过URL或者上传文件的方式转化为文字，并支持多种格式（TXT，JSON，VTT，SRT）的下载，用户还可以直接复制原始文本到剪贴板。Whishper还具备强大的字幕编辑器，让用户可以在同一界面进行翻译、编辑和调整字幕。

https://github.com/pluja/whishper

Edgen - Edgen是一个本地GenAI API服务器，为本地GenAI提供OpenAI API的替代，支持文本生成、语音转文本等功能，并能在Windows、Linux和MacOS上免费、保护数据隐私地运行。

Edgen是一个本地化的、针对个体设备的通用人工智能（GenAI）API服务器，它可以作为OpenAI API的直接替代品。Edgen的主要特点是它允许在用户的设备上本地运行，确保了数据隐私的同时，无需外部云计算资源，减少了对网络的依赖，同时提高了可扩展性和可靠性。

使用Edgen，开发者可以在多个平台（包括Windows、Linux和macOS）上利用各种AI模型（如文本生成、语音识别等）为他们的应用提供强大的AI功能。Edgen支持多种AI模型和端点，比如LLMs(大型语言模型)、Speech-to-text（Whisper）等，并且具有模型和运行时的模块化和优化特性。

https://github.com/edgenai/edgen