互联网时代的文学复兴:中文诗词大数据分析 | 开源日报 No.170

本文主要是介绍互联网时代的文学复兴:中文诗词大数据分析 | 开源日报 No.170,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

picture

chinese-poetry/chinese-poetry

Stars: 45.4k License: MIT

picture

最全的中文诗歌古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。数据来源于互联网。该开源项目旨在通过 JSON 格式分发,方便用户开始自己的项目,并借助技术生成格式化 (JSON) 数据来构建诗词类应用程序。案例展示了一些基于该仓库创建的相关应用。

  • 数据集丰富
  • 古代中国各种经典作品齐全
  • 提供高频次分析图等功能
  • 开放给用户参与贡献

citra-emu/citra

Stars: 8.8k License: GPL-2.0

Citra 是世界上最受欢迎的开源任天堂 3DS 模拟器。该项目使用 C++ 编写,注重可移植性,并积极维护适用于 Windows、Linux、Android 和 macOS 的版本。

以下是 Citra 项目的关键特性和核心优势:

  • 兼容性:该模拟器能够以全速运行大多数商业游戏,前提是您满足必要的硬件需求。
  • 多平台支持:Citra 提供了针对不同操作系统 (Windows、Linux、Android 和 macOS) 的构建版本,方便用户在各种设备上体验游戏。
  • 持续更新与发展:团队定期发布新功能和进度报告,在 GitHub 上进行活跃地开发讨论,并通过 Discord 群组为贡献者们提供交流机会。
  • 易于安装和使用:可以从官网下载并安装 Nightly 或 Canary 版本;此外还有 Android 版本可在 Google Play 商店中获取。同时也提供 Flatpak 构建来简化部署过程。

e2b-dev/E2B

Stars: 5.6k License: Apache-2.0

这个项目是一个为 AI 应用程序和代理人提供的安全沙盒云环境,允许它们长时间运行。E2B Sandbox 可以连接到任何 LLM 和任何 AI 代理或应用程序,并且具有以下主要功能:

  • 可以使用与人类相同的工具
  • 具有云浏览器、GitHub 存储库和命令行界面等功能
  • 支持编码工具如代码检查、自动补全、“跳转至定义”
  • 能够运行由 LLM 生成的代码

该项目包含 Python SDK、JS SDK、CLI 以及文档等内容。

hemansnation/God-Level-Data-Science-ML-Full-Stack

Stars: 3.4k License: NOASSERTION

这个项目是一个数据科学和机器学习全栈的集合,包括了科学方法、流程、算法和系统来构建故事与模型。主要功能包括 Python 编程逻辑搭建、数据结构与算法以及 Git & GitHub 等内容。该项目的核心优势和特点有:

  • 包含 16 章节的路线图,涵盖从新手到经验专业人士转向数据科学与 AI 所需的知识;
  • 提供丰富资源库,并使用多种技术栈如 Python,NumPy,Pandas,Matplotlib 等工具进行实践;
  • 重点介绍了各阶段需要掌握的关键概念和技能,例如统计分析、机器学习算法应用以及自然语言处理等。

ricklamers/gpt-code-ui

Stars: 3.3k License: MIT

picture

这个项目是 OpenAI 的 ChatGPT 代码解释器的开源实现。用户可以简单地向 OpenAI 模型提出要求,它将为您生成并执行代码。该项目具有以下主要功能和核心优势:

  • 文件上传
  • 文件下载
  • 上下文感知 (可以参考先前的消息)
  • 生成代码
  • 运行代码 (Python 内核)
  • 模型切换 (GPT-3.5 和 GPT -4)

这篇关于互联网时代的文学复兴:中文诗词大数据分析 | 开源日报 No.170的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/713736

相关文章

WiFi6时代来临! 华三H3C NX54路由器还值得购买吗?

《WiFi6时代来临!华三H3CNX54路由器还值得购买吗?》WiFi6时代已经来临,众多路由器厂商也纷纷推出了兼容WiFi6协议的路由器,今天我们将深入体验H3CNX54路由器,这款由知名企业... 随着科技的发展,WiFi6逐渐走进了我们的日常生活之中,相比WiFi5来说,WiFi6拥有更高的带宽、更高

一文教你解决Python不支持中文路径的问题

《一文教你解决Python不支持中文路径的问题》Python是一种广泛使用的高级编程语言,然而在处理包含中文字符的文件路径时,Python有时会表现出一些不友好的行为,下面小编就来为大家介绍一下具体的... 目录问题背景解决方案1. 设置正确的文件编码2. 使用pathlib模块3. 转换路径为Unicod

无需邀请码!Manus复刻开源版OpenManus下载安装与体验

《无需邀请码!Manus复刻开源版OpenManus下载安装与体验》Manus的完美复刻开源版OpenManus安装与体验,无需邀请码,手把手教你如何在本地安装与配置Manus的开源版OpenManu... Manus是什么?Manus 是 Monica 团队推出的全球首款通用型 AI Agent。Man

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图

Java下载文件中文文件名乱码的解决方案(文件名包含很多%)

《Java下载文件中文文件名乱码的解决方案(文件名包含很多%)》Java下载文件时,文件名中文乱码问题通常是由于编码不正确导致的,使用`URLEncoder.encode(filepath,UTF-8... 目录Java下载文件中文文件名乱码问题一般情况下,大家都是这样为了解决这个问题最终解决总结Java下

Go语言实现将中文转化为拼音功能

《Go语言实现将中文转化为拼音功能》这篇文章主要为大家详细介绍了Go语言中如何实现将中文转化为拼音功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 有这么一个需求:新用户入职 创建一系列账号比较麻烦,打算通过接口传入姓名进行初始化。想把姓名转化成拼音。因为有些账号即需要中文也需要英

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

安全管理体系化的智慧油站开源了。

AI视频监控平台简介 AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作,就可以实现全视频的接入及布控。摄像头管理模块用于多种终端设备、智能设备的接入及管理。平台支持包括摄像头等终端感知设备接入,为整个平台提