以人为本的AI技术升级

2024-03-07 10:44

本文主要是介绍以人为本的AI技术升级,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 我们需要以人为本的技术来提高生产力和投资回报率。
  • 通过在数据标注流程中融合机器学习辅助技术,可以减少数据标注所需的时间、资金和人力。
  • 有很多方法可以防止标注员被模型的预测误导。

  在传统的机器学习(Machine Learning)方法下,人工负责标注模型所需的每一行数据。这个任务通常很耗时而且成本高昂,因为成功的人工智能(AI)模型需要数千甚至数百万个准确标注的训练数据。 随着我们不断改进人工智能的构建方法,我们不得不思考如何改进数据标注中的高密度人工作业情况。 现在,澳鹏拥有诸多最先进的预标注模型,用来改善人工智能部署的流程。例如,我们已经开发使用了用于自动驾驶像素级标注、用于图像和文档转录、用于音频分割的预标注模型,以及其他几个预标注或分类模型。在我们不断迭代工具的过程中,我们发现以人为本的技术改进既可以提高生产力,又能实现更大的投资回报率。这种“以人为本的技术”充分考虑操作员的技能、知识、灵活性以及创造力,将其作为一种资产加入了整个人工智能构建流程。 在构建“以人为本的技术”时,我们的目标有两方面:一方面是在保证数据质量的情况下优化标注流程,另一方面是减少重复性的无意义操作,来减轻标注员的负担。 在进行视频标注时,通常需要对视频的各个帧单独进行标注,而每一帧中标注内容的变化非常小;例如,一段很多汽车进行路面行驶的视频包含很多帧,而每一帧中不同车辆的位置变化很小;如果需要对每一帧的每一辆车进行纯手工标注,会非常消耗时间和精力。通过机器学习辅助技术,我们可以对每一帧进行自动预标注,标注员只需要进行关键帧的调整,就可以完成原本无意义重复的标注工作。在这之中,机器学习辅助工具必不可少。 在减轻标注员工作繁复性之外,机器学习辅助工具还可以帮助实现数据标注的质检和交付的自动化。在澳鹏,我们将其称为“智能标注”。智能标注的辅助功能可以在标注前、标注中和标注后,帮助人工标注员提高工作效率和保证标注质量。  

接触点一:标注开始之前

在开始标注作业之前,可以利用平台内置的模型进行预标注,提供一个基础模板。与纯手动标注过程不同,标注员只需检查预测的准确性,而无需从头开始进行标注。例如,如果想标注道路上的汽车,就可以使用我们提供的模型进行预分类和标注。 各种模型可以完成特定任务,应用于不同的标注需求:从审查色情内容,到掩盖个人详细信息,再到在对象周围添加边界框。使用现有模型提供初始数据标注,可以通过自动化部分标注过程来节省时间和成本。其准确性将取决于所选的模型或模型组合。 但您可能会问,如何防止标注员被模型的预测偏见所误导? 事实上,我们通过对几个标注项目进行大规模 A/B 测试进行了检验,结果发现:预标注数据提高了标注质量。换言之,与没有进行初始标注的数据相比,在移交给标注员进行最终标注之前由机器学习模型完成初始标注的数据产生的标注质量更高。 在自动驾驶汽车的一个图像像素标注项目中,使用机器学习模型进行初始标注后,我们所有试验的标注员生产力提高了91.5%,标注质量提高了10%。 如果您的团队仍然担心偏见误导,在生产线的后续两个阶段还有进一步的调整机会。  

接触点二:标注期间

开始标注作业后,可以利用机器学习模型来辅助人工评判。例如,如果作业包括视频标注,则手动过程可能是这样的:首先将视频分成逐帧序列,再由标注员在每一帧中标注每个目标对象。 根据每秒 24 帧的标准帧速率,这项标注任务很快就会变成一项艰辛的重复作业。使用机器学习辅助技术,标注员只需标注一次目标对象,模型就可以跟踪并预测其在后续帧中的位置。以标注道路上的汽车为例,标注员只需在第一帧中标注每辆车,模型就将跟踪其位置并在其余帧中标注这些汽车。然后,标注员只需对其余帧进行审查,根据需要进行更正即可。 在标注作业期间借助机器学习辅助技术,标注员可以提高工作速度和准确性。在不牺牲质量的情况下,使用这种方法最高可以将标注速度提升至手动操作的 100 倍。这种方法的好处还会延伸到标注员身上,它可以减轻认知压力,使标注员在整个任务期间感觉更轻松自在。  

最终接触点:标注完成后

在模型和标注员对数据做出评判之后,即可进入验证阶段。在此阶段,可以使用机器学习模型来验证所做的评判,并在标注员的输入未达到预期质量阈值范围时对标注员做出提醒。 这种方法有几个显著的好处。最显著的好处是,它可以减轻对测试或同行评审的需求,并且降低客户付费进行数据评判,最终却达不到质量要求的风险。在模型验证之后,标注员即可提交作业。

我们不仅需要投资 AI 解决方案,还需要投资 AI 支持流程的相关改进。 —Wilson Pang

假设有一个文本语音项目,就可以使用机器学习辅助的验证工具,并结合设置连贯性或语种等指标。模型将标记出任何不符合这些指标准确性要求的数据标注,然后由人工标注员检查并更正标注。澳鹏在一个涉及聊天机器人训练的文本语音项目中测试了机器学习辅助验证工具。我们发现使用实时模型后,错误率降低了35%。

“这不仅仅可以推进  AI ,还可以改进  AI  流程”

通过以人为本的技术将机器学习与人的操作结合起来,是 AI 创新的前进方向。 数据标注生产线中的机器学习辅助功能对企业和标注员都有帮助:企业可以花费更少的资源更快地推出高质量 AI 解决方案,而标注员可以减少工作的压力和重复性。后者对于为所有从事 AI 项目的个人提升 AI 实践的公平性尤为重要。 我们不仅需要在 AI 解决方案上投入资金,也需要投资于改进 AI 支持的流程。只有这样,才可以改进我们的 AI 伦理方法,并提升使用机器驱动型解决方案来解决全球问题的能力。 AI 并不意味着完全依赖于机器或人;相反,将二者充分结合可以增强彼此的优势并促进成功部署。

这篇关于以人为本的AI技术升级的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/783243

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close