ai人工智能面相测试_确定在AI原型中要测试的内容

2023-10-08 11:20

本文主要是介绍ai人工智能面相测试_确定在AI原型中要测试的内容,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ai人工智能面相测试

Deciding what to test is the first, and most important, step in defining an AI prototype. This decision shapes all other decisions in designing the prototype.

确定要测试的内容是定义AI原型的第一步,也是最重要的一步。 该决策将影响设计原型时的所有其他决策。

Defining the hypothesis under test is important because prototypes are messy. And messy experiments give muddled results; hiding the relevant amongst the incidental.

定义被测假设很重要,因为原型很乱。 混乱的实验给出了混乱的结果。 将相关的东西隐藏起来。

Prototypes are broad brush-stroked approximations of the final product. The learnings from a prototype can be game-changing, intriguing, and wholly surprising. But to learn from a prototype with confidence, the effect or insight will need to be large.

原型是最终产品的大致笔触近似值。 从原型中学到的知识可以改变游戏规则,吸引人,并且完全令人惊讶。 但是,要有信心从原型中学习,效果或洞察力将需要很大。

It is very easy to take a finding from a prototype and generalise it, only to later find that the learning was tied directly to some imperfection in the prototype itself. Minor differences between the prototype and end-product can and do impact the learnings. Details such as how fast an element loads, or being constrained to a few user journeys have a very real effect on how the user responds.

从原型中得出发现并进行概括非常容易,后来才发现学习与原型本身的某些缺陷直接相关。 原型和最终产品之间的细微差异可以而且确实会影响学习。 诸如元素加载的速度或受限于几次用户旅程之类的细节对用户的响应方式具有非常真实的影响。

With prototypes, we’re looking for big effects. Things that are obvious once our attention is drawn to them. Not optimisations. For optimisations, do this later in the design process and consider A/B or multi-variate testing on large user groups.

借助原型,我们正在寻找更大的效果。 一旦吸引我们注意,这些事情就显而易见了。 没有优化。 为了进行优化,请在设计过程的后期进行此操作,并考虑对大型用户组进行A / B或多变量测试。

With many elements under test, the feedback will be noisy. It is difficult to untangle the causes and effects of what our users tell and show us.

在测试许多元素的情况下,反馈会很嘈杂。 很难弄清用户告诉我们并告诉我们的原因和结果。

The types of things we might want to test include:

我们可能要测试的事物类型包括:

The technical details

技术细节

  • The performance of the model.

    模型的性能。
  • The speed of delivering the model results.

    交付模型结果的速度。
  • The rate of feedback from a model and whether a user can visibly ‘teach’ the system.

    来自模型的反馈率以及用户是否可以可视地“教”系统。

The interface

介面

  • How interactive is the AI feature.

    AI功能的互动性。
  • Are there separate elements for the AI feature; how are these delineated from the rest of the system.

    AI功能是否有单独的元素? 这些与系统其余部分的区别

The messaging

消息传递

  • Explaining the AI algorithm; what it does and how it learns.

    解释AI算法; 它做什么以及如何学习。
  • Teaching the user how to make the product learn.

    教用户如何使产品学习。
  • How numeric the model results are; how numerate is the user expected to be.

    模型结果的数值如何; 用户期望的数字。
  • Whether and how we communicate error messages.

    我们是否以及如何传达错误消息。

Error correction

纠错

  • How to put fail-safes in place in case of error.

    发生错误时如何设置故障保护。
  • How to determine if the model has broken down.

    如何确定模型是否已损坏。
  • What we do when the model breaks down.

    模型崩溃时我们该怎么做。
  • How to recover from catastrophic error.

    如何从灾难性错误中恢复。
Image for post
simonoregan.com simonoregan.com测试AI原型

Separating these tests is important. For testing the user impact of technical details it is best to have arrived at a finalised design for the interface, messaging and error communication.

分开这些测试很重要。 为了测试用户对技术细节的影响,最好确定接口,消息传递和错误通信的最终设计。

Messaging is closely tied to the interface and error-handling and often won’t be tested alone. Instead, the interface and messaging or the error-handling and messaging will be tested in pairs.

消息传递与接口和错误处理紧密相关,通常不会单独进行测试。 相反,将成对测试接口和消息传递或错误处理和消息传递。

The important thing to bear in mind is that we don’t want to be rapidly swapping these permutations in the hope that we’ll observe fine differences in user responses to help us determine the optimal combination. With small user groups the results will certainly not be statistically significant, nor usually generalisable and relevant.

要记住的重要一点是,我们不想Swift交换这些排列,希望我们会观察到用户响应中的细微差别以帮助我们确定最佳组合。 对于较小的用户组,结果肯定不会具有统计意义,也通常不会具有概括性和相关性。

Instead, choose a configuration with clearly defined upfront assumptions and observe whether the user behaves as expected, and if not, why not.

相反,请选择具有明确定义的前期假设的配置,并观察用户的行为是否符合预期,如果不是,则为什么。

谢谢您阅读🙏🏻 (Thank you for Reading 🙏🏻)

This was originally published on simonoregan.com.

它最初在simonoregan.com上发布 。

If you enjoyed this, you might like The Deployment Age — a weekly update of tools and musings that shine some light on the emerging technologies and trends of the 2020s.

如果喜欢这个,您可能会喜欢“部署时代” -每周更新工具和思路的最新信息,以期了解2020年代的新兴技术和趋势。

翻译自: https://towardsdatascience.com/deciding-what-to-test-in-ai-prototypes-f3988acad62c

ai人工智能面相测试


http://www.taodudu.cc/news/show-7889723.html

相关文章:

  • ai人工智能面相测试_有趣的IQ测试以衡量AI的智能
  • ai人工智能面相测试_全球AI更改笔测试游戏
  • ai人工智能测面相 准吗_AI会对电动蠕变尖叫吗?
  • ai人工智能测面相 准吗_AI中有黑人吗?
  • ai人工智能测面相 准吗_AI会进入法庭吗?
  • 2023年大数据面试通关文牒系列篇
  • CTF—WEB基础篇
  • Scheme详解( web页面判断是否安装某app,并判断是否打开该应用)
  • 初学JAVA项目(二、打砖块)
  • nanodet阅读:(1)概述
  • 软件设计模式与设计原则概述
  • 设计模式概述总览
  • 距离度量概述
  • 前端 概述
  • Android项目开发常用工具类SquareImageView
  • PDF文件太大,如何在线批量压缩
  • 5大手机巨头齐喑:三星再次觊觎中国范本
  • 叉积的证明_向量积分配律的证明
  • 用计算机计算48*13 52*13,(125+60)×8 43×52+43×48用乘法分配律计算
  • 用乘法分配律计算机,4-巧用乘法分配律的几种类型.doc
  • 概率论与数量统计(二)2___随机事件与概率___分配律_对偶律
  • Android手机屏幕到手机间的距离
  • 系统篇:ubuntu 22.04 iptables 运行失败解决方法
  • 【LangChain】自定义chain
  • 【python】itertools.chain类解析
  • 作为前端,工作中处理过什么复杂的需求?
  • 什么才是IT人最有效的学习模式
  • 视频号这么玩一个月内轻松赚到1000+?
  • 推荐一个最全前端学习路线图,请收藏
  • 招股书出错的安能物流:有股东提前退出,1名基石能否顶住局面?
  • 这篇关于ai人工智能面相测试_确定在AI原型中要测试的内容的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



    http://www.chinasem.cn/article/164911

    相关文章

    SpringBoot中整合RabbitMQ(测试+部署上线最新完整)的过程

    《SpringBoot中整合RabbitMQ(测试+部署上线最新完整)的过程》本文详细介绍了如何在虚拟机和宝塔面板中安装RabbitMQ,并使用Java代码实现消息的发送和接收,通过异步通讯,可以优化... 目录一、RabbitMQ安装二、启动RabbitMQ三、javascript编写Java代码1、引入

    Nginx设置连接超时并进行测试的方法步骤

    《Nginx设置连接超时并进行测试的方法步骤》在高并发场景下,如果客户端与服务器的连接长时间未响应,会占用大量的系统资源,影响其他正常请求的处理效率,为了解决这个问题,可以通过设置Nginx的连接... 目录设置连接超时目的操作步骤测试连接超时测试方法:总结:设置连接超时目的设置客户端与服务器之间的连接

    Spring AI集成DeepSeek的详细步骤

    《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

    如何解决Pycharm编辑内容时有光标的问题

    《如何解决Pycharm编辑内容时有光标的问题》文章介绍了如何在PyCharm中配置VimEmulator插件,包括检查插件是否已安装、下载插件以及安装IdeaVim插件的步骤... 目录Pycharm编辑内容时有光标1.如果Vim Emulator前面有对勾2.www.chinasem.cn如果tools工

    Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

    《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

    Spring AI Alibaba接入大模型时的依赖问题小结

    《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

    SpringBoot整合DeepSeek实现AI对话功能

    《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

    C#比较两个List集合内容是否相同的几种方法

    《C#比较两个List集合内容是否相同的几种方法》本文详细介绍了在C#中比较两个List集合内容是否相同的方法,包括非自定义类和自定义类的元素比较,对于非自定义类,可以使用SequenceEqual、... 目录 一、非自定义类的元素比较1. 使用 SequenceEqual 方法(顺序和内容都相等)2.

    在Rust中要用Struct和Enum组织数据的原因解析

    《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

    PyCharm接入DeepSeek实现AI编程的操作流程

    《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言