本文主要是介绍Cyber Weekly #3,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
赛博·新闻
1、Meta发布最强开源模型Llama3[1]
4月19日凌晨,Meta Llama 3发布,模型包含8B和70B两种参数规模(400B还在训练中),Llama 3使用了超过 15T token的训练数据,8B版本数据更新截止至2023年3月,70B版本则更新至同年12月,但只支持8k的上下文。同时正式发布Meta AI[2],并搭载在多款Meta产品中(Instagram、WhatsApp、Messenger 和 Facebook)。Llama 3 很快将在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 上推出,并得到 AMD、AWS、Dell、Intel、NVIDIA 和 Qualcomm 提供的硬件平台的支持。。
2、AI画图应用Ideogram发布模型更新[3]
Ideogram 发布了一大波更新,模型能力再次增强,平时做海报和普通图片挺好用的。
主要升级内容有:
- 增强的文字渲染和照片写实效果:减少了15%的文字错误率,大幅提高了图像的连贯性与逼真度。
- Describe功能:一个将图像转化为详细描述的提示词助手。
- 渲染质量和速度控制:快速、默认和质量。快速模式优先考虑速度,大约在 5 秒内生成图像。另一方面,质量模式优先考虑更细节的内容,大约在 20 秒内生成图像。
- 负向提示词:告诉模型不想在输出图像中看到什么,可以使用此功能删除特定对象,甚至改善图像的风格。
3、X AI 公布了 Gork 1.5V 多模态 LLM[4]
X AI 正式发布了 Grok-1.5 V 多模态模型。为了测评对真实世界的理解他们还推出了一个专门的测试集RealWorldQA,该基准旨在评估多模态模型的基本真实世界空间理解能力,数据集是开源的。在RealWorldQA这个数据集X AI 比GPT-4V和Claude3都强。
4、Cohere 发布专门为RAG设计的基础模型 Rerank 3[5]
企业数据通常很复杂,当前的系统很难搜索多方面和半结构化的数据源。公司中最有用的数据通常不是简单的文档格式,半结构化数据格式(例如 JSON)在企业应用程序中很常见。 Rerank 3 能够根据所有相关元数据字段对复杂、多方面的数据(例如电子邮件)进行排名。
5、百度召开AI开发者大会[6]
4月16日,Create 2024 百度 AI 开发者大会在深圳召开,李彦宏发表了《人人都是开发者》的主题演讲,描述了一个不再局限于编码技能的世界,而是以自然语言为媒介,人人都能参与创造的时代。李彦宏发布了三大开发工具:AgentBuilder、AppBuilder和ModelBuilder。
- AgentBuilder:智能体开发工具,可以创建和部署智能体到各种场景。
- AppBuilder:AI原生应用开发工具,通过自然语言快速开发AI应用。
- ModelBuilder:模型定制工具,允许开发者根据需求定制和精调模型。
赛博·工具
1、Reader:jina开源的网页内容爬取工具[7]
将网络信息灌输到大语言模型(LLM)中是实现信息实体化的关键步骤,但这一过程充满挑战。最直接的方法是直接抓取网页内容并提取其 HTML 数据。然而,抓取操作往往复杂且容易受到封锁,且原始 HTML 往往包含大量无用的元素,如多余的标记和脚本代码。Reader API 解决了这些问题,它能从网址提取出核心内容,并将其转化为干净、易于大语言模型处理的文本,确保为你的 AI 智能体及 RAG 系统提供高品质的数据输入。
2、Kimi Copilot:Kimi chat 驱动的 AI 总结助手[8]
月暗推出了浏览器插件Kimi Copilot网页总结助手,可以一键总结页面内容。安装后,在浏览网络文章时点击插件图标,或使用快捷键 Ctrl/Cmd+Shift+K,即可一键召唤Kimi.ai总结网页内容。总结的非常详细,而且使用Kimi还不需要付费。
3、头像的动漫转换[9]
头像转换工具,基于 stable diffusion 模型,可以将头像照片转成三种动漫风格。
4、StockCake[10]
无版权的 AI 图片搜索引擎。
赛博·洞见
1、人工智能将如何影响产品管理[11]
Lenny是一位产品经理,他相信人工智能(AI)将对产品管理的高级技能产生最深远的影响,如制定战略、构思愿景、发现新机会和设定目标。AI在分析大量数据、提供简明扼要的答案方面非常擅长,这使得它在识别巧妙战略方面具有巨大潜力。然而,人们的软技能,如产品感知、沟通能力、创造力和团队合作能力,仍然是AI难以取代的领域。
关键部分:
- 产品塑造工作:AI将在这方面发挥最大的作用,通过分析市场、数据、客户需求和未来的见解,制定一个超级智能的计划。产品经理在这里的角色将转变为擅长选择合适的数据和提出正确问题。工具:ChatGPT、Claude、Gemini、Perplexity。
- 目标设定和跟踪:AI工具将越来越智能地建议你应该优化的目标,基于你的战略、业务要求和限制。产品经理将成为超级智能建议的编辑者。工具:ChatGPT、Claude、Gemini。
- 产品需求文档(PRD):AI工具已经可以通过人类语言描述你想要的产品,得到80%的完成稿,然后进行修改和发布。工具:ChatPRD、WriteMyPRD、Uizard、tldraw。
- 了解客户需求:AI工具将使寻找信息变得更加容易,但客户仍然希望与真实的人交流,分享他们的挑战、想法和体验。沟通、创造力等技能将变得越来越重要。工具:Dovetail、Sprig、Kraftful、Notably、Viable、Maze。
- 制定产品路线图:AI工具将根据你的战略、用户研究和目标给出一个强大的初稿,并帮助你对想法进行优先级排序,但你仍然需要与团队一起进行头脑风暴、审查数据和用户研究、讨论权衡和完善路线图。工具:Productroadmap.ai。
- 产品发布前的反馈:这是需要人类参与的领域,以确保用户体验简单、连贯和愉悦。然而,AI工具可能会在指出用户体验方面的挑战和提出最佳实践方面发挥作用。
2、小型语言模型可以帮助大型语言模型更好地推理吗?[12]
这篇论文展示了如何利用多种创新思路来提升小型语言模型在推理任务上的表现,使其更接近大型语言模型的能力。
研究团队首先利用知识蒸馏技术(knowledge distillation),让一个小型模型学习大型模型生成的推理步骤,从而提高小模型的推理效率。小型模型专注于生成推理步骤,而复杂的答案预测则交给了性能更强的大型模型处理,这种方法节省了资源,免去了对大模型进行频繁微调的需要。此外,研究者还通过强化学习技术(reinforcement learning),引入了针对推理逻辑和任务表现的激励机制,进一步精细化小模型的推理能力。在多步骤的问题解答实验中,这种新策略的表现超越了所有传统方法,证明了其高效的答案预测能力。强化学习的应用不仅提升了推理的质量,也优化了整体的问答性能。
该论文提出的 LM 引导思考法在多项对比中显示出领先优势,包括传统的提示方法和其他思考链技术。同时,自我一致性的解码方法也为模型性能的提升做出了贡献。
3、论文阅读大作战:AI产品经理的必备技能还是时间陷阱?[13]
对近期一个热门播客《一个顶级AI产品经理的自我修养 | 对谈光年之外产品负责人Hidecloud》[14]中提出的“AI产品经理是否需要大量阅读论文”的深度思考,作者提出不应因为恐慌而过度投入论文阅读,应有选择地阅读重要的论文,对于用户产品经理更应该从用户需求和市场洞察出发打造用户喜爱的产品。
4、做 AI 产品的 12 条反共识[15]
本文强调了在设计AI产品时需要打破常规思维,探索新的设计原则和用户界面形式,并重视非传统用户群体的需求,以下是作者提出的12条做AI产品的“反共识”:
- CUI(自然语言交互界面)并非总是最佳选择
- UI(用户界面)的多样性
- 将LLM(大型语言模型)视作计算器而非大脑
- 重视情感陪伴和娱乐
- 人类应作为CoPilot(副驾驶)
- 拆解与重构流程以利用AI
- AI作为高效的“小偷”
- AI是照相机非引擎
- AI产品经理应忘记现有解决方案
- 产品的真正用户可能是用户的老板
- 从“穷惯了”到学习“过富裕的日子”
- 非用户是潜在的新用户和好用户
5、扎克伯格最新采访:Meta最强开源模型Llama 3凭什么值百亿美金[16]
在Meta发布Llama 3后不久,马克·扎克伯格(Mark Zuckerberg)接受了知名科技播客主持人达瓦克什·帕特尔(Dwarkesh Patel)的专访。他们围绕Llama 3、通用人工智能(AGI)、能源瓶颈问题、人工智能技术的战略意义、开源的潜在风险、元宇宙(Metaverse)等话题展开了深入的探讨。
6、AGI大基建与马拉松:2024 Q1全球大模型的前沿手记[17]
文章从多个角度记录了中国AGI的进展,并观察了2024年第一季度全球大模型的赛局。作者通过与拾象科技CEO李广密的对话,深入讨论了AGI技术基建的重要性,包括算力、数据中心建设的挑战,以及这些挑战对模型公司的影响。
7、AI x 医疗 | 难解的必答题[18]
文章从中国人口老龄化和医保基金缺口的角度出发,论证了AI在基础普惠医疗中的必要性。指出AI诊断准确率的提升使得AI医疗成为可能,医疗数据的重要性,以及短期内AI医疗面临的挑战。
8、AI 播客应用 Podwise 三万字复盘:两个月 1.2 万美元 ARR 之路[19]
文章是关于AI播客知识管理应用Podwise的创业复盘,详细记录了产品从灵感到实现、再到市场推广和用户增长的全过程。对于从0到1做AI-Native产品的创业者来说,很有借鉴意义。
9、Suno AI:音乐生成迎来MidJourney时刻,Suno能否挑战Spotify?[20]
文章探讨了Suno AI在音乐生成领域的创新和潜力,分析了其技术、市场机会、产品竞争力,并对未来的发展方向进行了猜想。作者提出:Suno V3 可以类比为音乐生成领域的”midjourney V3",音乐生成第一次到了生产、消费可用的临界点。
10、对话 MiniMax 闫俊杰:AGI 不是大杀器,是普通人每天用的产品[21]
晚点团队对话MiniMax 创始人闫俊杰,讨论了他对 AGI 的理解、公司技术路线的选择、产品开发的策略以及对未来市场和技术发展的预测。闫俊杰强调了 AGI 应当是服务于普通人的每日产品,而非单一的“大杀器”。
11、Agent调研--19类Agent框架对比[22]
文章对当前主流的19类Agent框架进行了调研和对比,详细介绍了Agent的基本概念、决策模型、工程实现,并分类讨论了Single-Agent和Multi-Agent框架的特点和应用。
12、谷歌全面整合AI力量背后:DeepMind浮沉史|甲子光年[23]
甲子光年出品,文章详细回顾了DeepMind的发展历程,分析了其在谷歌旗下面临的人才流失问题,以及谷歌为整合AI力量所采取的措施。
13、对话昆仑万维方汉:信不信仰不重要,做出东西来才重要[24]
晚点团队对哈昆仑万维董事长兼CEO方汉,探讨了AIGC技术对内容行业的重塑、昆仑万维的企业战略以及方汉对技术发展和商业机会的洞察。方汉认为,AIGC这项技术将重新洗牌内容行业,并为中型公司提供了成为巨头的机会。
14、她从谷歌离职创立“超大杯”版Excel,融了10个亿,跻身独角兽[25]
Eléonore Crespo,一位前谷歌员工和女性投资人,创立了Pigment,一个旨在改进传统电子表格工具并提供更高效商业预测平台的公司,该公司已经融资10亿人民币并成为独角兽企业。
赛博·资源
1、数智时代的AI人才粮仓模型解读白皮书(2024版)(关注公众号【产品老A】回复【数智时代的AI人才粮仓模型解读白皮书】下载)
由极客邦科技双数研究院发布,旨在为企业提供一份详尽的AI人才培养和应用指南。白皮书首先指出了AI技术在推动产业升级和技术革新中的重要性,并强调了企业在数智时代面临的AI挑战和需求。接着,文章提出了“数智时代的AI人才粮仓模型”,该模型明确了AI人才的核心能力要求和岗位设置,旨在帮助企业构建一个系统、全面的人才培养和布局框架。
2、李飞飞联合斯坦福大学发布《2024年人工智能指数报告》(关注公众号【产品老A】回复【2024年人工智能指数报告】下载)
李飞飞联合斯坦福大学以人为本人工智能研究所(Stanford HAI)于近日发布了《2024年人工智能指数报告》,报告揭示了2023年人工智能行业的十大主要趋势:
- 人工智能在特定任务上超越人类,但在复杂任务上仍有差距。
- 产业界主导AI研究,产生更多著名模型。
- 前沿模型训练成本显著增加。
- 美国在顶级AI模型开发上领先。
- 缺乏对大语言模型负责任的标准化评估。
- 生成式人工智能投资大幅增长。
- AI提高工作效率和质量。
- AI推动科学进步速度加快。
- 美国AI法规数量急剧增加。
- 公众对AI潜在影响的认识加深,紧张情绪上升。
3、中国大学矢量校徽合集[26]
4、《大语言模型》(关注公众号【产品老A】回复【大语言模型】下载)
很棒的一本书,适合对大模型技术感兴趣的初学者阅读。作者是去年发表大模型综述《A Survey of Large Language Models》的,一支来自加拿大滑铁卢大学、清华大学和新加坡管理大学的团队。
Reference
[1] Meta发布最强开源模型Llama3:https://llama.meta.com/llama3/
[2] Meta AI:https://ai.meta.com/
[3] AI画图应用Ideogram发布模型更新:https://about.ideogram.ai/1.0-upgrade
[4] X AI 公布了 Gork 1.5V 多模态 LLM:https://x.ai/blog/grok-1.5v
[5] Cohere 发布专门为RAG设计的基础模型 Rerank 3:https://txt.cohere.com/rerank-3/
[6] 百度召开AI开发者大会:https://mp.weixin.qq.com/s/CoauDzKH3JmuYQJjhxnI6A
[7] Reader:jina开源的网页内容爬取工具:https://jina.ai/reader/
[8] Kimi Copilot:Kimi chat 驱动的 AI 总结助手:https://chromewebstore.google.com/detail/kimi-copilot-%E7%BD%91%E9%A1%B5%E6%80%BB%E7%BB%93%E5%8A%A9%E6%89%8B/icmdpfpmbfijfllafmfogmdabhijlehn
[9] 头像的动漫转换:https://www.animefilter.online/convert.html
[10] StockCake:https://stockcake.com/
[11] 人工智能将如何影响产品管理:https://www.lennysnewsletter.com/p/how-ai-will-impact-product-management
[12] 小型语言模型可以帮助大型语言模型更好地推理吗?:https://arxiv.org/abs/2404.03414
[13] 论文阅读大作战:AI产品经理的必备技能还是时间陷阱?:https://mp.weixin.qq.com/s/YjE7wB2JeV9tYfL6gADXsA
[14] 《一个顶级AI产品经理的自我修养 | 对谈光年之外产品负责人Hidecloud》:https://mp.weixin.qq.com/s/HWq9QM8uotdCB8YmpphafQ
[15] 做 AI 产品的 12 条反共识:https://mp.weixin.qq.com/s/x7ptCCu2HwBugXiEgsiEcw
[16] 扎克伯格最新采访:Meta最强开源模型Llama 3凭什么值百亿美金:https://mp.weixin.qq.com/s/pA-uETmerJaTX4H-OYNJtA
[17] AGI大基建与马拉松:2024 Q1全球大模型的前沿手记:https://mp.weixin.qq.com/s/GcALcCUo9CuvbIBm_-1adA
[18] AI x 医疗 | 难解的必答题: https://mp.weixin.qq.com/s/cxKzeAQ_539YOfKNNuIpDA
[19] AI 播客应用 Podwise 三万字复盘:两个月 1.2 万美元 ARR 之路:https://mp.weixin.qq.com/s/5gtvNsvpYws5sLGnP1f8_g
[20] Suno AI:音乐生成迎来MidJourney时刻,Suno能否挑战Spotify?:https://mp.weixin.qq.com/s/KTeOSRM_DUwWfyycQllOHQ
[21] 对话 MiniMax 闫俊杰:AGI 不是大杀器,是普通人每天用的产品:https://mp.weixin.qq.com/s/OXunu2wnNQv66rZIZLnW7g
[22] Agent调研--19类Agent框架对比:https://mp.weixin.qq.com/s/rogMCoS1zDN0mAAC5EKhFQ
[23] 谷歌全面整合AI力量背后:DeepMind浮沉史|甲子光年:https://mp.weixin.qq.com/s/Nc8jEq8-ep675JAKjvSc1Q
[24] 对话昆仑万维方汉:信不信仰不重要,做出东西来才重要:https://mp.weixin.qq.com/s/jcQnisUvHj6W1DRsjR2fYg
[25] 她从谷歌离职创立“超大杯”版Excel,融了10个亿,跻身独角兽:https://mp.weixin.qq.com/s/XZj1ZETXlKeDcU4dzSE38Q
[26] 中国大学矢量校徽合集:https://www.urongda.com/
这篇关于Cyber Weekly #3的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!