必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢 原创 2017-07-10 爱收藏的 AI科技大本营 作者 | Flavian Hautbois 翻译 | AI科技大

本文主要是介绍必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢 原创 2017-07-10 爱收藏的 AI科技大本营 作者 | Flavian Hautbois 翻译 | AI科技大,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢

  2017-07-10  爱收藏的  AI科技大本营


作者 | Flavian Hautbois

翻译 | AI科技大本营(rgznai100)

参与 | JeyZhang,波波



上个月,我们发了很多文章。但是,机器学习和数据科学整个领域所发表的新文章更多。如何用一篇文章就能梳理好这些最新的内容呢?我们苦思冥想,从中找出了这十篇有关神经网络、TensorFlow、数据可视化、生成式对抗网络(GAN)以及LSTM的最佳文章。


只此一篇,你就能把握住机器学习和数据科学整个领域的新内容,绝对不容错过。


如果你的阅读习惯是边看边动手做,请一定先备好Python环境。


我们先从下面的漫画开始:



图片翻译:

“这个问题已经困扰我们很多年了。”

“不用纠结,让我用算法来替你解决它。”

6个月后…

“哇,你这问题确实好难。”“你不是说……”


1 —  Dash入门


Dash提供了一套全新的用于web的图表库,而这篇文章深入介绍了Dash图表库是如何设计的,以及介绍了在Dash中如何有效地处理常见错误以及多重集成。文章中对Excel和R语言系统进行了很合理的对比。使用Dash进行图表实现时,一个技术上的挑战是,你需要维护一个flask应用以及拥有一个对ReactJS友好的前端。


Adil Baaj在我们的博客上发布了一篇对比多种javascript图表库的文章。如果希望入门Dash,可以阅读来自plotly的《Dash入门》。


Dash入门

https://medium.com/@plotlygraphs/introducing-dash-5ecf7191b503


对比多种javascript图表库

https://blog.sicara.com/compare-best-javascript-chart-libraries-2017-89fbe8cb112d/


2 —  Google发布用于目标检测的TensorFlow API



Google公司一直致力于让大数据领域最新研究的实现变得更加简单。本月他们在TensorFlow上发布了用于目标检测的API,也发布了适用于移动设备的版本。


详见Google Research Blog的原文:

https://research.googleblog.com/2017/06/supercharge-your-computer-vision-models.html


3  — 初识生成式对抗网络(Generative Adversarial Networks, GAN)



这是一篇介绍如何训练一个神经网络来生成手写数字图片的教程。我们很欣赏这种在对抗式网络这个新的研究方向上的实践技术,这又是一个在经典MNIST数据集上做的实验。在这篇文章中,你将得知训练生成式对抗网络是一件困难的事,是因为你需要在生成器与判别器的训练中找到平衡。本教程仅需要大概半小时就能读完,属同类教程中的佼佼者。


详见O’Reilly原文

https://www.oreilly.com/learning/generative-adversarial-networks-for-beginners


4  —  使用深度学习技术重构出高分辨率的音频



受到最近图像方面研究的启发,文章作者尝试用低质量的音频文件来重构出分辨率更高的音频,最终音频质量上没有取得大幅度的提高,但也一定程度上达到了目的。尽管实验结果上的提升并不显著,我们仍然认为该篇文章为本月最佳文章之一。原因如下:


  • 本文着重于重构VoIP语音,这点很巧妙。

  • 语音方面的研究工作比较复杂,而深度学习技术的应用除了在语音转文本应用领域之外,其他的较少见到。


我们觉得如果作者在卷积网络中使用频谱表示而不是时间表示的话,实验结果还能再提升一步。


详见Insight Data原文

https://blog.insightdatascience.com/using-deep-learning-to-reconstruct-high-resolution-audio-29deee8b7ccd


5  —  探索LSTM


我们破例收录了这篇文章(发表时间在5月30日,严格上说不是6月份的文章),因为文章写得特别好。这篇文章的前半部分是一个LSTM教程,后半部分深入浅出对LSTM作了详解。详解部分使得本文非常有价值。审计 (Audit) 仍然是大数据算法中最困难的部分。正因如此,Edwin Chen做的可视化工具非常棒,因为它详细解析了LSTM的原理。


详见AI科技大本营的完整译文:多图|入门必看:万字长文带你轻松了解LSTM全貌


6  —  怎样训练神经网络来自动写代码?



如果你阅读了前面关于LSTM的文章,那么你已经看到了一个关于生成Java程序的例子。来自Thibault Neveu的这篇文章也在尝试做同样的事情。文中使用TensorFlow并且比之前的文章更易于上手,并且更适合做快速阅读。


详见AI科技大本营的完整译文:手把手教你自制编程AI:训练2小时,RNN就能写自己的代码


7  —  人工智能让制药业再创辉煌以及所面临的挑战



这篇文章介绍了如何使用生成式对抗网络来生成新的抗癌药物,思路很棒。在制药研究领域有一个Eroom定律,与摩尔定律正相反(随着时间推移,寻找新药的难度呈指数增长)。Mostapha Benhenda强烈呼吁研究人员在大数据与药理学交叉领域上的研究采取行动。


详见Hackernoon原文:

https://hackernoon.com/make-pharma-great-again-with-artificial-intelligence-some-challenges-50e91ea9988d


8  —  你所不知道的图表展示小技巧



注意到上面饼状图里一些奇怪的地方了吗?你应该注意到,不过你可能没有(至少我没)。这篇文章详细举例说明了用图表来做比较时的错误用法,从中你会学到在对比两种相似的数据时,图表展示的方式非常重要。


详见Andrew Gelman的原文

http://andrewgelman.com/2017/06/02/youll-never-guess-one-quick-trick-diagnose-problems-graphs-make-improvements/


9 — 我在Kaggle上获胜的小技巧



Kaggle是一个数据科学方面在线竞赛平台。公司可以提交赛题以及相关数据集供参赛者解决。Kaggle是一个大型社区,你在上面有机会获得百万美金大奖。这篇文章的作者分享了他从开始时的新手到后来比赛取得第五名的经验。我们认为他总结的参赛小技巧也可供企业数据科学家参考,如果你想参与Kaggle上的竞赛,那么这篇文章将非常值得一读。


详见Dataquest原文

https://www.dataquest.io/blog/kaggle-tips-tricks/


10 — 大数据的体现:Amazon收购全食超市的交易



最后再介绍一篇关于商业上Amazon收购Whole Foods超市的文章。随着大数据的研究逐渐渗透商界,我们认为这类文章是这个列表的重要补充。从企业获取数据的角度来看,Amazon收购Whole Foods超市是明智之举。因为Amazon虽然是个大公司,但是数量上远不及Whole Foods超市多,所以收购将为其带来巨大的数据财富。


详见Dataiku:

https://blog.dataiku.com/big-data-is-the-big-news-in-amazon-whole-foods-deal


对于我们选出来的本月十佳文章,你都有看过吗?你心里有没有其他更好的选项?欢迎在评论中告诉我们,如果你们喜欢,咱们下期再见。


原文链接

https://blog.sicara.com/06-2017-best-big-data-new-articles-this-month-5c3478872a61


这篇关于必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢 原创 2017-07-10 爱收藏的 AI科技大本营 作者 | Flavian Hautbois 翻译 | AI科技大的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/670891

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

人工智能机器学习算法总结神经网络算法(前向及反向传播)

1.定义,意义和优缺点 定义: 神经网络算法是一种模仿人类大脑神经元之间连接方式的机器学习算法。通过多层神经元的组合和激活函数的非线性转换,神经网络能够学习数据的特征和模式,实现对复杂数据的建模和预测。(我们可以借助人类的神经元模型来更好的帮助我们理解该算法的本质,不过这里需要说明的是,虽然名字是神经网络,并且结构等等也是借鉴了神经网络,但其原型以及算法本质上还和生物层面的神经网络运行原理存在

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

【新闻】AI程序员要来了吗?阿里云官宣

内容提要 6 月 21 日,在阿里云上海 AI 峰会上,阿里云宣布推出首个AI 程序员。 据介绍,这个AI程序员具备架构师、开发工程师、测试工程师等多种岗位的技能,能一站式自主完成任务分解、代码编写、测试、问题修复、代码提交整个过程,最快分钟级即可完成应用开发,大幅提升研发效率。 近段时间以来,有关AI的实践应用突破不断,全球开发者加速研发步伐。有业内人士坦言,随着大模型性能逐渐提升,AI应

AI元宇宙

随着科技的迅猛发展,人工智能(AI)迎来了一个宇宙大爆发的时代。特别是以GPT为代表的生成式大模型的诞生和不断进步,彻底改变了人们的工作和生活方式。程序员与AI协同工作写代码已成为常态,大模型不仅提高了工作效率,还为人类带来了无限的可能性。 AI元宇宙http://ai.toolxq.com/#/如同生物进化出眼睛打开了三维世界的元宇宙之后,GPT打开了人+AI工作模式的新时代,程序员的人生被划

AI学习指南机器学习篇-朴素贝叶斯处理连续特征和离散特征

AI学习指南机器学习篇-朴素贝叶斯处理连续特征和离散特征 在机器学习领域,朴素贝叶斯是一种常用的分类算法,它的简单性和高效性使得它在实际应用中得到了广泛的应用。然而,在使用朴素贝叶斯算法进行分类时,我们通常会面临一个重要的问题,就是如何处理连续特征和离散特征。因为朴素贝叶斯算法基于特征的条件独立性假设,所以对于不同类型的特征,我们需要采取不同的处理方式。 在本篇博客中,我们将探讨如何有效地处理

AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著