based专题

▶《强化学习的数学原理》(2024春)_西湖大学赵世钰 Ch5 蒙特卡洛方法【model-based ——> model-free】

PPT 截取必要信息。 课程网站做习题。总体 MOOC 过一遍 1、视频 + 学堂在线 习题 2、 过 电子书 是否遗漏 【下载:本章 PDF GitHub 页面链接 】 【第二轮 才整理的,忘光了。。。又看了一遍视频】 3、 过 MOOC 习题 看 PDF 迷迷糊糊, 恍恍惚惚。 学堂在线 课程页面链接 中国大学MOOC 课程页面链接 B 站 视频链接 PPT和书籍下载网址: 【Gi

越复杂的CoT越有效吗?Complexity-Based Prompting for Multi-step Reasoning

Complexity-Based Prompting for Multi-step Reasoning 论文:https://openreview.net/pdf?id=yf1icZHC-l9 Github:https://github.com/FranxYao/chain-of-thought-hub 发表位置:ICLR 2023 Complexity-Based Prompting for

▶《强化学习的数学原理》(2024春)_西湖大学赵世钰 Ch4 值迭代 与 策略迭代 【动态规划 model-based】

PPT 截取必要信息。 课程网站做习题。总体 MOOC 过一遍 1、视频 + 学堂在线 习题 2、过 电子书 补充 【下载: 本章 PDF 电子书 GitHub】 [又看了一遍视频。原来第一次跳过了好多内容。。。] 3、总体 MOOC 过一遍 习题 学堂在线 课程页面链接 中国大学MOOC 课程页面链接 B 站 视频链接 PPT和书籍下载网址: 【GitHub 链接】 总述:

Polyp-DDPM: Diffusion-Based Semantic Polyp Synthesis for Enhanced Segmentation

Polyp- ddpm:基于扩散的语义Polyp合成增强分割 摘要: 本研究介绍了一种基于扩散的方法Polyp-DDPM,该方法用于生成假面条件下息肉的逼真图像,旨在增强胃肠道息肉的分割。我们的方法解决了与医学图像相关的数据限制、高注释成本和隐私问题的挑战。通过对分割掩模(代表异常区域的二进制掩模)的扩散模型进行调节,poly - ddpm在图像质量(实现fr起始距离(FID)得分为78.47

Age and gender estimation based on Convolutional Neural Network and TensorFlow

训练数据处理 imdb数据提取 gender: 0 for female and 1 for male, NaN if unknown age: 年龄分为101类,分别为从0到100岁. 将训练数据转换为tfrecords格式,命令为, python convert_to_records_multiCPU.py --imdb --nworks 8 --imdb_db /home/rese

Android Glide, first start based on loadThumbnail, Kotlin(二)

Android Glide, first start based on loadThumbnail, Kotlin(二)   Android Glide, first start based on loadThumbnail, Kotlin(一)中有个小问题,通过loadThumbnail()采集到的缩略图真的就是整张图片的完整缩略图,直接放在正方形小格子里面,明显看到左右或者上下有空隙,因此

density based clustering algorithm,

1. 首先看到这个webSite讲的比较清楚,可以看下,https://blog.dominodatalab.com/topology-and-density-based-clustering/    We're hiring! BLOG HOME  LEARN MORE ABOUT DOMINO   Density-Based Clustering dat

Rcmp: Reconstructing RDMA-Based Memory Disaggregation via CXL——论文阅读

TACO 2024 Paper CXL论文阅读笔记整理 背景 RDMA:RDMA是一系列协议,允许一台机器通过网络直接访问远程机器中的数据。RDMA协议通常固定在RDMA NIC(RNIC)上,具有高带宽(>10 GB/s)和微秒级延迟(~2μs),这些协议得到了InfiniBand、RoCE和OmniPath等公司的广泛支持[20, 47, 62]。RDMA基于两种类型的操作原语提供数据传输

A comprehensive review of machine learning-based models for fake news detection

Abstract     互联网在假新闻传播中的作用使其成为一个严重的问题,需要复杂的技术来自动检测。为了应对 Facebook、Twitter、Instagram 和 WhatsApp 等社交媒体网站上误导性材料的快速传播,本研究探索了深度学习方法和各种分类策略领域。该研究特别调查了基于 Transformer 的模型(如 BERT、递归神经网络 (RNN) 和卷积神经网络 (CNN))在

Policy-Based Reinforcement Learning(1)

之前提到过Discount Return: Action-value Function : State-value Function:   (这里将action A积分掉)这里如果策略函数很好,就会很大;反之策略函数不好,就会很小。 对于离散类型: 用神经网络近似策略, 即 学习参数,使得越来越大。这里使用梯度上升的方法,对于一个可观测状态s,更新  这里称为策略梯度(P

基于图像特征的视觉跟踪系统(Feature-based visual tracking systems)--一篇Visual Tracking Benchmark (2013)综述

reference:http://blog.csdn.net/anshan1984/article/details/8866455 最近读到一篇关于视觉跟踪的综述性文章,“Evaluation of Interest Point Detectors and Feature Descriptors for Visual Tracking”,发表在2011年3月International Jour

Training Region-based Object Detectors with Online Hard Example Mining(CVPR2016 Oral)

转载自:http://zhangliliang.com/2016/04/13/paper-note-ohem/ Training Region-based Object Detectors with Online Hard Example Mining是CMU实验室和rbg大神合作的paper,cvpr16的oral,来源见这里:http://arxiv.org/pdf/1604.03540

Feature Manipulation for DDPM based Change Detection

基于去噪扩散模型的特征操作变化检测 文章提出了一种基于去噪扩散概率模型(DDPM)的特征操作变化检测方法。变化检测是计算机视觉中的经典任务,涉及分析不同时间捕获的图像对,以识别场景中的重要变化。现有基于扩散模型的方法主要关注提取特征图,而本文的方法专注于操作扩散模型提取的特征图,使其在语义上更有用。文章提出了两种方法:特征注意力(Feature Attention)和流对齐融合(Flow Dua

论文阅读:《Improving Content-based and Hybrid Music Recommendation using Deep Learning》

https://blog.csdn.net/u011239443/article/details/79984751 论文地址: https://www.smcnus.org/wp-content/uploads/2013/09/deep_mr.pdf 摘要 现有的基于内容的音乐推荐系统通常采用两阶段的方法。他们首先提取传统的音频内容特征,如 Mel-frequency cepstral系

XML-Based Injection in Spring 基于XML配置的依赖注入

原文链接:XML-Based Injection in Spring  1. Introduction 概述 In this basic tutorial, we’ll learn how to do simple XML-based bean configuration with the Spring Framework. 这里,一起学习如何在Spring框架中使用XML文件进行bean对

【论文学习】A Survey of Deep Learning-based Object Detection-基于深度学习的目标检测综述

A Survey of Deep Learning-based Object Detection 基于深度学习的目标检测综述 原文:https://arxiv.org/pdf/1907.09408.pdf Abstract 【目标检测】是计算机视觉最重要和具有挑战性的分支之一,广泛应用于监控安全,自主驾驶等。 对于检测任务,深度学习网络的飞速发展,给目标检测器性能带来极大的提升。 目标

强化学习中model-free和model-based

强化学习中model-free和model-based 1.Model-Based 强化学习算法2.Model-Free 强化学习算法3.对比总结 在强化学习(Reinforcement Learning, RL)中,算法通常分为两大类:model-based 和 model-free。它们的主要区别在于是否显式地构建和利用环境的模型。 1.Model-Based 强化学习算

Value-Based Reinforcement Learning(1)

Action-Value Functions Discounted Return(未来的reward,由于未来存在不确定性,所以未来的reward 要乘以进行打折) 这里的依赖actions ,和states  这里 Policy Function :    ,表达了action的随机性 State Transition : ,表达了转移状态的随机性 由于存在action,和sta

Value-Based Reinforcement Learning(2)

Temporal Difference (TD) Learning 上节已经提到了如果我们有DQN,那么agent就知道每一步动作如何做了,那么DQN如何训练那?这里面使用TD算法。 简略分析: 是的估计 是的估计 所以: Deep Reinforcement Learning :   Prediction  :  TD Target :  Loss :  Gradient

读论文 | Small object detection model for UAV aerial image based on YOLOv7

目录 1、前言 2、摘要 3、论文的方法 3.1  方法描述 3.2 方法改进 3.3 本论文的模型图  3.4 本文的数据集: 3.5 论文实验 3.6 解决的问题 3.7 论文总结 (1)文章优点 (2)方法创新点 (3)未来展望 1、前言 该论文代码未公开,大家看看方法啥的就好,里面详细的细节不用深究。没有公开代码的论文,一般是不看的。 原文:《Sma

Monocular Model-Based 3D Tracking of Rigid Objects:2005年综述

1 Introduction 在视频序列中跟踪一个物体意味着在物体或摄像机移动时,持续识别其位置。根据物体类型、物体和摄像机的自由度以及目标应用的不同,有多种方法可供选择。二维跟踪通常旨在跟踪物体或物体部分的图像投影,这些物体的三维位移会导致可以建模为二维变换的运动。为处理由于透视效应或变形引起的外观变化,需要一个自适应模型。它可以提供物体图像位置,表示为其质心和尺度或仿射变换 [141, 26

阿里Tree-based Deep Match(TDM)

学习一下见 http://www.manongjc.com/article/93793.html

基于用户的协同过滤(user-based CF)推荐系统【1】

最近开始学习推荐系统了,从最简单的协同过滤做起,做了一个基于用户的协同过滤推荐系统,然后参考了这一篇文章user-based CF,里面的代码写的都还比较好懂,用了大量的dict(字典)来存数据,速度是快,但是也占用内存啊,是以空间换时间,代码写的很好,很有参考价值,我在这个的基础上,又给他加了一个用来计算该算法准确率和召回率的代码文件。我跑了一遍没啥问题。 代码有几个要点要注意一下: 该

基于用户的协同过滤(user-based CF)推荐系统【2】

这一篇是紧跟着上一篇基于用户的协同过滤(user-based CF)推荐系统【1】的,这一篇只是把计算相似度的方法换成了余弦相似度,当然最后计算评分的公式也就变了。下面只把有变化的那部分代码贴出来。直接替换到上一篇里面的代码就可以了。 simpleCF.py part1 += user_movie[u][m]*user_movie[n][m]*1.0part2 += pow(user_m

ICRA2024重磅!首个融合LiDAR的NeRF-based SLAM系统

论文标题: SiLVR: Scalable Lidar-Visual Reconstruction with Neural Radiance Fields for Robotic Inspection 论文作者: Yifu Tao1, Yash Bhalgat2, Lanke Frank Tarimo Fu1, Matias Mattamala1, Nived Chebrolu1, and

Reinforcement Learning强化学习系列之一:model-based learning

前言 在机器学习和深度学习坑里呆了有一些时日了,在阿里实习过程中,也感觉到了工业界和学术界的一些迥异,比如强化学习在工业界用的非常广泛,而自己之前没有怎么接触过强化学习的一些知识,所以感觉还是要好好的补一补更新一下自己的知识库,以免被AI时代抛弃。 强化学习初识 强化学习要素 强化学习可以用下面这张图表示: 从上图可以看出,强化学习的要素是: 1. Agent(图中指大脑) 2.