小明专题

简单的Q-learning|小明的一维世界(3)

简单的Q-learning|小明的一维世界(1) 简单的Q-learning|小明的一维世界(2) 一维的加速度世界 这个世界,小明只能控制自己的加速度,并且只能对加速度进行如下三种操作:增加1、减少1、或者不变。所以行动空间为: { u 1 = − 1 , u 2 = 0 , u 3 = 1 } \{u_1=-1, u_2=0, u_3=1\} {u1​=−1,u2​=0,u3​=1}

简单的Q-learning|小明的一维世界(2)

上篇介绍了小明的一维世界模型 、Q-learning的状态空间、行动空间、奖励函数、Q-table、Q table更新公式、以及从Q值导出策略的公式等。最后给出最简单的一维位置世界的Q-learning例子,从给出其状态空间、行动空间、以及稠密与稀疏两种奖励函数的设置方式。下面将继续深入,GO! 一维的速度世界 这个世界,小明只能控制自己的速度,并且只能对速度进行如下三种操作:增加1、减

【HDU】4521 小明系列问题——小明序列 线段树+DP

小明系列问题——小明序列 Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 65535/32768 K (Java/Others) Total Submission(s): 1632    Accepted Submission(s): 485 Problem Description   大家都知道小明最喜欢研究

nyoj469 擅长排列的小明 II

擅长排列的小明 II 时间限制: 1000 ms  |  内存限制: 65535 KB 难度: 3 描述 小明十分聪明,而且十分擅长排列计算。 有一天小明心血来潮想考考你,他给了你一个正整数n,序列1,2,3,4,5......n满足以下情况的排列: 1、第一个数必须是1 2、相邻两个数之差不大于2 你的任务是给出排列的种数。 输入 多组数据。每组数据中输入一个

nyoj49 开心的小明

开心的小明 时间限制: 1000 ms  |  内存限制: 65535 KB 难度: 4 描述 小明今天很开心,家里购置的新房就要领钥匙了,新房里有一间他自己专用的很宽敞的房间。更让他高兴的是,妈妈昨天对他说:“你的房间需要购买哪些物品,怎么布置,你说了算,只要不超过N 元钱就行”。今天一早小明就开始做预算,但是他想买的东西太多了,肯定会超过妈妈限定的N 元。于是,他把每件物品

小明和小明记账簿的故事

在繁华与喧嚣交织的现代都市中,生活节奏日益加快,人们的钱包也随着各种消费而日渐消瘦。小明,一个普通的青年,也深陷在这场财务管理的漩涡之中。一天小明正坐在窗前,手中拿着一本略显陈旧的纸质账本,眉头紧锁地记录着日常生活的每一笔开销。他热爱生活,却总被繁琐的财务管理搞得焦头烂额。每当月底对账时,那些零散的支出就像是一场突如其来的暴风雨,让他措手不及。 就在这时,一个灵感如同春日里的一缕清风,轻轻拂过小

猜叔叔的出生年月日 今年的植树节(2012年3月12日),小明和他的叔叔还有小伙伴们一起去植树。

package org.bluebridge.topics;/** 猜叔叔的出生年月日今年的植树节(2012年3月12日),小明和他的叔叔还有小伙伴们一起去植树。休息的时候,小明的同学问他叔叔多大年纪,他叔叔说:“我说个题目,看你们谁先猜出来!”“把我出生的年月日连起来拼成一个8位数(月、日不足两位前补0)正好可以被今天的年、月、日整除!”他想了想,又补充到:“再给个提示,我是6月出生的。”根据这

连号区间数 小明这些天一直在思考这样一个奇怪而有趣的问题:

package org.bluebridge.topics;/** 连号区间数小明这些天一直在思考这样一个奇怪而有趣的问题:在1~N的某个全排列中有多少个连号区间呢?这里所说的连号区间的定义是:如果区间[L, R] 里的所有元素(即此排列的第L个到第R个元素)递增排序后能得到一个长度为R-L+1的“连续”数列,则称这个区间连号区间。当N很小的时候,小明可以很快地算出答案,但是当N变大的时候,问题就

第39级台阶 小明刚刚看完电影《第39级台阶》,离开电影院的时候,他数了数礼堂前的台阶数,恰好是39级!

package org.bluebridge.topics;/** 第39级台阶小明刚刚看完电影《第39级台阶》,离开电影院的时候,他数了数礼堂前的台阶数,恰好是39级!站在台阶前,他突然又想着一个问题:如果我每一步只能迈上1个或2个台阶。先迈左脚,然后左右交替,最后一步是迈右脚,也就是说一共要走偶数步。那么,上完39级台阶,有多少种不同的上法呢?请你利用计算机的优势,帮助小明寻找答案。* */p

小明的骰子

题目描述 众所周知,小明非常喜欢玩骰子。一天,小芳问小明一个问题。一次性抛n个骰子,一共能抛出几种结果? 小明不想让小芳觉得自己回答不上来,所以小明来求助于你。你一定要帮帮小明。 输入 首先输入一个整数T,代表有T组数据。 接下来的T行,每行输入一个整数n,代表有n个骰子。(0<n<=1000) 注:1,每个骰子有6个面。 2,每个骰子都是相同的。所以(1,1,2)和(1,2

小明传奇1

小明传奇1 Time Limit: 2000MS Memory limit: 65536K 题目描述 小明有一家自己的商店,主营牛奶饮品,最近资金紧张,他想以尽可能低的价格进购足够的牛奶以供日常的需要。但是小明年纪大了,脑子不好使了,想要求助你帮他想出一个最好的节省资金办法。 小明可以从几个农场里购买牛奶,每个农场都有自己的价格,一头奶牛的生产量是固定的,所以每个农场

HDU 4521 小明系列问题——小明序列 (线段树维护DP)

题目地址:HDU 4521 基本思路是DP。找前面数的最大值时可以用线段树来维护节省时间。 由于间隔要大于d。所以可以用一个队列来延迟更新,来保证每次询问到的都是d个之前的。 代码如下: #include <iostream>#include <cstdio>#include <string>#include <cstring>#include <stdlib.h>#incl

hdu5421 小明系列问题——小明序列

题意:有多组测试数据,每组数据的n和d表示,有n个数,求相邻元素间距大于d的最长上升序列。(1<=n<=10^5 , 0<=d<=10^5) 正常的LIS输入第i个数时在处理完0到i-1的队列中找到一个合适位置把a[i]插入。本题有个限制条件d,所以每次只能在处理完0到i-d的队列中找到一个合适位置把a[i]插入,这样我们延缓更新队列即可,在处理第i个数据时,队列只需更新到a[i-d]的位置即可

NYOJ 49 【开心的小明】

开心的小明 时间限制: 1000 ms  |  内存限制: 65535 KB 难度: 4 描述 小明今天很开心,家里购置的新房就要领钥匙了,新房里有一间他自己专用的很宽敞的房间。更让他高兴的是,妈妈昨天对他说:“你的房间需要购买哪些物品,怎么布置,你说了算,只要不超过N 元钱就行”。今天一早小明就开始做预算,但是他想买的东西太多了,肯定会超过妈妈限定的N 元。于是,他把每件物品规

nyoj 19【擅长排列的小明】

描述 小明十分聪明,而且十分擅长排列计算。比如给小明一个数字5,他能立刻给出1-5按字典序的全排列,如果你想为难他,在这5个数字中选出几个数字让他继续全排列,那么你就错了,他同样的很擅长。现在需要你写一个程序来验证擅长排列的小明到底对不对。 输入 第一行输入整数N(1<N<10)表示多少组测试数据, 每组测试数据第一行两个整数 n m (1<n<9,0<m<=n) 输出 在1-n中选取m

【小明开发一百问】(二)关于Genymotion你知道多少

故事 小明一直是一个很乐观开朗的人,然而今天的小明却显得十分没精神,沮丧地低着头。 问了他原因,才发现原来是因为他早上被同事取笑了——因为他不知道Genymotion 模拟器,他一直用的Android Emulator和真机做调试。 见他这么不开心,我们决定跟他讲几个Genymotion的知识点,好让他能在他同事面前炫耀一把,不过更主要是让小明自己赶紧去试试Genymotion,因为它真的十

华为OD刷题C卷 - 每日刷题30(小明找位置,分隔均衡字符串)

1、(小明找位置): 这段代码是解决“小明找位置”的问题。它提供了一个Java类Main,其中包含main方法和getResult方法,用于帮助小明快速找到他在排队中应该站的位置。 main方法首先读取已排列好的小朋友的学号数组和小明的学号,然后调用getResult方法并打印小明应该站的位置。 getResult方法使用Java的Arrays.binarySearch方法进行二分查找,以确

小明的迷宫

Accept: 65    Submit: 196 Time Limit: 1000 mSec    Memory Limit : 32768 KB  Problem Description 小明误入迷宫,塞翁失马焉知非福,原来在迷宫中还藏着一些财宝,小明想获得所有的财宝并离开迷宫。因为小明还是学生,还有家庭作业要做,所以他想尽快获得所有财宝并离开迷宫。  Input 有多组测试数

c++【入门】小明的游泳时间

限制 时间限制 : 1 秒 内存限制 : 128 MB 题目 伦敦奥运会要到了,小明在拼命练习游泳准备参加游泳比赛。这一天,小明给自己的游泳时间做了精确的计时(本题中的计时都按24小时制计算),它发现自己从a时b分一直游泳到当天的c时d分,请你帮小明计算一下,它这天一共游了多少时间呢?小明游的好辛苦呀,你可不要算错了哦。 输入 一行内输入4个整数,分别表示a,b,c,d。 输出 一

c++【入门】小明买水果

限制 时间限制 : 1 秒 内存限制 : 128 MB 题目 小明去超市买了若干斤水果,你能根据水果的单价,小明买的水果数量,编一个程序计算出总金额,并打印出清单。 输入 两行 第一行商品的单价,是一个小数 第二行商品的数量,是一个整数 输出 一行,商品的单价,数量,及金额,中间用空格隔开。 单价保留两位小数,总金额去掉小数。 数量为整数。 样例 输入 3.55 3

NYOJ,181,小明的难题

小明的难题 时间限制:3000 ms  |  内存限制:65535 KB 难度:2 描述 课堂上小明学会了用计算机求出N的阶乘,回到家后就对妹妹炫耀起来。为了不让哥哥太自满,妹妹给小明出了个问题“既然你会求N的阶乘,那么你帮我算算1!+2!-3!+4!-5!+……N!”。这下可把小明难住了,聪明的你能帮帮他吗? 输入 第一行输入一个整数 T(0<T<=20),代表有 T 组测试数

NYOJ,51,管闲事的小明

管闲事的小明 时间限制:4000 ms  |  内存限制:65535 KB 难度:2 描述 某校大门外长度为L的马路上有一排树,每两棵相邻的树之间的间隔都是1米。我们可以把马路看成一个数轴,马路的一端在数轴0的位置,另一端在L的位置;数轴上的每个整数点,即0,1,2,……,L,都种有一棵树。   由于马路上有一些区域要用来建地铁。这些区域用它们在数轴上的起始点和终止点表示。  已知任一区域的起始

NYOJ 240题 小明的调查统计(二)

开始时的思考角度不对,“超时”了 “超时”代码: 下面是,AC的代码: AC的代码的缺点是:所占内存太大。 这道题,应该特别注意,结构体的使用。很奇怪的是:再输入结构体的时候,写到"."时,正常的话,应该有结构体成员列表提示才对,可是我在写的时候没有出现,但是,编译还没有错误,而且还AC了。难道是我编译器的问题? 哦,对了,std是C++中的关键字,不能随便使用(这是导致

NYOJ 223题 小明的烦恼

列举8种情况,同时因为 scanf("%d", &N) 后面是 %c   (  scanf("%c", &str[i])  ),还是要注意加上getchar(),来接收回车键.。

NYOJ 224题 灯光师小明

布尔类型的数的应用。 !表示非。 ~表示取反。 第一次写的时候,“超时”,又改了一下代码。这是超时的那个: 下面的这个是AC的:

nyoj-469-擅长排列的小明II

#include<stdio.h> int a[56]={0,1,1,2,4}; int main() { int n,i; for(i=5;i<56;i++) a[i]=a[i-1]+a[i-3]+1; while(scanf("%d",&n)!=EOF) printf("%d\n",a[n]); return 0; }