《30天自制操作系统》 第一周(D1-D7) 笔记

2024-01-25 17:52

本文主要是介绍《30天自制操作系统》 第一周(D1-D7) 笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:这是我2023年5月份做的一个小项目,最终是完成了整个OS。笔记的话,只记录了第一周。想完善,却扔在草稿箱里许久。最终决定,还是发出来存个档吧。

一、汇编语言

基础指令

  • MOV: move赋值,数据传送指令。一个规则:源数据和目的数据必须位数相同。该指令的数据传送源和传送目的地,不仅可以是寄存器或常数,而且可以是内存地址
  • ADD: add加,演算指令
  • CMP: compare比较指令
  • JMP: jump/goto跳转,跳转到指定的内存地址(例如:JMP 0x7c50)
  • ORG: origin源头起点,程序要从指定的该地址开始
  • DB: define byte往文件里直接写入1个字节的指令,db小写功能相同;也可直接用它写字符串
  • RESB: reserve byte预留n个字节,空出地址上自动填充0x00

条件跳转指令

  • JE: jump if equal如果相等就跳转
  • JB: jump if below如果小于就跳转
  • JAE: jump if above or equal大于或等于时就跳转
  • JBE: jump if below or equal小于或等于时就跳转
  • JC: jump if carry如果进位标志是1就跳转
  • JNC: jump if not carry如果进位标志是0就跳转

其他指令

  • DW: define word16位,2字节
  • DD: define double-word32位,4字节
  • BYTE/WORD/DWORD: 保留字
  • DWORD: Double Word双字节数据类型,是指注册表的键值,每个word为2个字节的长度,DWORD 双字即为4个字节,每个字节是8位,共32位
  • entry: 入口,标签的声明,指定JMP指令的跳转目的地【汇编中,所有标号都是数字,其对应的数字由汇编语言编译器根据ORG指令计算出来】
  • EQU: equal声明常数
  • fin: finish结束
  • INT: interrupt中断,调用BIOS函数的指令
  • HLT: halt停止,让CPU停止动作的指令(进入待机状态),节能
  • CLI: clear interrupt flag中断标志置为0
  • STI: set interrupt flag中断标志置为1
  • EFLAGS: 存储进位标志和中断标志等标志的寄存器
  • PUSHFD: push flags double-word标志位的值按双字节长压入栈
  • POPFD: pop flags double-word标志位的值按双字节长从栈弹出
  • LGDT: 指定一个内存地址,从指定的地址【ESP+6】读取6个字节后赋值给GDTR寄存器(48位)
  • 将指定的段上限【存放在ESP+4】和地址值【ESP+8】赋值给名为GDTR的48位寄存器(低位放在内存地址小的字节里,前)
  • $: 这一行现在的字节数;若有ORG,代表将要读入的内存地址
  • []: 内存/主存,对于CPU,其为外部存储器

二、存储相关概念

缓冲区地址:从软盘上读出的数据装载到内存的哪个位置

EBX处理4G内存,32位基址寄存器

起辅助作用的段寄存器:MOV AL,[ES:BS] 代表ES*16+BX的内存地址

先用附加段寄存器指定一个大致的地址,然后再用基址寄存器来指定其中一个具体地址

可以默认省略数据段寄存器DS,DS必须预先指定为0:

例如

MOV CX,[1234] 等价于MOV CX,[DS:1234]

MOV AL,[SI]等价于MOV AL,[DS:AL]

指定处理的扇区数,范围在0x01-0xff(指定0x02以上的数值时,要特别注意能够连续处理多个扇区的条件。如果是FD的话,似乎不能跨越多个磁道,也不能超过64KB的界限)

读盘顺序:扇区-磁头-柱面

AH=0x02: 读盘

AH=0x03: 写盘

AH=0x04: 校验

AH=0x0c: 寻道

AL=处理对象的扇区数(只能同时处理连续的扇区)

CH=柱面号&0xff

CL=扇区号(0-5位)|(柱面号&0x300)>>2

DH=磁头号

DL=驱动器号

ES:BX=缓冲地址;(校验及寻道时不使用)

返回值:

FLAGS.CF: 进位标志

FLACG.CF==0: 没有错误,AH==0

FLAGS.CF==1: 有错误,错误号码存入AH内(与重置(reset)功能一样)

0x10(16号): 控制显卡

//显示一个字符
AH=0x0e;
AL=character code;
BH=0;
BL=color code;
返回值:无
//系统复位,复位软盘状态,再读一次
AH=0X00
DL=0X00
INT=0x13

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

一般向一个空软盘保存文件时,

1)文件名会写在0x002600以后的地方

2)文件的内容会写在0x004200以后的地方

img

如果与C语言联合使用,有的寄存器能自由使用:EAX/ECX/EDX,其他寄存器只能使用其值,不能改变其值

char *p;//用于BYTE类地址
short *p;//用于WORD类地址
int *p;//用于DWORD类地址

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

os思想:把操作和机制分开

三、术语

TAB=4: TAB键的宽度

FAT=12: 用Windows或MS-DOS格式化出来的软盘就是该格式

boot sector: 启动区,软盘的第一个扇区(512字节为1扇区),一张软盘共有2880个扇区

IPL: initial program loader启动程序加载器,必须取8字节的名字

boot: bootstrap启动,原指靴子上附带的便于拿取的靴带,自力更生完成任务

BIOS: basic input output system基本输入输出系统,组装在电脑主板的ROM(read only memory)单元里

0x00007c00-0x00007dff: 启动区内容的装载地址

地址空间:一个进程用于寻址内存的一套地址集合。主要用于解决多个应用程序同时处于内存中并且互不影响的问题——保护和重定位。

.com: 地址空间可以非数字,以.com结尾的网络域名的集合也是地址空间。

sys是system的缩写,就是系统的意思,sys是Windows的系统文件。如安装文件,日志文件,驱动文件,备份文件,操作如播放等文件,还有些垃圾文件等诸如此类。 都是这类sys后缀名的。

sys文件是驱动程序的可执行代码,其扩展名为.sys,驱动程序安装保持在windows/system32/drivers目录中。

在windows中文件的文件的路径是用反斜杠(\)表示(当初是为了和Unix的文件路径使用”/“区分开来),例如 C:\windows\system,但是我们在写程序的时候能不能再路径的字符串中写成C:\windows\system?答案是不能的,这一点想一下就会可以理解,在很多编译器中,“\”是一个转义字符,例如“\n,\r”等,如果在程序中写成“C:\windows\system“那么实际上编译出来的就是“C:windowssystem ",从而获取不到文件,但是这个路径可以写成C:\windows\system,或者也可以用正斜杠C:/windows/system,这两中方式都是可以的。说到这里,基本上这两种用法不会混淆了,只要记住”\“反斜杠有转义的功能,那么写路径的时候就不会出问题了。 顺便拓展一下,文件的相对路径和绝对路径: 例如一个绝对路径:C:\Windows\System\aaa.dll 如果当前目录是C:\windows 那么aaa.dll这个文件的地址可以表示为: ./system/aaa.dll 中”.“表示当前路径, …/windows/system/aaa.dll中”…“表示父级目录。

VGA显卡:VGA(Video Graphics Array)视频图形阵列是IBM于1987年提出的一个使用模拟信号的电脑显示标准。

sprintf: 只对内存进行操作,可应用于所有OS。不是按指定格式输出,只是将输出内容作为字符串写在内存中。能够不使用OS的任何功能。

分段:将4GB的内存分割,每一块的起始地址都看作0来处理

分页:paging,有多少个任务就要分多少页,还要对内存进行排序

GDT设定要优先于IDT

GDT: global (segment) descriptor table全局段号记录表。将这些数据整齐地排列在内存的某个地方,然后将内存的起始地址和有效设定个数放在CPU内被称作GDTR(global segment descriptor table register)的特殊寄存器中,设定完成。C语言里不能对GDTR赋值。

IDT: interrupt descriptor table中断记录表

中断功能:当CPU遇到外部状况变化,或者是内部偶然发生某些错误时,会临时切换过去处理这种突发事件。这就是中断功能。

要使用鼠标,就必须要使用中断。

各个设备有变化时就产生中断,中断发生后,CPU暂时停止正在处理的任务,并做好接下来能够继续处理的准备,转而执行中断程序。中断程序执行完后,再调用事先设定好的函数,返回处理中的任务。正是得益于中断机制,CPU可以一直不用查询键盘、鼠标、网卡等设备的状态,将精力集中在处理任务上。

这就是为什么每个操作前后要加中断标志的原因叭~

系统专用和应用程序用 等价于 内核模式和用户模式

PIC: programmable interrupt controller可编程中断控制器。将8个中断信号IRQ(interrupt request)集合成一个中断信号的装置。

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

PIC寄存器(8位)

IMR: interrupt mask register中断屏蔽寄存器。8位分别对应8路IRQ信号。如果该位值为1,对应IRQ信号被屏蔽,PIC忽视该路信号。理由:对中断设定进行更改时,如果再接受别的中断会引起混乱,所以要屏蔽;此外,还可以屏蔽静电干扰等。

ICW: initial control word初始化控制数据。(只有CPU里word指代16位,这里不一定)

OCW:操作命令字。OCW1写入奇地址口,OCW2、OCW3写入偶地址口。功能:PIC继续时刻监视IRQ信号中断是否发生。io_out8(PIC0_0CW2, 0x60+IDQ号码)

四、遇到的问题

描述问题1:模拟运行操作系统时,双击"!cons_9x.bat"启动失败。 解决方法:导致该问题的原因是我自己没有仔细看书上的标注,双击"!cons_nt.bat"重试后启动成功。原因是两个文件中的命令不同,"!cons_9x.bat"中命令为command,适合linux一类系统,而"!cons_nt.bat"中命令为cmd.exe适合我现在所用的windows系统。

问题2

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

人麻了,以为路径表示不对,跟着重新打了一遍一模一样的,最后发现是拼写失误!IMG写成ING了。

改了名称,一切正常。

网上跟我同一个报错的,但理由又是各不相同。

问题3数据也能执行吗?msg 机器语言也能显示吗?entry

不会报错,标号只是一个数字,但会错乱

不太懂以下的语句:

0A 0A——OR CL,[BP+SI]

68 65 6C——PUSH 0x6c65

问题4

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

问题5 无法生成sys文件

磁盘名称11字节

代码抄错,生成镜像文件时,一定要确保bin,sys, Makefile 同时存在

报错驱使我把代码看得更细

人才:把200写成了2OO,吐血

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

学会定位错误。添加新的中间文件makefile时,需要注意前后的连贯性,是否需要添加/增减

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

忘记声明全局变量了

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

问题可能出在makefile/naskfunc.nas/bootpack.c中

问题

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

使用32位寄存器需要你进入保护模式,进入保护的方法就是开A20 gate,我看下面几行的汇编应该就是在对CR0的这个位进行设置,从而进行快速A20。如果想使用64位寄存器,就必须在进入保护模式之后,开启长模式(long mode)。

uploading.4e448015.gif

正在上传…重新上传取消正在上传…重新上传取消

INSTRSET指令:告诉nask这个程序是给486使用的哦,nask会将EAX解释成寄存器名

486是英特尔系列的CPU【32位】

指定内存时,不知道是BYTE,WORD,DWORD,只有另一方也是寄存器的时候才能省略

p不是指针,而是地址变量,用于存放地址值

问题:如何显示字符

这个逻辑还是没有搞清楚

//extern char hankaku[4096]; why can delete?

//GDT的长度是怎么定的?0x270000-0x27ffff

问题:

第六天中的GB到底是什么?

1GB(Gigabyte)=1024MB

G:granularity颗粒度,单位的大小

4KB * 1M=4GB。1KB * 1M = 1GB。

问题: 为什么键盘输入需要缓冲区

缓冲区其实就是一块内存空间,它用在硬件设备和用户程序之间,用来缓存数据, 目的是让快速的CPU 不必等待慢速的输入输出设备,同时减少操作硬件的次数

_io_stihlt

汇编语言写的函数,链接到C语言使用时,一定要加_

根据CPU规范,机器语言的STI指令之后,如果紧跟着HLT指令,那么就暂不受理这两条指令之间的中断,而要等到HLT指令之后才受理,所以使用io_stihlt函数就能克服这一问题

最常出现的错误:can't link

关注细节语法错误,重点看中断部分

.h 和 naskfunc.nas

问题:

改善FIFO缓冲区,还存在E0问题

五、总结感悟

  • 头文件.h 和 makefile类正则匹配的共同目的:减少重复片段
  • 头文件.h的作用:类似目录
  • 报错首先检查笔误,再依次按关联度从高到低排查文件

这篇关于《30天自制操作系统》 第一周(D1-D7) 笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/644101

相关文章

30常用 Maven 命令

Maven 是一个强大的项目管理和构建工具,它广泛用于 Java 项目的依赖管理、构建流程和插件集成。Maven 的命令行工具提供了大量的命令来帮助开发人员管理项目的生命周期、依赖和插件。以下是 常用 Maven 命令的使用场景及其详细解释。 1. mvn clean 使用场景:清理项目的生成目录,通常用于删除项目中自动生成的文件(如 target/ 目录)。共性规律:清理操作

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

2024网安周今日开幕,亚信安全亮相30城

2024年国家网络安全宣传周今天在广州拉开帷幕。今年网安周继续以“网络安全为人民,网络安全靠人民”为主题。2024年国家网络安全宣传周涵盖了1场开幕式、1场高峰论坛、5个重要活动、15场分论坛/座谈会/闭门会、6个主题日活动和网络安全“六进”活动。亚信安全出席2024年国家网络安全宣传周开幕式和主论坛,并将通过线下宣讲、创意科普、成果展示等多种形式,让广大民众看得懂、记得住安全知识,同时还

Linux操作系统 初识

在认识操作系统之前,我们首先来了解一下计算机的发展: 计算机的发展 世界上第一台计算机名叫埃尼阿克,诞生在1945年2月14日,用于军事用途。 后来因为计算机的优势和潜力巨大,计算机开始飞速发展,并产生了一个当时一直有效的定律:摩尔定律--当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。 那么相应的,计算机就会变得越来越快,越来越小型化。

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓