本文主要是介绍【C++】C++ STL探索:Vector使用与背后底层逻辑,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
C++语法 | 相关知识点 | 可以通过点击 | 以下链接进行学习 | 一起加油! |
---|---|---|---|---|
命名空间 | 缺省参数与函数重载 | C++相关特性 | 类和对象-上篇 | 类和对象-中篇 |
类和对象-下篇 | 日期类 | C/C++内存管理 | 模板初阶 | String使用 |
String模拟实现 |
在string类文章中提及了STL容器间的接口是大差不差的,本篇将直接通过模拟实现Vector来讲解底层实现与使用。
🌈个人主页:是店小二呀
🌈C语言笔记专栏:C语言笔记
🌈C++笔记专栏: C++笔记
🌈初阶数据结构笔记专栏: 初阶数据结构笔记
🌈Linux笔记专栏: Linux笔记
🌈喜欢的诗句:无人扶我青云志 我自踏雪至山巅
文章目录
- 前文:vector介绍
- 一、模拟实现Vector准备工作
- 1.1 vector的成员对象
- 1.2 原生指针模拟迭代器
- 二、正式模拟实现Vector
- 2.1 构造函数
- 2.1.1 无参构造
- 2.1.2 vector迭代区间构造
- 2.1.3 初始化构造
- 2.2 拷贝构造
- 2.3 初始化列表
- 2.4 析构函数
- 2.5 operator[] 下标访问
- 2.6 swap 交换函数
- 2.7 operator= 赋值运算符重载
- 2.8 得到当前元素空间信息
- 2.8.1 size(有效元素个数)
- 2.8.2 capacity(当前空间容量)
- 2.9 reserve
- 2.9.1 第一版本:野指针问题
- 2.9.2 第二版本:浅拷贝问题
- 2.10 resize(重点常用)
- 2.10.1 const T& val = T()解释
- 2.11 单或多参数构造支持隐式类型转化
- 2.12 insert
- 2.12.1 insert使用
- 2.13 扩容前迭代器失效
- 2.14 erase
- 2.14.1 erase使用
- 2.14.2 验证迭代器失效
- 2.14.3缩容导致迭代器失效
- 2.15 push_back
- 2.16 pop_back
- 2.17 pop_back
- 2.18 empty 判断空
- 2.19 print_vector 打印数据
- 三、vector.h
前文:vector介绍
vector的文档介绍
- vector是表示可变大小数组的序列容器,底层是动态开辟顺序表
- vector插入新数据发生扩容,其做法是,分配一个新的数组,然后将全部元素移动到这个数组(单论时间,需要付出相对代价很高).每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小(不清楚这块空间剩余多少内存)
- vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大,不同的库采用不同的策略权衡空间的使用和重新分配。重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的
- 与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list和forward_list统一的迭代器和引用更
一、模拟实现Vector准备工作
在模拟实现vector过程中,为了避免跟库中vector发生冲突,需要创建个命名空间,在命名空间中实现vector。需要选择现实vector类模板去用于不同的类型(内置类型、自定义类型)
namespace vec
{template<class T>class vector{};
}
1.1 vector的成员对象
适用于不同类型的操作,可以通过模板参数列表的类型指针,去对不同类型进行访问和修改。
template<class T>class vector{public:typedef T* iterator;typedef const T* const_iterator;private:iterator _start = nullptr;iterator _finish = nullptr;iterator _end_of_storage = nullptr;};
成员说明:
- typedef T* iteratror:采用原生指针去模拟迭代器(不是真正的迭代器)
- _start:指向空间的第一个位置
- _finish:指向最后有效数据的位置
- _end_of _storage:指向空间的最后一个位置
1.2 原生指针模拟迭代器
template<class T>class vector{public:typedef T* iterator;typedef const T* const_iterator;iterator begin(){return _start;}iterator end(){return _finish;}const_iterator begin() const{return _start;}const_iterator end() const{return _finish;}private:iterator _start = nullptr;iterator _finish = nullptr;iterator _end_of_storage = nullptr;};
二、正式模拟实现Vector
2.1 构造函数
具体说明:allocator_type是内存配置器(内存池)和explicit这个阶段都不用去理会它。最经常使用是接口(1)和(4),其中(1)就当作是无参的构造,不用传什么值,就使用它的缺省值()
value_type()是模板参数列表实例化转化的T类型
2.1.1 无参构造
vector(){}
这里就算不显式写无参构造,编译器也会自动生成。从某种意义上无参构造不用写,但是我们需要实现拷贝构造,编译器就不会默认生成无参构造函数了。总之要显式写无参构造函数。
2.1.2 vector迭代区间构造
类模板的成员函数可以是函数模板
template<class InputIterator>vector(InputIterator fist, InputIterator last)
{while (fist != last){push_back(*fist);++fist;}
}
使用场景:
vector<int> v2(v1.begin()+1, v1.end()-1);
print_vector(v2);string str("abcd");
vector<int> v3(str.begin(), str.end());
print_vector(v3);
具体说明:在使用该接口时,需要注意不可以(--v1.begin(), --v1.end()
使用。这里begin()和end()函数是传值返回,返回临时对象具有常性,不能通过++或–修改临时对象
2.1.3 初始化构造
vector(size_t n, const T* val = T())
{reserve(n);for (size_t i = 0; i < n; i++){push_back(val);}
}
这段初始化构造逻辑是没有问题的,但是在调用过程可能会出现问题
首先给出三组数据,去使用初始化构造函数vector<int> v1(10, 1);print_vector(v1);vector<int> v2(10u, 1);print_vector(v2);vector<int> v3(10, 'a');print_vector(v3);
具体说明:在调用过程中会报出非法的间接寻址
错误,原因在于第一个实例化(就这个比较特别),调用的是函数模板,这里*first就会报错,想走捷径,发现掉坑里面。
vector<int> v1(10, 1)
参数部分都是整型类型,如果使用下面的初始化构造,需要int转化为size_t(发生隐式类型转化)。对于模板初始化函数而言,自动推导类型,对此上面更加匹配(那就报错哦)vector<int> v2(10u, 1)
参数部分都是无符号整数,有现成吃现成,就是调用第二个vector<int> v3(10, 'a')
参数部分是不同类型,自然调不动第一个函数,调用第二个函数,进行类型转化
解决措施:实现函数重载,特殊情况特殊处理
vector(size_t n, const T* val = T())
{reserve(n);for (size_t i = 0; i < n; i++){push_back(val);}
}
vector(int n, const T& val = T())
{reserve(n);for (int i = 0; i < n; i++){push_back(val);}
}
2.2 拷贝构造
vector(const vector<T>& v)
{//需要开一样大的空间reserve(v.capacity());for (auto& e : v){push_back(e);}
}
具体说明:这里可以采用string类拷贝构造方式,但是这个更加简洁。auto自动识别类型建议加&,如果T是自定义类型,就需要调用多次拷贝构造(深拷贝)
2.3 初始化列表
auto x = { 1,2,3,4,5,6 };
cout << typeid(x).name() << endl;
cout << sizeof(x) << endl;
输出结果:
class std::initializer_list<int>
当我们想实现像数组nums[5] = {12,3,4,5}
这样初始化,库提供初始化列表initializer_list
的方式满足了我们的需求。
其中vector类也包含了这种方式
- initializer_list y = {1,2,3,4,5};
- vector x = {1,2,3,4,5};
通过类模板在vector类中实现该功能
vector(initializer_list<T> il)
{reserve(il.size());for (auto& e : il){push_back(e);}
}
2.4 析构函数
~vector()
{delete[]_start;_start = nullptr;_finish = _end_of_storage = nullptr;
}
2.5 operator[] 下标访问
T& operator[](size_t pos)
{assert(pos <= size());return _start[pos];
}const T& operator[](size_t pos) const
{assert(pos <= size());return _start[pos];
}
具体说明:
- 下标加方括号仅限于物理逻辑连续的容器,比如:string、vector、list之类。
- 针对对象是否被const修饰,需要重载两个函数(可读可写,可读不可写)。使用引用返回,可以修改到实参和提高效率
2.6 swap 交换函数
void swap(vector<T>& v)
{std::swap(_start, v._start);std::swap(_start, v._start);std::swap(_start, v._start);
}
2.7 operator= 赋值运算符重载
//v2 = v1;vector<T>& operator=(vector<T> v){swap(v);return *this;}
说明:跟string是同一套流程,这里就直接选用优化现代写法版本
2.8 得到当前元素空间信息
2.8.1 size(有效元素个数)
size_t size() const
{//指针 - 指针return _finish - _start;
}
2.8.2 capacity(当前空间容量)
size_t capacity() const
{return _end_of_storage - _start;
}
说明:
- size是有效元素的个数,capacity是当前空间的容量
- 都是通过指针-指针得到的大小
2.9 reserve
2.9.1 第一版本:野指针问题
void reserve(size_t n)
{if (n > capacity()){T* tmp = new T[n];memcpy(tmp, _start, size(T) * n);delete[] _start;_start = tmp;_finish = tmp + size();_end_of_storage = tmp + n;}
}
不足之处:迭代器失效的问题,出现野指针_finish指向错误。在delete[] _start的时候,finish还在指向旧空间,导致调用size()得到数据错误。
解决办法:在销毁旧空间之前,提前保留size()的大小
void reserve(size_t n)
{if (n > capacity){T& tmp = new T[n];size_t size = size();memcpy(tmp, _statr, sizeof(T) * n);delete[] _start;_start = tmp;_finish = tmp + size;_end_of_storage = tmp + n;}
}
2.9.2 第二版本:浅拷贝问题
问题说明:这里memcpy是逐字节拷贝,属于浅拷贝。当T为自定义类型,使用memcpy进行浅拷贝操作,会指向同一块空间。
_str指向的空间没有拷贝,导致指向同一块空间,调用析构函数会造成野指针问题。
解决办法:
void reserve(size_t n)
{if (n > capacity()){size_t old_size = size();T* tmp = new T[n];//memcpy(tmp, _start, size(T) * n);for (size_t i = 0; i < old_size; i++){//自定义类型会赋值运算符重载tmp[i] = _start[i];}delete[] _start;_start = tmp;_finish = tmp + old_size;_end_of_storage = tmp +n ;}
}
这属于一种更加暴力的解法,直接将_start里面的数据拷贝过来
2.10 resize(重点常用)
//重点实现resize
void resize(size_t n, const T& val = T())
{//缩容if (n <= size()){//类似截断_finish = _start + n;}else{//提前扩容//大于capacity才起作用reserve(n);while (_finish < _start + n){*_finish = val;_finish++;}}
}
具体说明:虽然没有reserve这么多坑,但是有几个知识点值得我们注意。
2.10.1 const T& val = T()解释
- 对于T可能是内置类型或自定义类型,对于自定义类型不能通过简单常量作为缺省值,所以选择了T()调用构造函数作为缺省值最合适。
- 对于内置类型不是说没有构造函数这一说法吗?好的,内置类型被迫升级下。内置类型也有了自己的构造函数和析构函数(平常一般不使用),int就是0(char也是整型 ASCII码)、double就是0.0、指针就是空指针。
- 因为缺省值怎么给都不合理,只能用自身的构造(匿名对象实例化)
2.11 单或多参数构造支持隐式类型转化
string str="1111";//构造+拷贝构造-->优化 直接构造
const string& str1="1111";//构造临时对象,引用的是临时对象vector<string>v;
v.push_back(str);
v.push_back(string("2222"));
v.push_back("33333");
隐式类型+优化的情况:
vector<int> v1={1,2,3,4,5};vector<int> v2({1,2,3,4,5}) //直接构造
2.12 insert
2.12.1 insert使用
void insert(iterator pos, const T& val){assert(_start <= pos);assert(pos <= _finish);//考虑是否需要扩容//说明空间已经满了if (_finish == _end_of_storage){reserve(capacity() == 0 ? 4 : capacity() * 2);}//开始移动数据iterator it = _finish - 1;while (it >= pos){*(it + 1) = *it;it--;}*pos = val;_finish++;}
具体说明:使用迭代器去模拟实现insert比起string模拟实现,在 while (it >= pos)
没有pos为0的坑。涉及到开辟或销毁空间时,都有可能涉及到迭代器失效,对此都需要考虑到位。
2.13 扩容前迭代器失效
void test_vector()
{vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);v1.push_back(5);v1.push_back(6);v1.push_back(7);v1.push_back(8);print_vector(v1);vector<int>::iterator it = v1.begin() + 3;v1.insert(it, 40);print_vector(v1);cout << *it << endl;
}
问题:在进行insert操作后,迭代器it就会失效。
思考:在扩容接口中,不是解决迭代器失效的问题了吗?
具体说明:
在调用insert接口是it传参pos位置,而形参是实参的一份临时拷贝,那么需要传引用解决。一波未平一波又起,如果传引用
v2.insert(v2.begin(),11.11)
,这里v2.begin()
返回的是临时变量,不能通过引用来接收。没有给出解决办法,调用insert接口出现扩容操作,迭代器会失效,不要去使用
2.14 erase
2.14.1 erase使用
//迭代器实现erase
iterator erase(iterator pos)
{assert(_start <= pos);//删除不到_finish这个位置assert(pos < _finish);iterator it = pos+1;//it=pos+1=_finish就是最后一个位置while (it <= _finish){*(it - 1) = *(it);it++;}_finish--;return pos;
}
2.14.2 验证迭代器失效
接下来我将给出三个场景:都是关于删除偶数
第一个场景:没啥问题
vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);v1.push_back(5);vector<int>::iterator it = v1.begin();while (it != v1.end()){if (*it % 2 == 0){v1.erase(it);}++it;}
第二个场景:少删除
vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);v1.push_back(4);v1.push_back(5);vector<int>::iterator it = v1.begin();while (it != v1.end()){if (*it % 2 == 0){v1.erase(it);}++it;}
第三个场景:迭代器失效
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
v1.push_back(4);
关于上面出现的问题分析:
- 在erase的逻辑是通移动数据覆盖不需要的数据,达到删除的效果。逻辑上会跳过一个值,移动++可能会导致错过了一些值。
- 如果it++操作跳过end(),it就会一路向北,错过了判断条件
解决措施:
vector<int>::iterator it = v1.begin();
while (it != v1.end())
{if (*it % 2 == 0){v1.erase(it);}else{it++;}
}
print_vector(v1);
2.14.3缩容导致迭代器失效
上面解决措施在Linux下还可以,但是在Vs下就不行了。由于因为Vs下的iterator没有使用原生指针实现,是自定义类型的迭代器,内部会进行强制类型检查。
对于erase不同编译器迭代器是不同的,erase也可能会缩容。erase迭代器的解决方案有两个:迭代器失效以后不要直接使用,如果要使用按照规则重新更新后使用。
vector<int>::iterator it = v1.begin();while (it != v1.end()){if (*it % 2 == 0){it=v1.erase(it);}else{it++;}}
这样子就可以适应不同的版本,缩容以后。迭代器还是但会删除原生的下一个迭代器。
2.15 push_back
void push_back(const T& val )
{insert(end(), val);
}
2.16 pop_back
void pop_back()
{/*assert(!empty());--_finish;*/erase(end()-1);
}
2.17 pop_back
void pop_back()
{/*assert(!empty());--_finish;*/erase(end()-1);
}
2.18 empty 判断空
bool empty()
{return _start == _finish;
}
2.19 print_vector 打印数据
为了实现适用于不同类型的打印,这里需要涉及一个函数模板
void print_vector(const vector<T>& v)
{//下标加[]for (size_t i = 0; i < v.size(); i++){cout << v[i] << " ";}cout << endl;//迭代器vector<T>::const_iterator it = v.begin();while (it != v.end()){cout << *it << " ";++it;}cout << endl;//范围forfor (auto e : v){cout << e << " ";}cout << endl;、
}
不足之处:在三种遍历方式,使用迭代器遍历会出现报错。
问题在于: vector<T>
,这里类模板没有实例化,对于内嵌类型,那么不敢进去取,里面的东西也有没有实例化。编译器无法识别const_iterator
是静态变量还是内中类,选择报错。
vector类模板没有完成实例化,对于内嵌类型const_iterator
不敢进去取,对于内部是否实例。编译器无法编译器无法识别const_iterator
是静态变量还是内中类。编译器选择报错。
解决措施:编译器规定typename
告诉后面后面是一个类型,不是静态成员变量(先通过编译,之后再给你实例化)。在编译阶段才知道类型,如果需要一个类型接收,可以使用auto自动识别类型。
typename vector<T>::const_iterator it = v.begin();
auto it = v.begin();
while (it != v.end())
{cout << *it << " ";++it;
}
cout << endl;
三、vector.h
#pragma once
#include <assert.h>
#include <iostream>
#include <algorithm>using namespace std;
namespace bit
{template<class T>class vector{public:typedef T* iterator;typedef const T* const_iterator;iterator begin(){return _start;}iterator end(){return _finish;}const_iterator begin() const{return _start;}const_iterator end() const{return _finish;}//构造函数//无参构造vector(){}//有参构造//.....//析构~vector(){delete[]_start;_start = nullptr;_finish = _end_of_storage = nullptr;}//vector<int> v1={1,2,3,4,5,6};vector(initializer_list<T> il){reserve(il.size());for (auto& e : il){push_back(e);}}//拷贝构造//v2(v1)vector(const vector<T>& v){//需要开一样大的空间reserve(v.capacity());for (auto& e : v){push_back(e);}}//v2 = v1;vector<T>& operator=(vector<T> v){swap(v);return *this;}//通过下标访问//并且不知道会返回什么具体的类型T& operator[](size_t pos){//不能等于size(),指向\0assert(pos < size());return _start[pos];}const T& operator[](size_t pos) const{assert(pos < size());return _start[pos];}//交换void swap(vector<T>& v){std::swap(_start, v._start);std::swap(_start, v._start);std::swap(_start, v._start);}//得到当前元素空间信息//指针-指针size_t size() const{return _finish - _start;}size_t capacity() const{return _end_of_storage - _start;}//扩容//第一个问题,迭代器失效//void reserve(size_t n)//{// if (n > capacity())// {// T* tmp = new T[n];// memcpy(tmp, _start, size(T) * n);// delete[] _start;// _start = tmp;// _finish = tmpt + size();// _end_of_storage = tmp + n;// }//}改良第二个问题,当T为自定义类型,就是浅拷贝,但是还是指向同一块空间//void reserve(size_t n)//{// if (n > capacity())// {// size_t old_size = size();// T* tmp = new T[n];// memcpy(tmp, _start, size(T) * n);// delete[] _start;// _start = tmp;// _finish = tmp + old_size;// _end_of_storage = tmp + n;// }//}正确写法void reserve(size_t n){if (n > capacity()){size_t old_size = size();T* tmp = new T[n];//memcpy(tmp, _start, size(T) * n);for (size_t i = 0; i < old_size; i++){tmp[i] = _start[i];}delete[] _start;_start = tmp;_finish = tmp + old_size;_end_of_storage = tmp +n ;}}//vector的迭代区间//函数模板template<class InputIterator>vector(InputIterator fist, InputIterator last){while (fist != last){push_back(*fist);++fist;}}//初始化 构造vector(size_t n, const T& val = T()){reserve(n);for (size_t i = 0; i < n; i++){push_back(val);}}vector(int n, const T& val = T()){reserve(n);for (int i = 0; i < n; i++){push_back(val);}}//重点实现resizevoid resize(size_t n, const T& val = T()){//缩容if (n <= size()){_finish = _start + n;}else{//提前扩容//大于capacity才起作用reserve(n);while (_finish < _start + n){*_finish = val;_finish++;}}}//核心操作void push_back(const T& val ){insert(end(), val);}void pop_back(){/* assert(!empty());_finish--;*///不能--erase(end() - 1);}//判断空bool empty(){return _start == _finish;}//实现插入操作时,可能会涉及到扩容操作,就有可能出现迭代器失效的可能void insert(iterator pos, const T& val ){assert(_start <= pos);assert(pos <= _finish);//考虑是否需要扩容//说明空间已经满了if (_finish == _end_of_storage){size_t len = pos - _start;//这里迭代器失效的问题//不是解决了吗!当时pos没有解决呀!reserve(capacity() == 0 ? 4 : capacity() * 2);pos = _start + len;}//开始移动数据iterator it = _finish - 1;while (it >= pos){*(it + 1) = *it;it--;}*pos = val;_finish++;}//迭代器实现eraseiterator erase(iterator pos){assert(_start <= pos);//删除不到_finish这个位置assert(pos < _finish);iterator it = pos+1;//it=pos+1=_finish就是最后一个位置while (it <= _finish){*(it - 1) = *(it);it++;}_finish--;return pos;}private:iterator _start=nullptr;iterator _finish=nullptr;iterator _end_of_storage=nullptr;};// 函数模板template<class T>void print_vector(const vector<T>& v){//for (size_t i = 0; i < v.size(); i++)//{// cout << v[i] << " ";//}//cout << endl;//typename vector<T>::const_iterator it = v.begin();auto it = v.begin();while (it != v.end()){cout << *it << " ";++it;}cout << endl;/*for (auto e : v){cout << e << " ";}cout << endl;*/}void test1(){vector<int> v;v.push_back(12);v.pop_back();v.push_back(1);print_vector(v);}void test_vector2(){vector<int> v1(10, 1);print_vector(v1);vector<int> v2(10u, 1);print_vector(v2);vector<int> v3(10, 'a');print_vector(v3);}void test_vector3(){vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);v1.push_back(5);v1.push_back(6);v1.push_back(7);v1.push_back(8);print_vector(v1);vector<int>::iterator it = v1.begin() + 3;v1.insert(it, 40);print_vector(v1);cout << *it << endl;}void test_vector4(){auto x = { 1,2,3,4,5,6 };cout << typeid(x).name() << endl;cout << sizeof(x) << endl;}void test_vector5(){vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);v1.push_back(5);v1.push_back(4);//std::vector<int>::iterator it = v1.begin();vector<int>::iterator it = v1.begin();while (it != v1.end()){if (*it % 2 == 0){it=v1.erase(it);}else{it++;}}print_vector(v1);}
}
以上就是本篇文章的所有内容,在此感谢大家的观看!这里是店小二呀C++笔记,希望对你在学习C++语言旅途中有所帮助!
这篇关于【C++】C++ STL探索:Vector使用与背后底层逻辑的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!