【C++】vector的基本使用

简介: 【C++】vector的基本使用

66b8b35192684b30be7fd99a5416180c.jpeg

一、vector和string的联系与不同


1.

vector底层也是用动态顺序表实现的,和string是一样的,但是string默认存储的就是字符串,而vector的功能较为强大一些,vector不仅能存字符,理论上所有的内置类型和自定义类型都能存,vector的内容可以是一个自定义类型的对象,也可以是一个内置类型的变量。


2.

vector在使用时需要进行类模板的实例化,因为传递的模板参数不同,则vector存储的元素类型就会有变化,所以在使用vector的时候要进行类模板的显式实例化。

类模板的第二个参数是空间配置器,这个学到后面再说,而且这个参数是有缺省值的,我们只用这个缺省值就欧克了,所以在使用vector时,只需要关注第一个参数即可。

8bb50e819ff247999f75d306f57e3a6d.png


void test_vector1()
{
  string s;
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.push_back(4);
  //string和vector底层都是用数组实现的,所以他们都支持迭代器、范围for、下标+[]的遍历方式
  for (size_t i = 0; i < v.size(); i++)
  {
    cout << v[i] << " ";//string和vector的底层都是数组,所以可以使用[],但list就不能使用[]了,所以万能的方法是迭代器。
  }
  cout << endl;
  vector<int>::iterator it = v.begin();//iterator实际是某种类型的重定义,在使用时要指定好类域。
  while (it != v.end())
  {
    cout << *it << " ";
    ++it;
  }
  cout << endl;
  for (auto e : v)//不就是迭代器吗?
  {
    cout << e << " ";
  }
  cout << endl;
  cout << v.max_size() << endl;//int是10亿多,因为int占4个字节,42亿÷4。
  cout << s.max_size() << endl;//max_size的大小是数据的个数,我的编译器的char是21亿多。不用管他,这接口没价值。
  //vector<char> vstr;
  //string str;
  //vector<char>不能替代string,即使两者都是字符数组也不行,因为string有\0
}


二、vector的扩容操作

1.resize() (缺省值为匿名对象)&& reserve()


1.

对于string和vector,reserve和resize是独有的,因为他们的底层都是动态顺序表实现的,list就没有reserve和resize,因为他底层是链表嘛。


2.

对于reserve这个函数来说,官方并没有将其设定为能够兼容实现缩容的功能,明确规定这个函数在其他情况下,例如预留空间要比当前小的情况下,这个函数的调用是不会引起空间的重新分配的,也就是说容器vector的capacity是不会被影响的。


9486880d3ebf45249fa8644f267267e3.png

3.

有的人可能认为缩容只要丢弃剩余的空间就好了,但其实没有那么简单,你从C语言阶段free空间不能分两次free进行释放就可以看出来,一块已经申请好的空间就是一块儿独立的个体,不能说你保留空间的一部分丢弃剩余的一部分,这样是不行的,本质上和操作系统的内存管理有关系,如果对这部分知识有兴趣,可以下去研究一下。


4.

但值得注意的是缩容表面看起来是降低了空间的使用率,想要提高程序的效率,但实际上并未提高效率,缩容是需要异地缩容的,需要重新开空间和拷贝数据,代价不小,所以平常不建议对空间进行缩容。

59af1d21f2834a349485c1d9ea7f6c2c.png


5.

vector的resize和string的resize同样具有三种情况,但vector明显功能比string要更健壮一些,string类型只能针对于字符,而vector在使用resize进行初始化空间数据时,对内置类型和自定义类型均可以调用对应的拷贝构造来初始化,所以其功能更为健壮,默认将整型类型初始化为0,指针类型初始化为空指针。

f16edd1972e946a0a14dde602c58aaee.png

void test_vector2()
{
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.push_back(4);
  v.push_back(5);
  //resize和reserve对于vector和string是独有的,对于list而言,就没有reserve和resize
  cout << v.capacity() << endl;
  v.reserve(10);
  cout << v.capacity() << endl;
  v.reserve(4);
  cout << v.capacity() << endl;//并不会缩容,缩容并不会提高效率,缩容是有代价的,某种程度上就是以空间换时间。
  v.resize(8);//int、指针这些内置类型的默认构造就把他们初始化为0和空指针这些。
  v.resize(15, 1);
  v.resize(3);//不缩容,也是采用惰性删除的方式,将size调整为3就可以了,显示数组内容的时候按照size大小显示就可以了。
}


2.reserve在g++和vs上的扩容机制


1.
在vs上扩容机制采用1.5倍的大小,g++上采用2倍的大小,对于空间的扩容,如果开大了会造成空间浪费,开小了不够用,又会导致频繁扩容带来性能的损耗,而2倍的大小可以说是刚刚好,至于微软的工程师为什么选择1.5来进行扩容,是由于内存的某种对其因素导致。


9d1619e94f9e425bb27f9c9f02dfdff7.png

void test_vector_expand()//扩容机制大概是1.5倍进行扩容
{
  size_t sz;
  vector<int> v;
  //v.reserve(100);//已知开辟空间大小时,我们应该调用reserve来提前预留空间,进行扩容。
  sz = v.capacity();
  cout << "making v grow:\n";
  for (int i = 0; i < 100; ++i)
  {
    v.push_back(i);
    if (sz != v.capacity())
    {
      sz = v.capacity();
      cout << "capacity changed: " << sz << '\n';
    }
  }
}


3.reserve异地扩容和shrink_to_fit异地缩容的设计理念


1.

对于reserve的设计理念就是不去缩容,就算手动调用reserve进行缩容,编译器也不会理你,空间的大小始终都不会变,capacity的值一直是不动的,这样的设计理念本质上就是用空间来换时间,因为异地缩容需要开空间和拷贝数据,比较浪费时间。


2.

相反shrink_to_fit就是缩容函数,强制性的将capacity的大小降低到适配size大小的值,它的设计理念就是以空间来换时间,但日常人们所使用的手机或者PC空间实际上是足够的,不够的是时间,所以这种函数还是不要使用的为好,除非说你后面肯定不会插入数据了,不再进行任何modify操作,那你可以试着将空间还给操作系统,减少空间的使用率。

void test_vector7()
{
  vector<int> v;
  v.reserve(10);
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.push_back(4);
  v.push_back(5);
  cout << v.size() << endl;
  cout << v.capacity() << endl;
  //C++不会太推荐使用malloc来进行空间的初始化了,因为很有可能存在自定义类型对象没有初始化的问题,如果用new会自动调用构造。
  //设计理念就是不去缩容,因为异地缩容的代价很大,所以就算你用reserve或是resize调整大小以改变capacity,但编译器不会管你。
  // 因为它的设计理念不允许它这么做,而遇到shrink_to_fit就没辙了,因为他是缩容函数!!!
  //---不动空间,不去缩容,以空间换时间的设计理念,因为缩容虽然空间资源多了,但是时间就长了,为了提高时间,就用空间换。
  //shrink_to_fit就是反面的函数,进行了缩容。
  v.reserve(3);
  cout << v.size() << endl;
  cout << v.capacity() << endl;
  //设计理念:以时间换空间,一般缩容都是异地缩容,代价不小,一般不要轻易使用。通常情况下,我们是不缺空间的,缺的是时间。
  v.shrink_to_fit();//缩容函数,代价很大,通常的缩容的方式,就是找一块新的较小的空间,然后将原有数据拷贝进去
  v.resize(3);
  cout << v.size() << endl;
  cout << v.capacity() << endl;
  v.clear();//clear都是不动空间的
}


4.vector和malloc分别实现动态开辟的二维数组

杨辉三角


1.

对于C语言实现的话,需要一个返回值和两个输出型参数来返回到后台接口里面,第一个参数代表二维数组的大小,这道题我们知道返回的二维数组的大小,但其他题是有可能不知道的,而leetcode的后台测试用例是统一设计的,为了兼容其他不知道返回数组大小的题目,这里统一使用了输出型参数来控制。第二个参数的原因也是如此。


2.

二维数组、二维数组里面的元素、需要返回二维数组里面的一维数组的元素个数,这些数组都需要malloc出来。

//后台实现的地方:int returnSize=0;int returnColumnSizes[];
//grenerate(num,&returnSize,&returnColumnSizes);//函数调用
int** generate(int numRows, int* returnSize, int** returnColumnSizes) 
{
    int** p = (int**)malloc(numRows * sizeof(int*));
    *returnSize = numRows;
    *returnColumnSizes = (int*)malloc(sizeof(int) * numRows);
    for (int i = 0; i < numRows; i++)
    {
        p[i] = (int*)malloc(sizeof(int) * (i + 1));//给每一个二维数组的元素动态开辟一个空间
        (*returnColumnSizes)[i] = i + 1;
        p[i][0] = p[i][i] = 1;
        //for(int j = i; j < i + 1; j++)//条件控制有问题
        //for (int j = 0; j < i + 1 ; j++)
        for (int j = 1; j < i ; j++)
        {
            if (p[i][j]!=1)
            {
                p[i][j]=p[i-1][j-1]+p[i-1][j];
            }
        }
    }
    return p;
}


3.
对于vector来讲的话,动态开辟就不需要我们自己做,通过resize就可以控制容器的空间大小,不用malloc动态开辟了,所以对于动态开辟的二维数组来讲,vector实际上要简便许多。

class Solution {
public:
    vector<vector<int>> generate(int numRows) {
        vector<vector<int>> vv;
        vv.resize(numRows);
        //第二个参数不传就是匿名对象,会自动调用容器中元素的构造函数。内置类型或自定义类型的构造。
        for(size_t i=0; i<vv.size(); i++)
        {
            vv[i].resize(i+1, 0);//给每一个vector<int>容器预留好空间并进行初始化
            vv[i][0] = vv[i][vv[i].size() - 1] = 1;
        }
        for(int i=0; i<vv.size(); i++)
        {
            for(int j=0; j<vv[i].size(); j++)
            {
                if(vv[i][j]==0)
                {
                    vv[i][j]=vv[i-1][j]+vv[i-1][j-1];
                }
            }
        }
        return vv;
    }
};


三、vector的元素访问操作

1.operator[]和at对于越界访问的检查机制(一段经典的代码错误)


1.

下面所展示的代码是比较经典的错误,就是我们用reserve扩容之后,就利用[]和下标来进行容器元素的访问,扩容之后空间的使用权确实属于我们,但是operator[]的越界访问检查机制,导致了我们程序的崩溃,assert(pos<size),所以对于元素的访问,是要用resize来进行size的调整的,而reserve的主要作用是用来提前预留空间,在空间不够使用的情况下进行调用,所以这里使用的情景有些不搭。

c5f0aea07b0540b0ad9559ecdcd05c59.png


2.

对于at的使用,所采用的越界访问检查机制是抛异常,catch捕获异常之后,我们可以将异常信息打印出来,可以看到异常信息是无效的vector下标,指的也是所传下标是无用的,实际就是下标位置超过了size。


72816a63a8a448df849cae0b22d9cf8e.png

void test_vector4()
{
  vector<int> v;
  v.reserve(10);
  //这是一段经典的错误代码。reserve改变的是capacity主要解决的是插入数据时涉及到的扩容问题。
  //resize改变的是size,平常对于vector的容量增加,还是resize多一点,resize可以直接包揽reserve的活,并且除此之外还能初始化空间。
  for (size_t i = 0; i < 10; i++)
  {
    //v[i] = i;
    //对于[]的使用实际会有一个assert的越界断言的检查。assert(i<v.size()),你的下标不能超过size。
    //虽然reserve的确把空间开辟好了,你也能用这个空间,但是[]他有size和下标的越界检查,所以你的程序就会报错。
    //reserve=开空间+初始化(有默认值)
    v.at(i) = i;//抛异常
    //断言报错真正的问题是在于,release版本下面,断言就失效了,断言在release版本下面是不起作用的。
  }
}
int main()
{
  //test_vector1();
  //test_vector2();
  //test_vector_expand();
  try
  {
    //test_vector6();
  }
  catch (const exception& e)
  {//在这个地方捕获异常然后进行打印
    cout << e.what() << endl;//报错valid vector subscript,无效的vector下标
  }
  //test_vector4();
  //test_vector5();
  //test_vector6();
  test_vector7();
  //string算是STL的启蒙,string的源码我们就不看了
  return 0;
}


四、vector的修改操作

1.assign和迭代器的配合使用


1.

assign有两种使用方式,一种是用n个value来进行容器元素的覆盖,一种是用迭代器区间的元素来进行容器元素的覆盖,这里的迭代器采用模板形式,因为迭代器类型不仅仅可能是vector类型,也有可能是其他容器类型,所以这里采用模板泛型的方式。

5fccef2181684fd0b639d140ed16fe77.png



2.
而且迭代器使用起来实际是非常方便的,由于vector的底层是连续的顺序表,所以我们可以通过指针±整数的方式来控制迭代器赋值的区间,所以采用迭代器作为参数是非常灵活的。

void test_vector5()
{
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
  //void assign(size_type n, const value_type & val);前后类型分别为size_t和模板参数T的类型typedef,那就是int类型
  v.assign(10, 1);
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
  vector<int> v1;
  v1.push_back(10);
  v1.push_back(20);
  v1.push_back(30);
  //template <class InputIterator> void assign(InputIterator first, InputIterator last);
  v.assign(v1.begin(), v1.end());
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
  string str("hello world");
  v.assign(str.begin(), str.end());//assign里面的迭代器类型是不确定的,既有可能是他自己的iterator也有可能是其他容器的迭代器类型。
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
  v.assign(++str.begin(), --str.end());//你可以控制迭代器的区间,指定assign的容器元素内容的长度。
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
}


2.insert和find的配合使用


1.

对于顺序表这种结构来说,头插和头删的效率是非常低的,所以vector只提供了push_back和pop_back,而难免遇到头插和头删的情况时,可以偶尔使用insert和erase来进行头插和头删,并且insert和erase的参数都使用了迭代器类型作为参数,因为迭代器更具有普适性。


2.

如果要在vector的某个位置进行插入时,肯定是需要使用find接口的,但其实vector的默认成员函数并没有find接口,这是为什么呢?因为大多数的容器都会用到查找接口,也就是find,所以C++直接将这个接口放到算法库里面去了,实现一个函数模板,这个函数的实现实际也比较简单,只要遍历一遍迭代器然后返回对应位置的迭代器即可,所以这个函数不单独作为某个类的成员函数,而是直接放到了算法库里面去。

2144a3f89aa542baae0a701c2eb2b5bf.png


void test_vector6()//测试insert和find
{
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  v.insert(v.begin(), 4);
  v.insert(v.begin() + 2, 4);
  //vector的迭代器能够直接+2,源自于vector的底层是连续的空间,迭代器也就是连续的,而list的底层不是连续空间,而是一个个的节点,
  //所以迭代器就不能++来进行使用了
  //如果要在vector里面的数字3位置插入一个元素的话:std::find,find的实现就是遍历一遍迭代器,找到了就返回对应位置的迭代器。
  //而vector、list、deque等容器都会用到find,所以find直接实现一个模板即可。
  vector<int>::iterator it = std::find(v.begin(), v.end(), 3);
  //string没有实现find的原因是string不仅仅要找某一个字符,而且还要找一个字串,所以算法库的find就不怎么适用,string就自己造轮子
  v.insert(it, 30);
  for (auto e : v)
  {
    cout << e << " ";
  }
  cout << endl;
}


3.类外、类内、算法库的3个swap


1.

vector类内的swap用于两个对象的交换,在swap实现里面再调用std的swap进行内置类型的交换,但C++用心良苦,如果你不小心使用的格式是std里面的swap格式的话,也没有关系,因为类外面有一个匹配vector的swap,所以会优先调用类外的swap,C++极力不想让你调用算法库的swap,就是因为如果交换的类型是自定义类型的情况下,算法库的swap会进行三次深拷贝,代价极大,所以为了极力防止你调用算法库的swap,C++不仅在类内定义了swap,在类外也定义了已经实例化好的swap,调用时会优先调用最匹配的swap。

void test_vector8()
{
  vector<int> v;
  v.push_back(1);
  v.push_back(2);
  v.push_back(3);
  vector<int> v1;
  v1.swap(v);
  swap(v1, v);//一不小心这样用呢?那也不会去调用算法库里面的三次深拷贝的swap
  //这里会优先匹配vector的类外成员函数,既然有vector作为类型实例化出来的swap函数模板,就没有必要调用算法库里面的模板进行实例化
  //template <class T, class Alloc>
  //void swap(vector<T, Alloc>&x, vector<T, Alloc>&y);
}


五、看源码时需要注意的问题


1.

看源码框架的方法:将类成员变量先抽出来,看一看成员函数的声明具体都实现了什么功能,如果想要看实现,那就去.c文件抽出来具体函数去看


2.

看某些书籍时的道理和看源码是一样的,要进行抽丝剥茧,不要想着第一遍就把看到的所有东西都弄回,如果你觉得这本书或源码非常不错,你可以多次反复的去看,要循序渐进的去学,一段时间之后,你的知识储备上来之后,可能再去看书籍或者源码又有新的不同的感受,所以不要想着一遍就把所有的东西都搞明白,第一遍弄懂个70%-80%就很不错,如果你想学扎实一点,那就增加遍数。






























相关文章
|
5月前
|
存储 编译器 C++
【C++】vector介绍+模拟实现
【C++】vector介绍+模拟实现
|
2月前
|
存储 编译器 C语言
【c++丨STL】vector的使用
本文介绍了C++ STL中的`vector`容器,包括其基本概念、主要接口及其使用方法。`vector`是一种动态数组,能够根据需要自动调整大小,提供了丰富的操作接口,如增删查改等。文章详细解释了`vector`的构造函数、赋值运算符、容量接口、迭代器接口、元素访问接口以及一些常用的增删操作函数。最后,还展示了如何使用`vector`创建字符串数组,体现了`vector`在实际编程中的灵活性和实用性。
96 4
|
1月前
|
存储 对象存储 C++
C++ 中 std::array<int, array_size> 与 std::vector<int> 的深入对比
本文深入对比了 C++ 标准库中的 `std::array` 和 `std::vector`,从内存管理、性能、功能特性、使用场景等方面详细分析了两者的差异。`std::array` 适合固定大小的数据和高性能需求,而 `std::vector` 则提供了动态调整大小的灵活性,适用于数据量不确定或需要频繁操作的场景。选择合适的容器可以提高代码的效率和可靠性。
74 0
|
1月前
|
存储 编译器 C语言
【c++丨STL】vector模拟实现
本文深入探讨了 `vector` 的底层实现原理,并尝试模拟实现其结构及常用接口。首先介绍了 `vector` 的底层是动态顺序表,使用三个迭代器(指针)来维护数组,分别为 `start`、`finish` 和 `end_of_storage`。接着详细讲解了如何实现 `vector` 的各种构造函数、析构函数、容量接口、迭代器接口、插入和删除操作等。最后提供了完整的模拟实现代码,帮助读者更好地理解和掌握 `vector` 的实现细节。
46 0
|
3月前
|
存储 C++ 索引
【C++打怪之路Lv9】-- vector
【C++打怪之路Lv9】-- vector
33 1
|
3月前
|
安全 测试技术 C++
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化2
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化
85 6
|
3月前
|
安全 测试技术 C++
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化1
【C++篇】从零实现 C++ Vector:深度剖析 STL 的核心机制与优化
108 7
|
3月前
|
编译器 C++
【C++】—— vector模拟实现
【C++】—— vector模拟实现
|
3月前
|
编译器 C语言 C++
【C++篇】解密 STL 动态之魂:全面掌握 C++ vector 的高效与优雅
【C++篇】解密 STL 动态之魂:全面掌握 C++ vector 的高效与优雅
70 3
|
3月前
|
C++
【C++】C++ STL探索:Vector使用与背后底层逻辑(三)
【C++】C++ STL探索:Vector使用与背后底层逻辑