在 C++ 中标记字符串与getline() 函数和字符数组

简介: 对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个

「这是我参与11月更文挑战的第18天,活动详情查看:2021最后一次更文挑战

在 C++ 中标记字符串


对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个:


使用字符串流


一个字符串流与允许你从字符串,就好像它是一个流中读取流的字符串对象关联。


下面是 C++ 实现:


#include <bits/stdc++.h>
using namespace std;
int main()
{
  string line = "juejin is a must try";
  vector <string> tokens;
  stringstream check1(line);  
  string intermediate;
  while(getline(check1, intermediate, ' ')){
    tokens.push_back(intermediate);
  }
  for(int i = 0; i < tokens.size(); i++)
    cout << tokens[i] << '\n';
}
复制代码


输出

juejin
is
a
must
try
复制代码

使用strtok()


// 根据给定的分隔符拆分 string[]。 并返回下一个令牌。 它需要在循环中调用以获取所有令牌。 当没有更多标记时,它返回 NULL。
char * strtok(char str[], const char *delims); 
复制代码


下面是 C++ 实现:

#include <stdio.h>
#include <string.h>
int main(){
  char str[] = "juejin-for-juejin";
  char *token = strtok(str, "-");
  while (token != NULL){
    printf("%s\n", token);
    token = strtok(NULL, "-");
  }
  return 0;
}
复制代码


输出

juejin
for
juejin
复制代码

strtok() 的另一个例子:


#include <string.h>
#include <stdio.h>
int main(){
  char gfg[100] = " juejin - for - juejin - Contribute";
  const char s[4] = "-";
  char* tok;
  tok = strtok(gfg, s);
  while (tok != 0) {
    printf(" %s\n", tok);
    tok = strtok(0, s);
  }
  return (0);
}
复制代码


输出


juejin 
for 
juejin
Contribute
复制代码

使用strtok_r()


就像 C 中的 strtok() 函数一样,strtok_r() 执行相同的任务,将字符串解析为标记序列。strtok_r() 是 strtok() 的可重入版本。


我们可以通过两种方式调用 strtok_r()


下面是一个简单的 C++ 程序来展示 strtok_r() 的使用:


#include<stdio.h>
#include<string.h>
int main(){
  char str[] = "juejin for juejin";
  char *token;
  char *rest = str;
  while ((token = strtok_r(rest, " ", &rest)))
    printf("%s\n", token);
  return(0);
}
复制代码


输出


juejin
for
juejin
复制代码

使用 std::sregex_token_iterator


在这种方法中,标记化是在正则表达式匹配的基础上完成的。更适合需要多个分隔符的用例。


下面是一个简单的 C++ 程序,用于展示 std::sregex_token_iterator 的使用:


#include <iostream>
#include <regex>
#include <string>
#include <vector>
std::vector<std::string> tokenize(const std::string str,const std::regex re){
  std::sregex_token_iterator it{ str.begin(),str.end(), re, -1 };
  std::vector<std::string> tokenized{ it, {} };
  tokenized.erase(std::remove_if(tokenized.begin(),tokenized.end(),[](std::string const& s) {
            return s.size() == 0;
            }),
  tokenized.end());
  return tokenized;
}
int main(){
  const std::string str = "将 字符串 分隔,为,空格,和逗号";
  const std::regex re(R"([\s|,]+)");
  const std::vector<std::string> tokenized = tokenize(str, re);
  for (std::string token : tokenized) std::cout << token << std::endl;
  return 0;
}
复制代码


输出


字符串
分隔
空格
和逗号
复制代码

getline() 函数和字符数组


在C++中,流类支持面向行的函数,getline()和write()分别执行输入和输出功能。


getline() 函数读取以新行结尾或直到达到最大限制的整行文本。getline() 是 istream 类的成员函数,语法如下:


//(缓冲区,流大小,分隔符)
istream& getline(char*, int size, char='\n')
// 分隔符被视为'\n'
istream& getline(char*, int size)
复制代码


该函数执行以下操作:


  1. 提取字符直到分隔符。

  2. 将字符存储在缓冲区中。

  3. 提取的最大字符数为 size – 1。注意终止符(或分隔符)可以是任何字符(如' '、'、' 或任何特殊字符等)。终止符被读取但不保存到缓冲区中,而是由空字符替换


// 用字符数组显示 getline() 的 C++ 程序
#include <iostream>
using namespace std;
int main()
{
  char str[20];
  cout << "Enter Your Name::";
  // 查看 getline() 与数组 str 的使用也将上述语句替换为 cin >> str 并查看输出的差异
  cin.getline(str, 20);
  cout << "\n你的名字是: " << str;
  return 0;
}
复制代码


输入 :


鲸落
复制代码


输出 :


你的名字是: 鲸落
复制代码


在上面的程序中,语句 cin.getline(str, 20) 读取字符串,直到遇到换行符或最大字符数(此处为 20)。尝试具有不同限制的函数并查看输出。



目录
相关文章
|
11天前
|
存储 算法 搜索推荐
【C++面向对象——群体类和群体数据的组织】实现含排序功能的数组类(头歌实践教学平台习题)【合集】
1. **相关排序和查找算法的原理**:介绍直接插入排序、直接选择排序、冒泡排序和顺序查找的基本原理及其实现代码。 2. **C++ 类与成员函数的定义**:讲解如何定义`Array`类,包括类的声明和实现,以及成员函数的定义与调用。 3. **数组作为类的成员变量的处理**:探讨内存管理和正确访问数组元素的方法,确保在类中正确使用动态分配的数组。 4. **函数参数传递与返回值处理**:解释排序和查找函数的参数传递方式及返回值处理,确保函数功能正确实现。 通过掌握这些知识,可以顺利地将排序和查找算法封装到`Array`类中,并进行测试验证。编程要求是在右侧编辑器补充代码以实现三种排序算法
27 5
|
3月前
|
程序员 C++ 容器
在 C++中,realloc 函数返回 NULL 时,需要手动释放原来的内存吗?
在 C++ 中,当 realloc 函数返回 NULL 时,表示内存重新分配失败,但原内存块仍然有效,因此需要手动释放原来的内存,以避免内存泄漏。
|
3月前
|
存储 前端开发 C++
C++ 多线程之带返回值的线程处理函数
这篇文章介绍了在C++中使用`async`函数、`packaged_task`和`promise`三种方法来创建带返回值的线程处理函数。
126 6
|
3月前
|
C++
C++ 多线程之线程管理函数
这篇文章介绍了C++中多线程编程的几个关键函数,包括获取线程ID的`get_id()`,延时函数`sleep_for()`,线程让步函数`yield()`,以及阻塞线程直到指定时间的`sleep_until()`。
53 0
|
3月前
|
编译器 C语言 C++
C++入门3——类与对象2-2(类的6个默认成员函数)
C++入门3——类与对象2-2(类的6个默认成员函数)
43 3
|
3月前
|
编译器 C语言 C++
详解C/C++动态内存函数(malloc、free、calloc、realloc)
详解C/C++动态内存函数(malloc、free、calloc、realloc)
590 1
|
3月前
|
存储 编译器 C++
C++入门3——类与对象2-1(类的6个默认成员函数)
C++入门3——类与对象2-1(类的6个默认成员函数)
60 1
|
3月前
|
编译器 C语言 C++
C++入门6——模板(泛型编程、函数模板、类模板)
C++入门6——模板(泛型编程、函数模板、类模板)
79 0
C++入门6——模板(泛型编程、函数模板、类模板)
|
3月前
|
缓存 网络协议 API
C/C++ StringToAddress(字符串转 boost::asio::ip::address)
通过上述步骤和示例代码,你可以轻松地在C++项目中实现从字符串到 `boost::asio::ip::address`的转换,从而充分利用Boost.Asio库进行网络编程。
118 0
|
11天前
|
C++ 芯片
【C++面向对象——类与对象】Computer类(头歌实践教学平台习题)【合集】
声明一个简单的Computer类,含有数据成员芯片(cpu)、内存(ram)、光驱(cdrom)等等,以及两个公有成员函数run、stop。只能在类的内部访问。这是一种数据隐藏的机制,用于保护类的数据不被外部随意修改。根据提示,在右侧编辑器补充代码,平台会对你编写的代码进行测试。成员可以在派生类(继承该类的子类)中访问。成员,在类的外部不能直接访问。可以在类的外部直接访问。为了完成本关任务,你需要掌握。
51 18