【C语言】带你深入剖析字符串相关知识(详细讲解+源码展示)

简介: 笔记

字符数组与字符串区别


我们首先要知道的是,在C语言中是没有字符串这种数据类型的,所以,在这里我们所提到的字符串实际上是使用空字符 \0 结尾的一维字符数组。因此,\0 是用于标记字符串的结束。


需要注意的是,字符串一定是一个char的数组,但是char的数组未必是字符串;如果char数组没有以数字0结尾,那么就不是一个字符串,只是普通字符数组;所以字符串是一种特殊的 char 的数组。


其字符串在内存中的表示如图所示:

30.png



空字符(Null character)又称结束符,缩写 NUL,是一个数值为 0 的控制字符,\0 是转义字符,意思是告诉编译器,这不是字符 0,而是空字符。


关于字符 ‘\0’ : '\0' 就是8位的00000000它于 0 等价,以其结尾的char数组就是一个字符串。并且,我们并不需要把 null 字符放在字符串常量的末尾。因为C 编译器会在初始化数组时,会自动把 \0 放在字符串的末尾。


下面我们看下这段知识与实际应用对应的代码吧:

#include <stdio.h>
int main()
{
  //以'\0'('\0'就是数字0)结尾的字符数组是字符串
  char c2[] = { 'c', ' ', 'p', 'r', 'o', '\0'}; 
  printf("c2 = %s\n", c2);
  //字符串处理以'\0'(数字0)作为结束符,后面的'h', 'l', 'l', 'e', 'o'不会输出
  char c3[] = { 'c', ' ', 'p', 'r', 'o',  '\0', 'h', 'l', 'l', 'e', 'o', '\0'};
  printf("c3 = %s\n", c3);
  return 0;
}


所以对于字符串来说,我们就将其看做一个特殊的数组来对待即可,不要将其想象的太过复杂了。


字符串的初始化


因为在C语言中没有字符串类型,所以我们使用字符数组去进行实现字符串的初始化。


1.不设定长度初始化

如果我们不设定字符串长度但进行初始化时,这时结尾将不会去自动添加0结束符,也就是你初始化的长度为多少,那么结果的长度就是多少。


例如:

char buf[] = { 'a', 'b', 'c' };

2. 指定长度初始化

如果我们在初始化数组时已经为数组指定长度了,那么我们后面没有赋值的元素,将会被自动补0。


就比如:

char buf2[100] = { 'a', 'b', 'c' };
char buf[1000]={“hello”};

两个数组没有赋值的元素将会被自动补0。


3.所有元素赋0

如果我们在初始化的时候想要将一个字符数组里面的元素全部初始化为0,那么我们就不用再去一个一个的输入了,这时我们只需要一个0即可,例如:

char buf3[100] = { 0 };

就是将buf3数组里的元素全部初始化为0。


总结代码:


#include <stdio.h>
// C语言没有字符串类型,通过字符数组模拟
int main()
{
  //不指定长度, 没有0结束符,有多少个元素就有多长
  char buf[] = { 'a', 'b', 'c' };
  printf("buf = %s\n", buf);  //乱码
  //指定长度,后面没有赋值的元素,自动补0
  char buf2[100] = { 'a', 'b', 'c' };
  printf("buf2 = %s\n", buf2);
  //所有元素赋值为0
  char buf3[100] = { 0 };
  return 0;
}


注意:

1. 如果我们在初始化数组时,将中间的一个元素设置为了 "\0" 那么这个元素后面的元素将不会被输出,因为字符串遇到 "\0" 的时候会自动结束。


举例:


#include <stdio.h>
// C语言没有字符串类型,通过字符数组模拟
int main()
{
  char buf5[50] = { '1', 'a', 'b', '0', '7' };
  printf("buf5 = %s\n", buf5);
  char buf6[50] = { '1', 'a', 'b', 0, '7' };
  printf("buf6 = %s\n", buf6);
  char buf7[50] = { '1', 'a', 'b', '\0', '7' };
  printf("buf7 = %s\n", buf7);
  return 0;
}

运行结果:

31.png


通过上面的例子,不难看出,字符串在输出的时候,遇见 0(‘\0’)会自动结束,其后面的元素也就无法输出了。


2. 我们在使用'\0'时后面最好不要连着数字,因为有可能几个数字连起来刚好是一个转义字符


例如:

#include <stdio.h>
// C语言没有字符串类型,通过字符数组模拟
int main()
{
  char str[] = "\012abc";
  printf("str == %s\n", str);
  return 0;
}

'\ddd'是八进制字义字符,'\xdd'是十六进制转移字符;这里\012就相当于\n;所以就不难看出我们上题的输出结果了。


结果:

32.png



字符串的输入输出


由于字符串采用了'\0'标志,所以字符串的输入输出将变得简单方便。

#include <stdio.h>
int main()
{
  char str[100];
  printf("input string1 : \n") ;
  scanf("%s", str) ;
  printf("output:%s\n", str) ;
  return 0;
}

看上段代码,此代码也就是从键盘输入一个字符串并打印出来;但是呢,这段代码会出现一个问题, 这个问题就出现在这句语句上:scanf("%s", str); 因为scanf("%s", str);默认以空格分隔 ;也就是如果我们输入一串连续的字符串是没问题的,但是如果我们输入的字符串中间是有空格的,那么系统只会识别第一个空格前面的部分,并输出。


输出对比:


33.png34.png




所以在这里我为大家介绍几个输入输出的函数,以遍大家可以更好的去对字符串进行操作。


gets()

gets()函数的功能是:从标准输入读入字符,并保存到s指定的内存空间,直到出现换行符或读到文件结尾为止。


其应照以下方法应用:


#include <stdio.h>
char *gets(char *s);

其中s 表示字符串首地址 ;如果成功的话将会读入的字符串,否则返回NULL 。


在这里我们要分析一下gets(str)与scanf(“%s”,str)的区别:


gets(str)允许输入的字符串含有空格

scanf(“%s”,str)不允许含有空格

需要注意的是由于scanf()和gets()无法知道字符串s大小,必须遇到换行符或读到文件结尾为止才接收输入,因此容易导致字符数组越界(缓冲区溢出)的情况。我们在平时使用的时候一定要注意所开的空间,以避免出现这种情况。


fgets()

fgets()函数的功能是:从指定的文件内读入字符,保存到字符串所指定的内存空间,直到出现换行字符、读到文件结尾或是已读了(最大读取字符串长度-1)个字符为止,最后会自动加上字符 '\0' 作为字符串结束。


其应照以下方法应用:

#include <stdio.h>
char *fgets(char *s, int size, FILE *stream);

其中: s表示字符串 ; size是指定最大读取字符串的长度; stream:文件指针,如果读键盘输入的字符串,固定写为stdin 。  


返回值:


      成功:成功读取的字符串


      读到文件尾或出错: NULL 。


fgets()在读取一个用户通过键盘输入的字符串的时候,同时把用户输入的回车也做为字符串的一部分。通过scanf和gets输入一个字符串的时候,不包含结尾的“\n”,但通过fgets结尾多了“\n”。所以fgets()函数是安全的,不会存在缓冲区溢出的问题。


puts()

puts()函数的功能是标准设备输出s字符串,并且在输出完成后自动输出一个'\n'。


其应照以下方法应用:


#include <stdio.h>
int puts(const char *s);

其中: s表示字符串首地址 。


返回值:


      成功:非负数


      失败:-1


fputs()

fputs()函数的功能是将str所指定的字符串写入到stream指定的文件中, 字符串结束符 '\0'  不写入文件。


其应照以下方法应用:


#include <stdio.h>
int fputs(const char * str, FILE * stream);

 其中 str表示字符串 ; stream表示文件指针,如果把字符串输出到屏幕,固定写为stdout


返回值:


      成功:0


      失败:-1


fputs()是puts()的文件操作版本,只不过fputs()不会自动输出一个'\n'。


strlen()

strlen()的功能是计算指定指定字符串s的长度,不包含字符串结束符‘\0’ 。


其应照以下方法应用:


#include <string.h>
size_t strlen(const char *s);

其中 s 表示字符串首地址


返回值:


       将返回字符串s的长度,size_t为unsigned int类型


字符串强化训练


到这里我们字符串的相关知识也了解的差不多了,这里我们通过一个字符串追加的例子,来为大家强化训练一下字符串相关知识。


在这个例子中,需要我们对两个字符数组初始化,之后将两个字符数组合并后再输出,也就是将两个字符串合并为一个字符串,也可以理解为将第二个字符串追加到第一个字符串的上面。


具体思路:


我们在试图解决这个题目的时候,要合理的去运用数组的知识,毕竟我们前面提到了,字符串就是一个特殊的数组。首先,我们可以设出三个数组,其中两个已经完成初始化,有一个作为我们最终的输出数组。对于两个初始化的数组,我们将第一个数组中的每个元素,利用循环,将其搬运到最终数组上,知道遇到 '\0' 时切换到第二个数组,同理,这样最后我们只需要按顺序输出第三个数组里面的元素即可。


其代码:

#include <stdio.h>
int main()
{
  char str1[] = "abcdef";
  char str2[] = "123456";
  char dst[100];
  int i = 0;
  while (str1[i] != 0)  //判断第一个字符串是否到结尾 
  {
  dst[i] = str1[i]; //将第一个字符串的元素一一对应到最终数组上 
  i++;
  }
  int j = 0;
  while (str2[j] != 0)  //判断第二个字符串是否到结尾 
  {
  dst[i + j] = str2[j]; //将第二个字符串的元素一一对应到最终数组上 
  j++;
  }
  dst[i + j] = 0;  //字符串结束符
  printf("dst = %s\n", dst);  //直接输即可 
  return 0;
}


运行结果:

35.png



好啦,到了这里我们字符串相关知识就讲解的差不多了,希望你可以听懂,当然如果有什么不会的可以随时在评论区提问,我看到后会第一时间解答的。


相关文章
|
3天前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
45 9
|
1月前
|
存储 C语言
【C语言篇】深入理解指针3(附转移表源码)
【C语言篇】深入理解指针3(附转移表源码)
34 1
|
2天前
|
存储 搜索推荐 算法
【数据结构】树型结构详解 + 堆的实现(c语言)(附源码)
本文介绍了树和二叉树的基本概念及结构,重点讲解了堆这一重要的数据结构。堆是一种特殊的完全二叉树,常用于实现优先队列和高效的排序算法(如堆排序)。文章详细描述了堆的性质、存储方式及其实现方法,包括插入、删除和取堆顶数据等操作的具体实现。通过这些内容,读者可以全面了解堆的原理和应用。
32 16
|
2天前
|
C语言
【数据结构】二叉树(c语言)(附源码)
本文介绍了如何使用链式结构实现二叉树的基本功能,包括前序、中序、后序和层序遍历,统计节点个数和树的高度,查找节点,判断是否为完全二叉树,以及销毁二叉树。通过手动创建一棵二叉树,详细讲解了每个功能的实现方法和代码示例,帮助读者深入理解递归和数据结构的应用。
27 8
|
4天前
|
存储 C语言
【数据结构】手把手教你单链表(c语言)(附源码)
本文介绍了单链表的基本概念、结构定义及其实现方法。单链表是一种内存地址不连续但逻辑顺序连续的数据结构,每个节点包含数据域和指针域。文章详细讲解了单链表的常见操作,如头插、尾插、头删、尾删、查找、指定位置插入和删除等,并提供了完整的C语言代码示例。通过学习单链表,可以更好地理解数据结构的底层逻辑,提高编程能力。
26 4
|
6天前
|
存储 C语言
【数据结构】顺序表(c语言实现)(附源码)
本文介绍了线性表和顺序表的基本概念及其实现。线性表是一种有限序列,常见的线性表有顺序表、链表、栈、队列等。顺序表是一种基于连续内存地址存储数据的数据结构,其底层逻辑是数组。文章详细讲解了静态顺序表和动态顺序表的区别,并重点介绍了动态顺序表的实现,包括初始化、销毁、打印、增删查改等操作。最后,文章总结了顺序表的时间复杂度和局限性,并预告了后续关于链表的内容。
24 3
|
4天前
|
C语言
【数据结构】双向带头循环链表(c语言)(附源码)
本文介绍了双向带头循环链表的概念和实现。双向带头循环链表具有三个关键点:双向、带头和循环。与单链表相比,它的头插、尾插、头删、尾删等操作的时间复杂度均为O(1),提高了运行效率。文章详细讲解了链表的结构定义、方法声明和实现,包括创建新节点、初始化、打印、判断是否为空、插入和删除节点等操作。最后提供了完整的代码示例。
18 0
|
29天前
|
C语言 定位技术 API
【C语言】实践:贪吃蛇小游戏(附源码)(二)
【C语言】实践:贪吃蛇小游戏(附源码)
【C语言】实践:贪吃蛇小游戏(附源码)(二)
|
1月前
|
C语言 C++
【C语言】解决不同场景字符串问题:巧妙运用字符串函数
【C语言】解决不同场景字符串问题:巧妙运用字符串函数
|
29天前
|
C语言
【C语言】实践:贪吃蛇小游戏(附源码)(三)
【C语言】实践:贪吃蛇小游戏(附源码)