字符数组与字符串区别
我们首先要知道的是,在C语言中是没有字符串这种数据类型的,所以,在这里我们所提到的字符串实际上是使用空字符 \0 结尾的一维字符数组。因此,\0 是用于标记字符串的结束。
需要注意的是,字符串一定是一个char的数组,但是char的数组未必是字符串;如果char数组没有以数字0结尾,那么就不是一个字符串,只是普通字符数组;所以字符串是一种特殊的 char 的数组。
其字符串在内存中的表示如图所示:
空字符(Null character)又称结束符,缩写 NUL,是一个数值为 0 的控制字符,\0 是转义字符,意思是告诉编译器,这不是字符 0,而是空字符。
关于字符 ‘\0’ : '\0' 就是8位的00000000它于 0 等价,以其结尾的char数组就是一个字符串。并且,我们并不需要把 null 字符放在字符串常量的末尾。因为C 编译器会在初始化数组时,会自动把 \0 放在字符串的末尾。
下面我们看下这段知识与实际应用对应的代码吧:
#include <stdio.h> int main() { //以'\0'('\0'就是数字0)结尾的字符数组是字符串 char c2[] = { 'c', ' ', 'p', 'r', 'o', '\0'}; printf("c2 = %s\n", c2); //字符串处理以'\0'(数字0)作为结束符,后面的'h', 'l', 'l', 'e', 'o'不会输出 char c3[] = { 'c', ' ', 'p', 'r', 'o', '\0', 'h', 'l', 'l', 'e', 'o', '\0'}; printf("c3 = %s\n", c3); return 0; }
所以对于字符串来说,我们就将其看做一个特殊的数组来对待即可,不要将其想象的太过复杂了。
字符串的初始化
因为在C语言中没有字符串类型,所以我们使用字符数组去进行实现字符串的初始化。
1.不设定长度初始化
如果我们不设定字符串长度但进行初始化时,这时结尾将不会去自动添加0结束符,也就是你初始化的长度为多少,那么结果的长度就是多少。
例如:
char buf[] = { 'a', 'b', 'c' };
2. 指定长度初始化
如果我们在初始化数组时已经为数组指定长度了,那么我们后面没有赋值的元素,将会被自动补0。
就比如:
char buf2[100] = { 'a', 'b', 'c' }; char buf[1000]={“hello”};
两个数组没有赋值的元素将会被自动补0。
3.所有元素赋0
如果我们在初始化的时候想要将一个字符数组里面的元素全部初始化为0,那么我们就不用再去一个一个的输入了,这时我们只需要一个0即可,例如:
char buf3[100] = { 0 };
就是将buf3数组里的元素全部初始化为0。
总结代码:
#include <stdio.h> // C语言没有字符串类型,通过字符数组模拟 int main() { //不指定长度, 没有0结束符,有多少个元素就有多长 char buf[] = { 'a', 'b', 'c' }; printf("buf = %s\n", buf); //乱码 //指定长度,后面没有赋值的元素,自动补0 char buf2[100] = { 'a', 'b', 'c' }; printf("buf2 = %s\n", buf2); //所有元素赋值为0 char buf3[100] = { 0 }; return 0; }
注意:
1. 如果我们在初始化数组时,将中间的一个元素设置为了 "\0" 那么这个元素后面的元素将不会被输出,因为字符串遇到 "\0" 的时候会自动结束。
举例:
#include <stdio.h> // C语言没有字符串类型,通过字符数组模拟 int main() { char buf5[50] = { '1', 'a', 'b', '0', '7' }; printf("buf5 = %s\n", buf5); char buf6[50] = { '1', 'a', 'b', 0, '7' }; printf("buf6 = %s\n", buf6); char buf7[50] = { '1', 'a', 'b', '\0', '7' }; printf("buf7 = %s\n", buf7); return 0; }
运行结果:
通过上面的例子,不难看出,字符串在输出的时候,遇见 0(‘\0’)会自动结束,其后面的元素也就无法输出了。
2. 我们在使用'\0'时后面最好不要连着数字,因为有可能几个数字连起来刚好是一个转义字符
例如:
#include <stdio.h> // C语言没有字符串类型,通过字符数组模拟 int main() { char str[] = "\012abc"; printf("str == %s\n", str); return 0; }
'\ddd'是八进制字义字符,'\xdd'是十六进制转移字符;这里\012就相当于\n;所以就不难看出我们上题的输出结果了。
结果:
字符串的输入输出
由于字符串采用了'\0'标志,所以字符串的输入输出将变得简单方便。
#include <stdio.h> int main() { char str[100]; printf("input string1 : \n") ; scanf("%s", str) ; printf("output:%s\n", str) ; return 0; }
看上段代码,此代码也就是从键盘输入一个字符串并打印出来;但是呢,这段代码会出现一个问题, 这个问题就出现在这句语句上:scanf("%s", str); 因为scanf("%s", str);默认以空格分隔 ;也就是如果我们输入一串连续的字符串是没问题的,但是如果我们输入的字符串中间是有空格的,那么系统只会识别第一个空格前面的部分,并输出。
输出对比:
所以在这里我为大家介绍几个输入输出的函数,以遍大家可以更好的去对字符串进行操作。
gets()
gets()函数的功能是:从标准输入读入字符,并保存到s指定的内存空间,直到出现换行符或读到文件结尾为止。
其应照以下方法应用:
#include <stdio.h> char *gets(char *s);
其中s 表示字符串首地址 ;如果成功的话将会读入的字符串,否则返回NULL 。
在这里我们要分析一下gets(str)与scanf(“%s”,str)的区别:
gets(str)允许输入的字符串含有空格
scanf(“%s”,str)不允许含有空格
需要注意的是由于scanf()和gets()无法知道字符串s大小,必须遇到换行符或读到文件结尾为止才接收输入,因此容易导致字符数组越界(缓冲区溢出)的情况。我们在平时使用的时候一定要注意所开的空间,以避免出现这种情况。
fgets()
fgets()函数的功能是:从指定的文件内读入字符,保存到字符串所指定的内存空间,直到出现换行字符、读到文件结尾或是已读了(最大读取字符串长度-1)个字符为止,最后会自动加上字符 '\0' 作为字符串结束。
其应照以下方法应用:
#include <stdio.h> char *fgets(char *s, int size, FILE *stream);
其中: s表示字符串 ; size是指定最大读取字符串的长度; stream:文件指针,如果读键盘输入的字符串,固定写为stdin 。
返回值:
成功:成功读取的字符串
读到文件尾或出错: NULL 。
fgets()在读取一个用户通过键盘输入的字符串的时候,同时把用户输入的回车也做为字符串的一部分。通过scanf和gets输入一个字符串的时候,不包含结尾的“\n”,但通过fgets结尾多了“\n”。所以fgets()函数是安全的,不会存在缓冲区溢出的问题。
puts()
puts()函数的功能是标准设备输出s字符串,并且在输出完成后自动输出一个'\n'。
其应照以下方法应用:
#include <stdio.h> int puts(const char *s);
其中: s表示字符串首地址 。
返回值:
成功:非负数
失败:-1
fputs()
fputs()函数的功能是将str所指定的字符串写入到stream指定的文件中, 字符串结束符 '\0' 不写入文件。
其应照以下方法应用:
#include <stdio.h> int fputs(const char * str, FILE * stream);
其中 str表示字符串 ; stream表示文件指针,如果把字符串输出到屏幕,固定写为stdout
返回值:
成功:0
失败:-1
fputs()是puts()的文件操作版本,只不过fputs()不会自动输出一个'\n'。
strlen()
strlen()的功能是计算指定指定字符串s的长度,不包含字符串结束符‘\0’ 。
其应照以下方法应用:
#include <string.h> size_t strlen(const char *s);
其中 s 表示字符串首地址
返回值:
将返回字符串s的长度,size_t为unsigned int类型
字符串强化训练
到这里我们字符串的相关知识也了解的差不多了,这里我们通过一个字符串追加的例子,来为大家强化训练一下字符串相关知识。
在这个例子中,需要我们对两个字符数组初始化,之后将两个字符数组合并后再输出,也就是将两个字符串合并为一个字符串,也可以理解为将第二个字符串追加到第一个字符串的上面。
具体思路:
我们在试图解决这个题目的时候,要合理的去运用数组的知识,毕竟我们前面提到了,字符串就是一个特殊的数组。首先,我们可以设出三个数组,其中两个已经完成初始化,有一个作为我们最终的输出数组。对于两个初始化的数组,我们将第一个数组中的每个元素,利用循环,将其搬运到最终数组上,知道遇到 '\0' 时切换到第二个数组,同理,这样最后我们只需要按顺序输出第三个数组里面的元素即可。
其代码:
#include <stdio.h> int main() { char str1[] = "abcdef"; char str2[] = "123456"; char dst[100]; int i = 0; while (str1[i] != 0) //判断第一个字符串是否到结尾 { dst[i] = str1[i]; //将第一个字符串的元素一一对应到最终数组上 i++; } int j = 0; while (str2[j] != 0) //判断第二个字符串是否到结尾 { dst[i + j] = str2[j]; //将第二个字符串的元素一一对应到最终数组上 j++; } dst[i + j] = 0; //字符串结束符 printf("dst = %s\n", dst); //直接输即可 return 0; }
运行结果:
好啦,到了这里我们字符串相关知识就讲解的差不多了,希望你可以听懂,当然如果有什么不会的可以随时在评论区提问,我看到后会第一时间解答的。