- level 1:语法基础课
第 5 讲 字符串
- 2023-8-2 16:13:48 @
字符串是计算机与人类沟通的重要手段
1. 字符与整数的联系 —— 码
每个常用字符都对应一个 ~ 的数字,二者之间可以相互转化。
注意:目前负数没有与之对应的字符。(循环打表看字符)
#include <bits/stdc++.h>
using namespace std;
int main()
{
char c = 'a';
cout << (int)c << endl;
int a = 66;
cout << (char)a << endl;
return 0;
}
常用ASCII值:'A'- 'Z'
是 65 ~ 90
,'a' - 'z'
是 97 - 122
,0 - 9
是 48 - 57
。 (大小写相差 )
字符可以参与运算,运算时会将其当做整数,只有输出时才是字符:
#include <bits/stdc++.h>
using namespace std;
int main()
{
int a = 'B' - 'A';
int b = 'A' * 'B';
char c = 'A' + 2;
cout << a << endl;
cout << b << endl;
cout << c << endl;
return 0;
}
练习:输入一行字符,统计出其中数字字符的个数,以及字母字符的个数。
#include <bits/stdc++.h>
using namespace std;
int main()
{
char c;
int nums = 0, chars = 0;
while (cin >> c)
{
if (c >= '0' && c <= '9') nums ++ ;
else if (c >= 'A' && c <= 'Z' || c >= 'a' && c <= 'z') chars ++ ;
}
printf("nums: %d\nchars: %d\n", nums, chars);
return 0;
}
2. 字符数组
字符串就是字符数组加上结束符 '\0'。
可以使用字符串来初始化字符数组,但此时要注意,每个字符串结尾会暗含一个 '\0' 字符,因此字符数组的长度至少要比字符串的长度多 !
#include <bits/stdc++.h>
using namespace std;
int main()
{
char a1[] = {'C', '+', '+'}; // 列表初始化,没有空字符
char a2[4] = {'C', '+', '+', '\0'}; // 列表初始化,含有显示的空字符
char a3[4] = "C++"; // 自动添加表示字符串结尾的空字符
char a4[6] = "Daniel"; // 错误:没有空间可以存放空字符
cout << sizeof a3 << endl; // 第2、3种初始化是等价的,长度均为4
return 0;
}
2.1 字符数组的输入输出:
#include <bits/stdc++.h>
using namespace std;
int main()
{
char str[100];
cin >> str; // 输入字符串时,遇到空格或者回车就会停止
cin >> str + 1; //从 str[1] 开始读入
scanf("%s", str); // 输入字符串时,遇到空格或者回车就会停止
scanf("%s", str + 1);
cout << str << endl; // 输出字符串时,遇到空格或者回车不会停止,遇到 '\0' 时停止
cout << str + 1 << endl; // 从 str[1] 开始输出
printf("%s\n", str);
printf("%s\n", str + 1);
return 0;
}
读入一行字符数组,包括空格:
#include <bits/stdc++.h>
using namespace std;
int main()
{
char s[100];
fgets(s, 100, stdin); // gets 函数不能限制输入的长度,造成了历史上大量的缓冲区溢出漏洞,因此在新版本中被彻底删除了。
// 可以用 fgets 代替,但注意 fgets 会读入行末的回车字符
cin.getline(s, 100);
puts(s) //末尾会输出一个换行符
cout << s << endl;
return 0;
}
2.2 字符数组的常用操作
下面几个函数需要引入头文件:
#include <cstring>
//#include <string.h>
(1) strlen(str)
,求字符串的长度,不包含 '\0'
(2) strcmp(a, b)
,比较两个字符串的大小:
a < b
返回 -1
,a == b
返回 0
,a > b
返回 1
。
这里的比较方式是字典序! (字典序:“10” < “2“)基于贪心
(3) strcpy(a, b)
,将字符串 b
复制给从 a
开始的字符数组。
#include <bits/stdc++.h>
using namespace std;
int main()
{
char a[100] = "hello world!", b[100];
cout << strlen(a) << endl;
strcpy(b, a);
cout << strcmp(a, b) << endl;
return 0;
}
2.3 遍历字符数组中的字符:
#include <bits/stdc++.h>
using namespace std;
int main()
{
char a[100] = "hello world!";
// 注意:下述 for 循环每次均会执行 strlen(a),运行效率较低,最好将 strlen(a) 用一个变量存下来
for (int i = 0; i < strlen(a); i ++ )
cout << a[i] << endl;
return 0;
}
练习:找第一个只出现一次的字符
练习:把一个字符串中特定的字符全部用给定的字符替换,得到一个新的字符串。
#include <bits/stdc++.h>
using namespace std;
int main()
{
string s;
cin >> s;
char c;
cin >> c;
for (int i = 0; i < s.size(); i ++ )
if (s[i] == c)
s[i] = '#';
cout << s << endl;
return 0;
}
- 标准库类型
string
可变长的字符序列,比字符数组更加好用。需要引入头文件:
#include <string>
3.1 定义和初始化
#include <bits/stdc++.h>
using namespace std;
int main()
{
string s1; // 默认初始化 8 Byte,s1 是一个空字符串
string s2 = s1; // s2 是 s1 的副本,注意 s2 只是与 s1 的值相同,并不指向同一段地址
string s3 = "hiya"; // s3 是该字符串字面值的副本
string s4(10, 'c'); // s4 的内容是 "cccccccccc"
return 0;
}
3.2 string上的操作
(1) string 的读写:
#include <bits/stdc++.h>
using namespace std;
int main()
{
string s1, s2;
cin >> s1 >> s2;
cout << s1 << s2 << endl;
return 0;
}
注意:不能用 scanf
读入,不能用 printf
直接输出 string
,需要写成:printf(“%s”, s.c_str())
;
(2) 使用 getline 读取一整行
#include <bits/stdc++.h>
using namespace std;
int main()
{
string s;
getline(cin, s);
cout << s << endl;
return 0;
}
(3) string
的 empty
和 size
操作(注意 size
是无符号整数,因此 s.size() <= -1
一定成立):
#include <bits/stdc++.h>
using namespace std;
int main()
{
string s1, s2 = "abc";
cout << s1.empty() << endl;
cout << s2.empty() << endl;
cout << s2.size() << endl;
return 0;
}
注意:strlen()
是 On
的,但 size()
是 O1
的,length()
和 size()
完全一样
(4) string 的比较:
支持 >, <, >=, <=, ==, != 等所有比较操作,按字典序进行比较。
(5) 为 string 对象赋值:
string s1(10, 'c'), s2; // s1 的内容是 cccccccccc;s2 是一个空字符串
s1 = s2; // 赋值:用 s2 的副本替换 s1 的副本
// 此时 s1 和 s2 都是空字符串
(6) 两个 string 对象相加: 可以累加
string s1 = "hello, "", s2 = "world\n";
string s3 = s1 + s2; // s3 的内容是 hello, world\n
s1 += s2; // s1 = s1 + s2 支持累加
(7) 字面值和 string 对象相加:
做加法运算时,字面值和字符都会被转化成 string 对象,因此直接相加就是将这些字面值串联起来:
string s1 = "hello", s2 = "world"; // 在 s1 和 s2 中都没有标点符号
string s3 = s1 + ", " + s2 + '!';
当把 string 对象和字符字面值及字符串字面值混在一条语句中使用时,必须确保每个加法运算符的两侧的运算对象至少有一个是 string:
string s4 = s1 + ", "; // 正确:把一个 string 对象和有一个字面值相加
string s5 = "hello" + ", "; // 错误:两个运算对象都不是 string
string s6 = s1 + ", " + "world"; // 正确,每个加法运算都有一个运算符是 string
string s7 = "hello" + ", " + s2; // 错误:不能把字面值直接相加,运算是从左到右进行的
3.3 处理 string 对象中的字符
可以将 string 对象当成字符数组来处理:
#include <bits/stdc++.h>
using namespace std;
int main()
{
string s = "hello world";
for (int i = 0; i < s.size(); i ++ )
cout << s[i] << endl;
return 0;
}
或者使用基于范围遍历的 for 语句:
#include <bits/stdc++.h>
using namespace std;
int main()
{
string s = "hello world";
for (char c: s) cout << c << endl; //不加取地址符,改变 c 不会改变字符串本身
for (char& c: s) c = 'a'; //s 也会全变成 a
for (auto c: s) cout << c << endl; //自动类型 编译器猜不出来会报错
cout << s << endl;
return 0;
}
#include <bits/stdc++.h>
using namespace std;
int main()
{
auto s = "hello world";
cout << s.size() << endl; // 编译器猜不出来,会报错
unordered_map<string, set<vector<int>>> S;
unordered_map<string, set<vector<int>>>::iterator it = S.begin();
return 0;
}
练习:密码翻译
练习:输入两个字符串,验证其中一个串是否为另一个串的子串。
备注:
-
string 的
substr(i, len)
截取字符串时包左不包右,substr(i)
从当前位置截取到最后。功能:从一个字符串截取一个从指定位置开始,并具有指定长度的子串。
back() // 返回最后一个字符
pop_back() // 删除最后一个字符
find(x) // 返回区间内的符合条件的第一个索引,没有则返回 npos
s.erase(i, l) // 从 i 开始往后删 l 个
s.insert(i, str) // 在 i 前插入字符串 str
#include <sstream>
stringstream ssin(s); // 把他当成 cin 只不过是从 s 这个字符串里面获取
-
string 与 int 互相转换:
-
其他函数:
getchar(); // 读入一个字符
putchar(x); // 输出一个字符
islower(x) // 判断是否为小写字母
isupper(x) // 判断是否为大写字母
isdigit(x) // 判断是否为数字
isalpha(x) // 判断是否为字母
- 输入时发现程序无法结束?
(1)采用 “文件输入输出” 的方式;
(2)EOF
即文件末尾标识符,可以通过下面的方式在命令行中输入这个符号:
Windows:Ctrl+Z,然后敲回车
Linux/macOS:Ctrl+D,然后敲回车
-
size()
函数返回的是一个无符号整数,当size() == 0
,再减 ,会导致溢出,从而使数据变大。建议
(signed)size() - 1
:
vector<int> arr;
cout << arr.size() << endl; // 输出 0
cout << arr.size() - 1 << endl; // 输出 429496729
1 comments
-
MPX LV 3 @ 2023-11-1 20:27:42
啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊
- 1