字符串是计算机与人类沟通的重要手段

1. 字符与整数的联系 —— ASCIIASCII

每个常用字符都对应一个 128-128 ~ 127127 的数字,二者之间可以相互转化。

注意:目前负数没有与之对应的字符。(循环打表看字符)

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char c = 'a';
    cout << (int)c << endl;

    int a = 66;
    cout << (char)a << endl;

    return 0;
}

常用ASCII值:'A'- 'Z'65 ~ 90'a' - 'z'97 - 1220 - 9 48 - 57。 (大小写相差 3232)

字符可以参与运算,运算时会将其当做整数,只有输出时才是字符:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    int a = 'B' - 'A';
    int b = 'A' * 'B';
    char c = 'A' + 2;

    cout << a << endl;
    cout << b << endl;
    cout << c << endl;

    return 0;
}

练习:输入一行字符,统计出其中数字字符的个数,以及字母字符的个数。

#include <bits/stdc++.h>
using namespace std;

int main()
{
	char c;
	
	int nums = 0, chars = 0;
	while (cin >> c)
	{
		if (c >= '0' && c <= '9') nums ++ ;
		else if (c >= 'A' && c <= 'Z' || c >= 'a' && c <= 'z') chars ++ ; 
	}
	
	printf("nums: %d\nchars: %d\n", nums, chars);
		
	return 0;
} 

2. 字符数组

字符串就是字符数组加上结束符 '\0'。

可以使用字符串来初始化字符数组,但此时要注意,每个字符串结尾会暗含一个 '\0' 字符,因此字符数组的长度至少要比字符串的长度多 11

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char a1[] = {'C', '+', '+'};            // 列表初始化,没有空字符
    char a2[4] = {'C', '+', '+', '\0'};      // 列表初始化,含有显示的空字符
    char a3[4] = "C++";                      // 自动添加表示字符串结尾的空字符
    char a4[6] = "Daniel";                  // 错误:没有空间可以存放空字符

	cout << sizeof a3 << endl;              // 第2、3种初始化是等价的,长度均为4 
	
    return 0;
}

2.1 字符数组的输入输出:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char str[100];

    cin >> str;             // 输入字符串时,遇到空格或者回车就会停止
  	cin >> str + 1;      //从 str[1] 开始读入
	scanf("%s", str);     // 输入字符串时,遇到空格或者回车就会停止
  	scanf("%s", str + 1);
	cout << str << endl;    // 输出字符串时,遇到空格或者回车不会停止,遇到 '\0' 时停止
  	cout << str + 1 << endl;  // 从 str[1] 开始输出
    printf("%s\n", str);
    printf("%s\n", str + 1);

    return 0;
}

读入一行字符数组,包括空格:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char s[100];
    
    fgets(s, 100, stdin);   // gets 函数不能限制输入的长度,造成了历史上大量的缓冲区溢出漏洞,因此在新版本中被彻底删除了。
                            // 可以用 fgets 代替,但注意 fgets 会读入行末的回车字符
  	cin.getline(s, 100);
    
	puts(s)   //末尾会输出一个换行符
    cout << s << endl;

    return 0;
}

2.2 字符数组的常用操作

下面几个函数需要引入头文件:

#include <cstring>
//#include <string.h>

(1) strlen(str),求字符串的长度,不包含 '\0'

(2) strcmp(a, b),比较两个字符串的大小:

a < b 返回 -1a == b 返回 0a > b 返回 1

这里的比较方式是字典序! (字典序:“10” < “2“)基于贪心

(3) strcpy(a, b),将字符串 b 复制给从 a 开始的字符数组。

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char a[100] = "hello world!", b[100];

    cout << strlen(a) << endl;

    strcpy(b, a);

    cout << strcmp(a, b) << endl;

    return 0;
}

2.3 遍历字符数组中的字符:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char a[100] = "hello world!";

    // 注意:下述 for 循环每次均会执行 strlen(a),运行效率较低,最好将 strlen(a) 用一个变量存下来
    for (int i = 0; i < strlen(a); i ++ )
        cout << a[i] << endl;

    return 0;
}

练习:找第一个只出现一次的字符

练习:把一个字符串中特定的字符全部用给定的字符替换,得到一个新的字符串。

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s;
    cin >> s;

    char c;
    cin >> c;

    for (int i = 0; i < s.size(); i ++ )
        if (s[i] == c)
            s[i] = '#';

    cout << s << endl;

    return 0;
}
  1. 标准库类型 string

可变长的字符序列,比字符数组更加好用。需要引入头文件:

#include <string>

3.1 定义和初始化

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s1;              // 默认初始化 8 Byte,s1 是一个空字符串
    string s2 = s1;         // s2 是 s1 的副本,注意 s2 只是与 s1 的值相同,并不指向同一段地址
    string s3 = "hiya";     // s3 是该字符串字面值的副本
    string s4(10, 'c');     // s4 的内容是 "cccccccccc"

    return 0;
}

3.2 string上的操作

(1) string 的读写:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s1, s2;

    cin >> s1 >> s2;
    cout << s1 << s2 << endl;

    return 0;
}

注意:不能用 scanf 读入,不能用 printf 直接输出 string,需要写成:printf(“%s”, s.c_str());

(2) 使用 getline 读取一整行

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s;

    getline(cin, s);

    cout << s << endl;

    return 0;
}

(3) stringemptysize 操作(注意 size 是无符号整数,因此 s.size() <= -1 一定成立):

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s1, s2 = "abc";

    cout << s1.empty() << endl;
    cout << s2.empty() << endl;

    cout << s2.size() << endl;

    return 0;
}

注意:strlen()On 的,但 size()O1 的,length()size() 完全一样

(4) string 的比较:

支持 >, <, >=, <=, ==, != 等所有比较操作,按字典序进行比较。

(5) 为 string 对象赋值:

string s1(10, 'c'), s2;     // s1 的内容是 cccccccccc;s2 是一个空字符串
s1 = s2;                    // 赋值:用 s2 的副本替换 s1 的副本
                            // 此时 s1 和 s2 都是空字符串

(6) 两个 string 对象相加: 可以累加

string s1 = "hello,  "", s2 = "world\n";
string s3 = s1 + s2;                    // s3 的内容是 hello, world\n
s1 += s2;                               // s1 = s1 + s2 支持累加

(7) 字面值和 string 对象相加:

做加法运算时,字面值和字符都会被转化成 string 对象,因此直接相加就是将这些字面值串联起来:

string s1 = "hello", s2 = "world";      // 在 s1 和 s2 中都没有标点符号
string s3 = s1 + ", " + s2 + '!';

当把 string 对象和字符字面值及字符串字面值混在一条语句中使用时,必须确保每个加法运算符的两侧的运算对象至少有一个是 string:

string s4 = s1 + ", ";  // 正确:把一个 string 对象和有一个字面值相加
string s5 = "hello" + ", "; // 错误:两个运算对象都不是 string

string s6 = s1 + ", " + "world";  // 正确,每个加法运算都有一个运算符是 string
string s7 = "hello" + ", " + s2;  // 错误:不能把字面值直接相加,运算是从左到右进行的

3.3 处理 string 对象中的字符

可以将 string 对象当成字符数组来处理:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s = "hello world";

    for (int i = 0; i < s.size(); i ++ )
        cout << s[i] << endl;

    return 0;
}

或者使用基于范围遍历的 for 语句:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s = "hello world";

    for (char c: s) cout << c << endl; //不加取地址符,改变 c 不会改变字符串本身

    for (char& c: s) c = 'a'; //s 也会全变成 a
  
    for (auto c: s) cout << c << endl;  //自动类型 编译器猜不出来会报错

    cout << s << endl;

    return 0;
}
#include <bits/stdc++.h>
using namespace std;

int main()
{
    auto s = "hello world";
    cout << s.size() << endl; // 编译器猜不出来,会报错
	
	unordered_map<string, set<vector<int>>> S;
	unordered_map<string, set<vector<int>>>::iterator it = S.begin();

    return 0;
}

练习:密码翻译

练习:输入两个字符串,验证其中一个串是否为另一个串的子串。

备注:

  1. string 的 substr(i, len) 截取字符串时包左不包右,substr(i) 从当前位置截取到最后。

    功能:从一个字符串截取一个从指定位置开始,并具有指定长度的子串。

back() // 返回最后一个字符
pop_back() // 删除最后一个字符
find(x) // 返回区间内的符合条件的第一个索引,没有则返回 npos
s.erase(i, l) // 从 i 开始往后删 l 个
s.insert(i, str) // 在 i 前插入字符串 str
#include <sstream>
stringstream ssin(s); // 把他当成 cin 只不过是从 s 这个字符串里面获取
  1. string 与 int 互相转换:

    image

  2. 其他函数:

getchar(); // 读入一个字符
putchar(x); // 输出一个字符
islower(x) // 判断是否为小写字母
isupper(x) // 判断是否为大写字母
isdigit(x) // 判断是否为数字
isalpha(x) // 判断是否为字母
  1. 输入时发现程序无法结束?

(1)采用 “文件输入输出” 的方式;

(2)EOF 即文件末尾标识符,可以通过下面的方式在命令行中输入这个符号:

  Windows:Ctrl+Z,然后敲回车
  Linux/macOS:Ctrl+D,然后敲回车
  1. size() 函数返回的是一个无符号整数,当 size() == 0,再减 11,会导致溢出,从而使数据变大。

    建议 (signed)size() - 1

vector<int> arr;
cout << arr.size() << endl;     // 输出 0
cout << arr.size() - 1 << endl; // 输出 429496729

1 comments

  • @ 2023-11-1 20:27:42

    啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊

    • @ 2023-11-25 15:42:02

      不要在这理发店

  • 1