字符串是计算机与人类沟通的重要手段

1. 字符与整数的联系——ASCII码

每个常用字符都对应一个-128 ~ 127的数字,二者之间可以相互转化。

注意:目前负数没有与之对应的字符。

(循环打表看字符)

image

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char c = 'a';
    cout << (int)c << endl;

    int a = 66;
    cout << (char)a << endl;

    return 0;
}

常用ASCII值:'A'- 'Z'65 ~ 90'a' - 'z'97 - 1220 - 9 48 - 57。 (大小写相差32)

字符可以参与运算,运算时会将其当做整数,只有输出时才是字符:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    int a = 'B' - 'A';
    int b = 'A' * 'B';
    char c = 'A' + 2;

    cout << a << endl;
    cout << b << endl;
    cout << c << endl;

    return 0;
}

2. 字符数组

字符串就是字符数组加上结束符'\0'。

可以使用字符串来初始化字符数组,但此时要注意,每个字符串结尾会暗含一个'\0'字符,因此字符数组的长度至少要比字符串的长度多1!

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char a1[] = {'C', '+', '+'};            // 列表初始化,没有空字符
    char a2[4] = {'C', '+', '+', '\0'};      // 列表初始化,含有显示的空字符
    char a3[4] = "C++";                      // 自动添加表示字符串结尾的空字符
    char a4[6] = "Daniel";                  // 错误:没有空间可以存放空字符

	cout << sizeof a3 << endl;              // 第3、4钟初始化是等价的,长度均为4 
	
    return 0;
}

2.1 字符数组的输入输出:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char str[100];

    cin >> str;             // 输入字符串时,遇到空格或者回车就会停止
  	cin >> str + 1;      //从str1开始读入
	scanf("%s", str);     // 输入字符串时,遇到空格或者回车就会停止
  	scanf("%s", str + 1);
	cout << str << endl;    // 输出字符串时,遇到空格或者回车不会停止,遇到'\0'时停止
  	cout << str + 1 << endl;  // 从str1开始输出
    printf("%s\n", str);
    printf("%s\n", str + 1);

    return 0;
}

读入一行字符数组,包括空格:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char s[100];
    
    fgets(s, 100, stdin);   // gets函数在新版C++中被移除了,因为不安全。
                            // 可以用fgets代替,但注意fgets会读入行末的回车字符
  	cin.getline(s, 100);
    
	puts(s)   //末尾会输出一个换行符
    cout << s << endl;

    return 0;
}

练习:T1129 统计数字字符个数

2.2 字符数组的常用操作

下面几个函数需要引入头文件:

#include <cstring>
//#include <string.h>

(1) strlen(str),求字符串的长度,不包含”\0“

(2) strcmp(a, b),比较两个字符串的大小:

a < b返回-1a == b返回0a > b返回1

这里的比较方式是字典序! (字典序:“10”<“2“)基于贪心

(3) strcpy(a, b),将字符串b复制给从a开始的字符数组。

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char a[100] = "hello world!", b[100];

    cout << strlen(a) << endl;

    strcpy(b, a);

    cout << strcmp(a, b) << endl;

    return 0;
}

2.3 遍历字符数组中的字符:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    char a[100] = "hello world!";

    // 注意:下述for循环每次均会执行strlen(a),运行效率较低,最好将strlen(a)用一个变量存下来
    for (int i = 0; i < strlen(a); i ++ )
        cout << a[i] << endl;

    return 0;
}

练习:T1130 找第一个只出现一次的字符

练习:把一个字符串中特定的字符全部用给定的字符替换,得到一个新的字符串。

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s;
    cin >> s;

    char c;
    cin >> c;

    for (int i = 0; i < s.size(); i ++ )
        if (s[i] == c)
            s[i] = '#';

    cout << s << endl;

    return 0;
}
  1. 标准库类型string

可变长的字符序列,比字符数组更加好用。需要引入头文件:

#include <string>

3.1 定义和初始化

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s1;              // 默认初始化,s1是一个空字符串
    string s2 = s1;         // s2是s1的副本,注意s2只是与s1的值相同,并不指向同一段地址
    string s3 = "hiya";     // s3是该字符串字面值的副本
    string s4(10, 'c');     // s4的内容是 "cccccccccc"

    return 0;
}

3.2 string上的操作

(1) string的读写:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s1, s2;

    cin >> s1 >> s2;
    cout << s1 << s2 << endl;

    return 0;
}

注意:不能用scanf读入,不能用printf直接输出string,需要写成:printf(“%s”, s.c_str());

(2) 使用getline读取一整行

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s;

    getline(cin, s);

    cout << s << endl;

    return 0;
}

(3) stringemptysize操作(注意size是无符号整数,因此 s.size() <= -1一定成立):

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s1, s2 = "abc";

    cout << s1.empty() << endl;
    cout << s2.empty() << endl;

    cout << s2.size() << endl;

    return 0;
}

注意:strlen()On的,但size()O1的,length()size()完全一样

(4) string的比较:

支持 >, <, >=, <=, ==, !=等所有比较操作,按字典序进行比较。

(5) 为string对象赋值:

string s1(10, 'c'), s2;     // s1的内容是 cccccccccc;s2是一个空字符串
s1 = s2;                    // 赋值:用s2的副本替换s1的副本
                            // 此时s1和s2都是空字符串

(6) 两个string对象相加: 可以累加

string s1 = "hello,  "", s2 = "world\n";
string s3 = s1 + s2;                    // s3的内容是 hello, world\n
s1 += s2;                               // s1 = s1 + s2 支持累加

(7) 字面值和string对象相加:

做加法运算时,字面值和字符都会被转化成string对象,因此直接相加就是将这些字面值串联起来:

string s1 = "hello", s2 = "world";      // 在s1和s2中都没有标点符号
string s3 = s1 + ", " + s2 + '!';

当把string对象和字符字面值及字符串字面值混在一条语句中使用时,必须确保每个加法运算符的两侧的运算对象至少有一个是string:

string s4 = s1 + ", ";  // 正确:把一个string对象和有一个字面值相加
string s5 = "hello" + ", "; // 错误:两个运算对象都不是string

string s6 = s1 + ", " + "world";  // 正确,每个加法运算都有一个运算符是string
string s7 = "hello" + ", " + s2;  // 错误:不能把字面值直接相加,运算是从左到右进行的

3.3 处理string对象中的字符

可以将string对象当成字符数组来处理:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s = "hello world";

    for (int i = 0; i < s.size(); i ++ )
        cout << s[i] << endl;

    return 0;
}

或者使用基于范围的for语句:

#include <bits/stdc++.h>
using namespace std;

int main()
{
    string s = "hello world";

    for (char c: s) cout << c << endl; //不加取地址符,改变c不会改变字符串本身

    for (char& c: s) c = 'a'; //s也会全变成a
  
    for (auto c: s) cout << c << endl;  //自动类型 编译器猜不出来会报错

    cout << s << endl;

    return 0;
}
#include <bits/stdc++.h>
using namespace std;

int main()
{
    auto s = "hello world";
    cout << s.size() << endl; // 编译器猜不出来,会报错
	
	unordered_map<string, set<vector<int>>> S;
	unordered_map<string, set<vector<int>>>::iterator it = S.begin();

    return 0;
}

练习:T1136 密码翻译

练习:输入两个字符串,验证其中一个串是否为另一个串的子串。

注意

string substr(i, len) 截取字符串 包左不包右 substr(i)从当前位置截取到最后

功能:从一个字符串复制一个从指定位置开始,并具有指定长度的子字符串。

back() 返回最后一个字符
pop_back() 删除最后一个字符
#include <sstream>
stringstream ssin(s); // 把他当成cin只不过是从s这个字符串里面获取

image getchar() putchar()

判断是否为小写字母 islower(x)

判断是否为大写字母 isupper(x)

判断是否为数字 isdigit(x) isdigit('9') == 1

判断是否为字母 isalpha(x) isalpha('a') == 2 salpha('A') == 1 salpha('9') == 0

Q: gets函数没有了吗?

A: gets函数因为不能限制输入的长度,造成了历史上大量的缓冲区溢出漏洞,因此在最新版本中被彻底删除了,请使用fgets这个函数取代。 或者使用下面的宏定义来取代:

#define gets(S) fgets(S,sizeof(S),stdin)

程序无法结束?

  • 采用 [文件输入输出] 的方式输入输出
  • EOF 即文件末尾标识符,可以通过下面的方式在命令行中输入这个符号
    • Windows:Ctrl+Z,然后敲回车
    • Linux/macOS:Ctrl+D,然后敲回车

back() 返回最后一个字符 pop_back() 删除最后一个字符

#include
stringstream ssin(s); // 把他当成cin只不过是从s这个字符串里面获取

substr(i, len) 截取字符串 包左不包右 substr(i)从当前位置截取到最后

补:string substr(size_type _Off = 0,size_type _Count = npos) const; 功能:从一个字符串复制一个从指定位置开始,并具有指定长度的子字符串。

size()函数返回的是一个无符号整数,当size() == 0,再减1,会导致溢出,从而使数据变大

int main()
{
    vector<int> arr;
    cout<<arr.size()<<endl;     // 输出  0
    cout<<arr.size() - 1<<endl; // 输出  429496729
}

建议 (signed)size() - 1

string 初始化大小,默认长度 8 Byte

string a, s;
a.resize(s.size());
s.substr(i, l) // 返回从 i 开始,长度为 l 的子串
s.find(x) // 返回区间内的符合条件的第一个字符的索引,没有则返回 npos
s.erase(i, l) // 从 i 开始往后删 l 个
s.insert(i, str) // 在 i 前插入字符串 str

1 comments

  • @ 2023-11-1 20:27:42

    啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊

  • 1