关于c ++：如何将std :: string转换为小写？

How to convert std::string to lower case?

我想将std::string转换为小写。我知道函数tolower()，但是在过去我遇到了这个函数的问题，并且它无论如何都不是理想的，因为使用std::string需要迭代每个字符。

有没有一种方法可以100％的时间运作？

如果没有遍历列表，你还会如何将任何事物列表中的每个元素转换为其他元素？字符串只是一个字符列表，如果你需要为每个字符应用一些函数，你将不得不遍历字符串。没办法解决这个问题。
为什么这个问题确实会降低评级？迭代我的字符串我没有问题，但我问是否除了tolower()，toupper()等之外还有其他功能。
如果你有一个C风格的char数组，那么我想你可以将ox20202020添加到每个4个字符的块中(前提是它们都是大写的)，一次将4个字符转换为小写。
@Dan：如果它们可能已经是小写但绝对是A-Z或a-z，则可以使用0x20而不是添加。其中一个如此聪明 - 它可能是愚蠢的优化，几乎永远不值得......
我不知道为什么它会被投票...当然它的措辞有点奇怪(因为你必须以某种方式迭代每个项目)，但这是一个有效的问题
注意：tolower()在100％的时间内不起作用。小写/大写操作仅适用于字符，而std :: string本质上是一个字节数组，而不是字符。 Plain tolower对于ASCII字符串很好，但它不会正确地小写latin-1或utf-8字符串。您必须知道字符串的编码，并且可能在对其字符进行小写之前对其进行解码。
当我输入问题时，我倾向于倾倒当时我心理缓冲区中的内容。它并不总是有意义的。 ;)
@onebyone：啊，没想到！好吧，我从来没有真正意味着这是一种有用的方式，只是它是可能的。实际上，我更感兴趣的是像GPU上的大文本一样，只是为了笑。
这是一个很好的问题。大多数脚本语言都按照您期望的方式处理它。
请注意，您选择的答案可能具有未定义的行为。尽管所有的选票都很高，但这是不安全的。
我认为"迭代每个字符"的含义是"显式迭代每个字符"，例如减少代码膨胀或冗长的代码。
在阅读了所有这些答案和来回的评论之后，我不太确定这是你想在程序中直接处理的内容。您可能希望使用一个独立模块，该模块接受字符串和编码/语言环境参数，如果可以进行可验证的转换，则只能提供良好的结果，这似乎需要使用ICU库以获得最大的稳健性。或者，您可以随时使用它更安全，并删除使用案例检查作为验证的要求，除非应用程序的整个点是将这些字母变为小写。
DevSolar提供了一个很好的答案，其中包含一个非常好的例子，说明为什么这不能作为一个纯粹的软件练习来解决。他似乎同意并同意我的意见，显然不会包括你必须意识到任何解决方案的文化变化。在所有情况下，它无法完全解决。

改编自不那么常见问题：

1
2
3
4
5
6
7

#include
#include <cctype>
#include <string>

std::string data ="Abc";
std::transform(data.begin(), data.end(), data.begin(),
[](unsigned char c){ return std::tolower(c); });

如果不迭代每个角色，你真的不会离开。否则无法知道字符是小写还是大写。

如果你真的讨厌tolower()，这里是一个专门的ASCII替代方案，我不建议你使用：

1
2
3
4
5
6
7

char asciitolower(char in) {
if (in <= 'Z' && in >= 'A')
return in - ('Z' - 'z');
return in;
}

std::transform(data.begin(), data.end(), data.begin(), asciitolower);

请注意，tolower()只能执行每单字节字符替换，这对于许多脚本来说都是不合适的，特别是如果使用像UTF-8这样的多字节编码。

相关讨论

这太棒了，我总是想知道最好的方法是什么。我不知道使用std :: transform。 :)
uberjumper：实际上有很多与STL调用相关的开销，特别是对于小的"ish"字符串。使用for循环和tolower的解决方案可能要快得多。
(可能是旧的，所讨论的算法变化不大)@Stefan Mai：在调用STL算法时会出现什么样的"全部开销"？这些函数相当精简(即简单的循环)并且经常内联，因为在同一个编译单元中很少有多个调用同一个函数和相同的模板参数。
@eq Fair点，在使用-O3进行编译时，我的基准测试与你同意(尽管STL实际上优于手动调优的代码，所以我想知道编译器是否在提取一些技巧)。调试STL代码仍然是一个熊;)。
供参考：github.com/iamnafets/TestSTL。
这种非便携式解决方案可能更快。你可以避免这样分支：inChar | = 0x20。我认为这是将ascii转换为低位的最快方法。如果你想将低位转换为高位则：inChar＆amp; = ~0x20。
@MichalW如果你只有字母，这种方法很有效，但并非总是如此。如果你在那个领域，你可以通过在长片上使用位掩码做得更好 - 一次取8个字符;)
每当你假设角色是ASCII时，上帝杀死了一只小猫。 :(
您的第一个示例可能具有未定义的行为(将char传递给::tolower(int)。)您需要确保不传递负值。
-1这个::tolower的使用可能会崩溃，它是非ASCII输入的UB。
虽然这应该是在理智的世界中这样做的规范方式，但它有太多的问题无法推荐它。首先，来自ctype.h的tolower不适用于unicode。其次，许多其他std库头包含的locale.h定义了一个冲突的tolower，这会导致头痛，请参阅stackoverflow.com/q/5539249/339595。最好使用std :: locale或boost :: locale :: to_lower作为其他答案建议。
::如果您是国际/使用宽字符，请使用
@MichalW嘿，你能解释一下你在那里写的吗？另外，为什么我们在::tolower中使用::？
@StefanMai嗨。为什么在"tolower"之前需要"::"？我不明白。
请注意，如果您使用std::u32string并且您的C语言环境与Unicode兼容，则适用于Unicode。
在tolower之前需要::来表明它位于最外层的命名空间中。如果你在另一个命名空间中使用这个代码，可能会有一个不同的(可能是不相关的)tolower定义，最终在不使用::的情况下优先选择。
std::transform(data.begin(), data.end(), data.begin(), easytolower);很危险。由于std::tolower 的行为未定义，如果输入不能表示为unsigned char且不等于EOF
@BrianGordon - 但它更容易，世界上已经有太多的猫了。
@BrianGordon这是明显错误的，事实证明世界上还有小猫！ =)
是什么让第二个解决方案不可移植？我可以这样做吗？ pastebin.com/MPRMpQJS
@BrianGordon还有一些情况，当你知道输入是ASCII(例如域名的有线格式)。
@Alnitak我不知道。 DNS如何处理可以在unicode中的国际域名？
@BrianGordon应用程序必须将它们转换为名为"Punycode"的全ASCII编码(RFC 3492)
@TypicalHog：因为无法保证'A'到'Z'是连续范围(EBCDIC);但更重要的是因为有超出该范围的字母('Ü'，'á'，...)。令人非常非常伤心的是，作者更倾向于使用非便携式解决方案获得更多的赞成，而不是正确地指出他们的缺点......
@DevSolar：easytolower对我来说似乎是一个非常有效的拉丁ASCII符号解决方案。将它用于规范化HTML标记名称。
@ Cheersandhth.-Alf c99没有提到它是UB：它要么返回较低的char，要么未经修改。然而，std::tolower提到了ub
@如果。我修复了你的问题。
@Deduplicator说实话，我一直无法理解为什么char必须先转换unsigned char。无论如何，(签名)char的价值不应该是非负的吗？ tolower负char的重点是什么？我想我错过了这一点，所以你介意解释它有点请:)
@如果。不，char可以类似于signed char，而signed char可以是负数。 tolower仅接受unsigned char和-1。其域外的任何内容都是UB，您也不想与-1混淆。虽然基本执行字符集的所有成员都是非负的，但这不一定适用于(完整)执行字符集。查看当前的草案。
@Deduplicator谢谢！我不知道char可以有效地为负面。但是，不转换为unsigned char只是改变价值？
@如果。 char - > unsigned char(保留值，模2 ** CHAR_BIT) - >隐含到int(保值)。当然，如果sizeof(int) == 1，事情就会崩溃。
@Deduplicator OK ...我想我错过了......然后int转换为char，我认为，所以结果值是在C ++ 20之前实现定义的并保证是原始值C ++ 20？
@如果。将结果从tolower()(int)转换回char也是一个有趣的故事，是的。

Boost为此提供了一个字符串算法：

1
2
3
4

#include <boost/algorithm/string.hpp>

std::string str ="HELLO, WORLD!";
boost::algorithm::to_lower(str); // modifies str

或者，对于非就地：

1
2
3
4

#include <boost/algorithm/string.hpp>

const std::string str ="HELLO, WORLD!";
const std::string lower_str = boost::algorithm::to_lower_copy(str);

相关讨论

TL;博士

使用ICU库。

首先，您必须回答一个问题：std::string的编码是什么？是ISO-8859-1吗？或者ISO-8859-8？或Windows代码页1252？无论你用什么来转换大写到小写都知道吗？ (或者对于0x7f以上的角色，它是否会失败？)

如果您使用UTF-8(8位编码中唯一合理的选择)并将std::string作为容器，那么您已经在欺骗自己相信您仍在控制事物，因为您正在存储多字节字符序列在一个不知道多字节概念的容器中。即使像.substr()这样简单的东西也是一个滴答作响的定时炸弹。 (因为拆分多字节序列将导致无效(子)字符串。)

只要你尝试像std::toupper( '?' )这样的东西，在任何编码中，你都会陷入困境。 (因为根本不可能使用标准库"正确"执行此操作，标准库只能提供一个结果字符，而不是此处所需的"SS"。[1]另一个例子是std::tolower( 'I' )，它会产生不同的结果取决于区域设置。在德国，'i'是正确的;在土耳其，'?'(LATIN SMALL LETTER DOTLESS I)是预期的结果(在UTF-8编码中也是一个以上的字节)。

然后有一点是标准库取决于运行软件的机器上支持的语言环境......如果不是，你会怎么做？

所以你真正想要的是一个能够正确处理所有这些的字符串类，而这不是任何std::basic_string<>变体。

(C ++ 11注意：std::u16string和std::u32string更好，但仍然不完美.C ++ 20带来了std::u8string，但所有这些都指定了编码。在许多其他方面，他们仍然不知道Unicode机制，如规范化，整理，...)

虽然Boost看起来不错，但API智能，Boost.Locale基本上是ICU的包装器。如果使用ICU支持编译Boost ...如果不是，则Boost.Locale仅限于为标准库编译的语言环境支持。

并且相信我，让Boost与ICU一起编译可能是一个真正的痛苦。 (Windows没有预编译的二进制文件，因此您必须将它们与您的应用程序一起提供，这会打开一整套新的蠕虫......)

所以我个人建议直接从马口获得完整的Unicode支持并直接使用ICU库：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

#include <unicode/unistr.h>
#include <unicode/ustream.h>
#include <unicode/locid.h>

#include <iostream>

int main()
{
char const * someString ="Eidenges\xe4\xdf";
icu::UnicodeString someUString( someString,"ISO-8859-1" );
// Setting the locale explicitly here for completeness.
// Usually you would use the user-specified system locale.
std::cout << someUString.toLower("de_DE" ) <<"
";
std::cout << someUString.toUpper("de_DE" ) <<"
";
return 0;
}

编译(在此示例中使用G ++)：

1	g++ -Wall example.cpp -licuuc -licuio

这给出了：

1 2	eidenges?? EIDENGES?SS

[1] 2017年，德国正字法委员会裁定"？" U + 1E9E LATIN CAPITAL LETTER SHARP S可以正式使用，作为传统"SS"转换旁边的选项，以避免歧义，例如：在护照中(名称大写)。我美丽的例子，由委员会决定过时了......

相关讨论

这是一般情况下的正确答案。除了谎言和欺骗之外，该标准没有为除"ASCII"之外的任何东西提供任何处理。它让你觉得你可以处理UTF-16，但你不能。正如这个答案所说，如果不进行自己的unicode处理，就无法获得UTF-16字符串的正确字符长度(不是字节长度)。如果您必须处理真实文本，请使用ICU。谢谢，@ DevSolar
@Chase：我觉得这很令人惊讶，因为我在Linux Mint IIRC上编译它，并且不记得在Mint，SLES，Aix或Windows上使用locid.h。如果省略该标题，您的计算机上会出现什么问题？
@Chase :(启动办公室机器，c＆amp; p示例检查这个东西......)啊。为了完整性，我添加了"de_DE"(我自己不在本地使用)，但没有重新检查可编译性。你是对的，谢谢你选择了。
在Ubuntu / Windows上默认情况下ICU是否可用或需要单独安装？这个答案怎么样：stackoverflow.com/a/35075839/207661？
@ShitalShah：一切都需要在Windows上单独安装。许多Linux安装都将libicu作为其默认安装的一部分;那些不这样做的人，通过他们的包裹管理提供。如果你想针对它进行开发，你无论如何都必须安装它的头文件(libicu-dev或watever你的发行版调用它)。至于其他答案，文档(！)表示它只支持1：1映射。这可能适用于tolower(我实际上并不知道相反的例子)，但对于toupper来说还不够(参见我的例子)。
(ctd。)你通常不仅希望在一个全尺寸的应用程序中使用toupper / tolower。您将需要正则表达式，UTF规范化/非规范化，日历函数，支持Unicode的字符串搜索＆amp;替换，所有这些东西。尽管如此，ICU只是选择的库，因此您也可以将它用于tolower。
嘿，看，真正的答案！感谢您指出我正确的直接，DevSolar。
icu :: UnicodeString :: length()在技术上也对你说谎(尽管不那么频繁)，因为它报告的是16位代码单元的数量，而不是代码点的数量。 ;-)
@masaers：为了完全公平，使用组合字符，零宽度连接符和从右到左标记之类的东西，代码点的数量相当无意义。我会删除那句话。
@DevSolar同意！长度的概念在文本上相当无意义(我们可以将连字添加到违法者列表中)。也就是说，由于人们习惯于选项卡和控制字符占用一个长度单位，因此代码点将是更直观的衡量标准。哦，感谢给正确的答案，难过，看到这么远了:-(
C ++ 20 u8string怎么样？
@如果。边缘更好。但是仍然没有涵盖很多东西：toupper和tolower仍然适用于单个字符。字符串类仍然没有归一化的概念(例如，"＆＃252;"是否被编码为"具有分音符的u"或"u +组合分音符")或者字符串可以或可以不分开。名单还在继续。 u8string(与其他标准字符串类一样)适合"传递"。但是如果要处理Unicode，则需要ICU。

如果字符串包含ASCII范围之外的UTF-8字符，则boost :: algorithm :: to_lower将不会转换这些字符。当涉及UTF-8时，最好使用boost :: locale :: to_lower。请参阅http://www.boost.org/doc/libs/1_51_0/libs/locale/doc/html/conversions.html

使用基于范围的C ++ 11循环，一个更简单的代码是：

1
2
3
4
5
6
7
8
9
10
11
12
13

#include <iostream> // std::cout
#include <string> // std::string
#include <locale> // std::locale, std::tolower

int main ()
{
std::locale loc;
std::string str="Test String.
";

for(auto elem : str)
std::cout << std::tolower(elem,loc);
}

相关讨论

这是Stefan Mai的回复的后续行动：如果您想将转换结果放在另一个字符串中，则需要在调用std::transform之前预先分配其存储空间。由于STL将转换后的字符存储在目标迭代器中(在循环的每次迭代中将其递增)，因此目标字符串将不会自动调整大小，并且存在内存占用风险。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

#include <string>
#include
#include <iostream>

int main (int argc, char* argv[])
{
std::string sourceString ="Abc";
std::string destinationString;

// Allocate the destination space
destinationString.resize(sourceString.size());

// Convert the source string to lower case
// storing the result in destination string
std::transform(sourceString.begin(),
sourceString.end(),
destinationString.begin(),
::tolower);

// Output the result of the conversion
std::cout << sourceString
<<" ->"
<< destinationString
<< std::endl;
}

相关讨论

另一种使用基于范围的循环与参考变量的方法

1
2
3
4
5
6
7

string test ="Hello World";
for(auto& c : test)
{
c = tolower(c);
}

cout<<test<<endl;

据我所知，Boost库的性能非常糟糕。我已经测试了他们的unordered_map到STL，平均慢了3倍(最好的情况2，最差的是10次)。此算法看起来也太低了。

差异是如此之大，以至于我确信无论你需要做什么来增加tolower以使其等于提升"满足你的需求"将比提升更快。

我已经在Amazon EC2上完成了这些测试，因此在测试过程中性能会有所不同，但您仍然可以理解。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

./test
Elapsed time: 12365milliseconds
Elapsed time: 1640milliseconds
./test
Elapsed time: 26978milliseconds
Elapsed time: 1646milliseconds
./test
Elapsed time: 6957milliseconds
Elapsed time: 1634milliseconds
./test
Elapsed time: 23177milliseconds
Elapsed time: 2421milliseconds
./test
Elapsed time: 17342milliseconds
Elapsed time: 14132milliseconds
./test
Elapsed time: 7355milliseconds
Elapsed time: 1645milliseconds

-O2这样做：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

./test
Elapsed time: 3769milliseconds
Elapsed time: 565milliseconds
./test
Elapsed time: 3815milliseconds
Elapsed time: 565milliseconds
./test
Elapsed time: 3643milliseconds
Elapsed time: 566milliseconds
./test
Elapsed time: 22018milliseconds
Elapsed time: 566milliseconds
./test
Elapsed time: 3845milliseconds
Elapsed time: 569milliseconds

资源：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

string str;
bench.start();
for(long long i=0;i<1000000;i++)
{
str="DSFZKMdskfdsjfsdfJDASFNSDJFXCKVdnjsafnjsdfjdnjasnJDNASFDJDSFSDNJjdsanjfsdnfjJNFSDJFSD";
boost::algorithm::to_lower(str);
}
bench.end();

bench.start();
for(long long i=0;i<1000000;i++)
{
str="DSFZKMdskfdsjfsdfJDASFNSDJFXCKVdnjsafnjsdfjdnjasnJDNASFDJDSFSDNJjdsanjfsdnfjJNFSDJFSD";
for(unsigned short loop=0;loop < str.size();loop++)
{
str[loop]=tolower(str[loop]);
}
}
bench.end();

我想我应该在专用机器上进行测试但是我将使用这个EC2所以我真的不需要在我的机器上测试它。

相关讨论

来自标准C ++ Localization库的std::ctype::tolower()将正确地为您执行此操作。以下是从tolower参考页面中提取的示例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

#include <locale>
#include <iostream>

int main () {
std::locale::global(std::locale("en_US.utf8"));
std::wcout.imbue(std::locale());
std::wcout <<"In US English UTF-8 locale:
";
auto& f = std::use_facet<std::ctype<wchar_t>>(std::locale());
std::wstring str = L"HELLo, wORLD!";
std::wcout <<"Lowercase form of the string '" << str <<"' is";
f.tolower(&str[0], &str[0] + str.size());
std::wcout <<"'" << str <<"'
";
}

相关讨论

在不打扰std命名空间的情况下将字符串转换为loweercase的最简单方法如下

1：带/不带空格的字符串

1
2
3
4
5
6
7
8
9
10
11
12
13

#include
#include <iostream>
#include <string>
using namespace std;
int main(){
string str;
getline(cin,str);
//------------function to convert string into lowercase---------------
transform(str.begin(), str.end(), str.begin(), ::tolower);
//--------------------------------------------------------------------
cout<<str;
return 0;
}

2：没有空格的字符串

1
2
3
4
5
6
7
8
9
10
11
12
13

#include
#include <iostream>
#include <string>
using namespace std;
int main(){
string str;
cin>>str;
//------------function to convert string into lowercase---------------
transform(str.begin(), str.end(), str.begin(), ::tolower);
//--------------------------------------------------------------------
cout<<str;
return 0;
}

有一种方法可以将大写字母转换为低级而不进行测试，而且非常简单。 isupper()函数/宏使用clocale.h应该处理与你的位置有关的问题，但如果没有，你可以随时调整UtoL []到你心脏的内容。

鉴于C的字符实际上只是8位整数(暂时忽略了宽字符集)，你可以创建一个256字节的数组，其中包含一组替代字符，并且在转换函数中使用字符串中的字符作为下标。转换数组。

而不是1对1映射，为大写数组成员提供小写字符的BYTE int值。你可能会发现islower()和isupper()在这里很有用。

enter image description here

代码看起来像这样......

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

#include <clocale>
static char UtoL[256];
// ----------------------------------------------------------------------------
void InitUtoLMap() {
for (int i = 0; i < sizeof(UtoL); i++) {
if (isupper(i)) {
UtoL[i] = (char)(i + 32);
} else {
UtoL[i] = i;
}
}
}
// ----------------------------------------------------------------------------
char *LowerStr(char *szMyStr) {
char *p = szMyStr;
// do conversion in-place so as not to require a destination buffer
while (*p) { // szMyStr must be null-terminated
*p = UtoL[*p];
p++;
}
return szMyStr;
}
// ----------------------------------------------------------------------------
int main() {
time_t start;
char *Lowered, Upper[128];
InitUtoLMap();
strcpy(Upper,"Every GOOD boy does FINE!");

Lowered = LowerStr(Upper);
return 0;
}

同时，此方法允许您重新映射您希望更改的任何其他字符。

当在现代处理器上运行时，这种方法具有一个巨大的优势，不需要进行分支预测，因为如果测试包括分支则不存在。这为其他循环保存了CPU的分支预测逻辑，并且倾向于防止流水线停顿。

这里的一些人可能认为这种方法与用于将EBCDIC转换为ASCII的方法相同。

相关讨论

Boost的另一种选择是POCO(pocoproject.org)。

POCO提供两种变体：

第一个变体制作副本而不更改原始字符串。

第二个变体将原始字符串更改为适当位置。
"就地"版本的名称中始终包含"InPlace"。

两个版本如下所示：

1
2
3
4
5
6
7
8
9
10

#include"Poco/String.h"
using namespace Poco;

std::string hello("Stack Overflow!");

// Copies"STACK OVERFLOW!" into 'newString' without altering 'hello.'
std::string newString(toUpper(hello));

// Changes newString in-place to read"stack overflow!"
toLowerInPlace(newString);

如果你想要一些简单的东西，这是一个宏技术：

1
2
3

#define STRTOLOWER(x) std::transform (x.begin(), x.end(), x.begin(), ::tolower)
#define STRTOUPPER(x) std::transform (x.begin(), x.end(), x.begin(), ::toupper)
#define STRTOUCFIRST(x) std::transform (x.begin(), x.begin()+1, x.begin(), ::toupper); std::transform (x.begin()+1, x.end(), x.begin()+1,::tolower)

但请注意，@ AndreasSpindler对此答案的评论仍然是一个重要的考虑因素，但是，如果您正在处理的不仅仅是ASCII字符。

相关讨论

1
2
3
4
5
6
7
8
9
10
11
12
13
14

// tolower example (C++)
#include <iostream> // std::cout
#include <string> // std::string
#include <locale> // std::locale, std::tolower

int main ()
{
std::locale loc;
std::string str="Test String.
";
for (std::string::size_type i=0; i<str.length(); ++i)
std::cout << std::tolower(str[i],loc);
return 0;
}

有关更多信息，请访问：http：//www.cplusplus.com/reference/locale/tolower/

Is there an alternative which works 100% of the time?

没有

在选择小写方法之前，您需要先问几个问题。

字符串是如何编码的？纯ASCII？ UTF-8？某种形式的扩展ASCII遗留编码？

无论如何，小写是什么意思？案例映射规则因语言而异！您想要本地化为用户区域设置的内容吗？你想要在你的软件运行的所有系统上表现一致吗？您是否只想小写ASCII字符并通过其他所有内容？

有哪些库可用？

一旦你有了这些问题的答案，你就可以开始寻找适合你需求的解决方案了。没有一种适合所有人适合所有人的尺寸！

由于没有一个答案提到了即将推出的Ranges库，它在C ++ 20之后的标准库中可用，并且目前在GitHub上单独提供为range-v3，我想添加一种方法来使用它来执行此转换。

要就地修改字符串：

1	str \|= action::transform([](unsigned char c){ return std::tolower(c); });

要生成新字符串：

1 2	auto new_string = original_string \| view::transform([](unsigned char c){ return std::tolower(c); });

(不要忘记#include 和所需的Ranges标题。)

注意：使用unsigned char作为lambda的参数受cppreference的启发，cppreference指出：

Like all other functions from , the behavior of std::tolower is undefined if the argument's value is neither representable as unsigned char nor equal to EOF. To use these functions safely with plain chars (or signed chars), the argument should first be converted to unsigned char:

1
2
3
4
char my_tolower(char ch)
{
return static_cast<char>(std::tolower(static_cast<unsigned char>(ch)));
}

Similarly, they should not be directly used with standard algorithms when the iterator's value type is char or signed char. Instead, convert the value to unsigned char first:

1
2
3
4
5
6
7
8
9
std::string str_tolower(std::string s) {
std::transform(s.begin(), s.end(), s.begin(),
// static_cast<int(*)(int)>(std::tolower) // wrong
// [](int c){ return std::tolower(c); } // wrong
// [](char c){ return std::tolower(c); } // wrong
[](unsigned char c){ return std::tolower(c); } // correct
);
return s;
}

我自己的模板函数，执行大小写。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

#include <string>
#include

//
// Lowercases string
//
template <typename T>
std::basic_string< T > lowercase(const std::basic_string< T >& s)
{
std::basic_string< T > s2 = s;
std::transform(s2.begin(), s2.end(), s2.begin(), tolower);
return std::move(s2);
}

//
// Uppercases string
//
template <typename T>
std::basic_string< T > uppercase(const std::basic_string< T >& s)
{
std::basic_string< T > s2 = s;
std::transform(s2.begin(), s2.end(), s2.begin(), toupper);
return std::move(s2);
}

代码片段

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

#include<bits/stdc++.h>
using namespace std;

int main ()
{
ios::sync_with_stdio(false);

string str="String Convert
";

for(int i=0; i<str.size(); i++)
{
str[i] = tolower(str[i]);
}
cout<<str<<endl;

return 0;
}

使用fplus :: to_lower_case()。

(fplus：https：//github.com/Dobiasd/FunctionalPlus。

在http://www.editgym.com/fplus-api-search/中搜索"to_lower_case"

1	fplus::to_lower_case(std::string("ABC")) == std::string("abc");

复制，因为不允许改善答案。谢谢你

1
2
3
4
5

string test ="Hello World";
for(auto& c : test)
{
c = tolower(c);
}

说明：

for(auto& c : test)是一种基于范围的for循环for ( range_declaration : range_expression ) loop_statement：

range_declaration：auto& c
这里自动说明符用于自动类型推导。因此，类型从变量初始值设定项中扣除。

range_expression：test
在这种情况下，范围是字符串test的字符。

字符串test的字符可作为for循环中的标识符c的引用。

相关讨论

C ++没有为字符串实现tolower或toupper方法，但它可用于char。可以轻松读取字符串的每个字符串，将其转换为必需的大小写并将其放回字符串中。
不使用任何第三方库的示例代码：

1
2
3
4
5
6
7
8
9
10

#include<iostream>

int main(){
std::string str = std::string("How IS The Josh");
for(char &ch : str){
ch = std::tolower(ch);
}
std::cout<<str<<std::endl;
return 0;
}

对于字符串的基于字符的操作：对于字符串中的每个字符

在Microsoft平台上，您可以使用strlwr系列函数：http：//msdn.microsoft.com/en-us/library/hkxwh33z.aspx

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

// crt_strlwr.c
// compile with: /W3
// This program uses _strlwr and _strupr to create
// uppercase and lowercase copies of a mixed-case string.
#include <string.h>
#include <stdio.h>

int main( void )
{
char string[100] ="The String to End All Strings!";
char * copy1 = _strdup( string ); // make two copies
char * copy2 = _strdup( string );

_strlwr( copy1 ); // C4996
_strupr( copy2 ); // C4996

printf("Mixed: %s
", string );
printf("Lower: %s
", copy1 );
printf("Upper: %s
", copy2 );

free( copy1 );
free( copy2 );
}

这可能是另一个将大写转换为小写的简单版本，反之亦然。我使用VS2017社区版来编译这个源代码。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

#include <iostream>
#include <string>
using namespace std;

int main()
{
std::string _input ="lowercasetouppercase";
#if 0
// My idea is to use the ascii value to convert
char upperA = 'A';
char lowerA = 'a';

cout << (int)upperA << endl; // ASCII value of 'A' -> 65
cout << (int)lowerA << endl; // ASCII value of 'a' -> 97
// 97-65 = 32; // Difference of ASCII value of upper and lower a
#endif // 0

cout <<"Input String =" << _input.c_str() << endl;
for (int i = 0; i < _input.length(); ++i)
{
_input[i] -= 32; // To convert lower to upper
#if 0
_input[i] += 32; // To convert upper to lower
#endif // 0
}
cout <<"Output String =" << _input.c_str() << endl;

return 0;
}

注意：如果有特殊字符，则需要使用条件检查进行处理。

我试过std :: transform，我得到的是令人讨厌的stl criptic编译错误，只有200年前的德鲁伊才能理解(不能转换为flibidi flabidi flu)

这工作正常，可以很容易地调整

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

string LowerCase(string s)
{
int dif='a'-'A';
for(int i=0;i<s.length();i++)
{
if((s[i]>='A')&&(s[i]<='Z'))
s[i]+=dif;
}
return s;
}

string UpperCase(string s)
{
int dif='a'-'A';
for(int i=0;i<s.length();i++)
{
if((s[i]>='a')&&(s[i]<='z'))
s[i]-=dif;
}
return s;
}

1
2
3
4
5
6
7

//You can really just write one on the fly whenever you need one.
#include <string>
void _lower_case(std::string& s){
for(unsigned short l = s.size();l;s[--l]|=(1<<5));
}
//Here is an example.
//http://ideone.com/mw2eDK

相关讨论