什么是Unicode?

What is Unicode? and how Encoding works?

在我读C编程书前几个小时。当我读这本书的时候,我遇到了这些单词、字符编码和Unicode。然后我开始搜索有关Unicode的信息。然后我开始了解到Unicode字符集具有每种语言的每一个字符,而UTF-8、16、32可以对Unicode字符集中列出的字符进行编码。

但我无法理解它是如何工作的。Unicode是否依赖于操作系统?如何与软件和程序相关?UTF-8是安装操作系统时安装在计算机上的软件吗?还是与硬件有关?计算机是如何编码这些东西的?

我觉得这太令人困惑了。请详细回答我。我对这些东西不熟悉,所以在你给我答案的时候,请记住这一点。

谢谢您。


我写了很多关于这个的文章,每个程序员都绝对,积极地需要知道编码和字符集来处理文本。以下是一些亮点:

  • 编码是丰富的,编码定义了像"A"这样的"字符"如何被编码为位和字节。
  • 大多数编码只为少数选定字符指定此值;例如,编写英语或捷克语所需的所有(或至少大多数)字符;单字节编码通常支持最多256个字符集。
  • Unicode是一项很大的标准工作,它已经编目并指定了一个数字?几乎所有使用中的主要语言的字符和符号的字符关系,即数十万个字符
  • UTF-8、16和32是不同的子标准,用于将这个庞大的数字目录编码为字节,每个字节都有不同的大小权衡。
  • 软件需要专门支持unicode及其utf-*编码,就像它需要支持任何其他类型的专门编码一样;现在大多数工作都是由操作系统完成的,它向应用程序公开支持功能。