UTF-8编码/解码工具
免费在线UTF-8编码和解码工具。支持文本与UTF-8字节序列的相互转换,提供十六进制、十进制、二进制、百分号编码等多种格式输出。开发者处理国际化(i18n)、多语言数据、字符编码问题的必备工具。
关于 UTF-8 编码
什么是UTF-8编码?
UTF-8(8位Unicode转换格式)是一种可变长度的字符编码,能够编码所有有效的Unicode码位。它每个字符使用1到4个字节,对ASCII和非ASCII字符都非常高效。UTF-8与ASCII的兼容性以及表示Unicode标准中任何字符的能力,使其成为互联网上使用最广泛的编码格式。
为什么使用UTF-8编码器/解码器?
UTF-8编码对于国际化(i18n)至关重要,可用于处理多语言内容、调试字符编码问题、处理需要特定编码的API,以及确保在不同平台和系统之间传输文本时的数据完整性。
UTF-8编码工作原理
UTF-8使用可变长度编码:ASCII字符(U+0000到U+007F)使用1个字节,带重音的拉丁字符(U+0080到U+07FF)使用2个字节,大多数常见的中日韩字符使用3个字节,包括表情符号在内的稀有字符使用4个字节。这使得UTF-8对于以ASCII为主的内容非常节省空间,同时仍支持所有Unicode字符。
UTF-8字节编码参考表
| 字节数 | Unicode范围 | 字符类型 |
|---|---|---|
| 1 | U+0000 - U+007F | ASCII (A-Z, a-z, 0-9) |
| 2 | U+0080 - U+07FF | Latin Extended (é, ñ, ü) |
| 3 | U+0800 - U+FFFF | CJK (中文, 日本語, 한국어) |
| 4 | U+10000 - U+10FFFF | Emojis, Historic Scripts |