International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A281

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󢁀
E2040
󢁁
E2041
󢁂
E2042
󢁃
E2043
󢁄
E2044
󢁅
E2045
󢁆
E2046
󢁇
E2047
󢁈
E2048
󢁉
E2049
󢁊
E204A
󢁋
E204B
󢁌
E204C
󢁍
E204D
󢁎
E204E
󢁏
E204F
80
90
󢁐
E2050
󢁑
E2051
󢁒
E2052
󢁓
E2053
󢁔
E2054
󢁕
E2055
󢁖
E2056
󢁗
E2057
󢁘
E2058
󢁙
E2059
󢁚
E205A
󢁛
E205B
󢁜
E205C
󢁝
E205D
󢁞
E205E
󢁟
E205F
90
A0
󢁠
E2060
󢁡
E2061
󢁢
E2062
󢁣
E2063
󢁤
E2064
󢁥
E2065
󢁦
E2066
󢁧
E2067
󢁨
E2068
󢁩
E2069
󢁪
E206A
󢁫
E206B
󢁬
E206C
󢁭
E206D
󢁮
E206E
󢁯
E206F
A0
B0
󢁰
E2070
󢁱
E2071
󢁲
E2072
󢁳
E2073
󢁴
E2074
󢁵
E2075
󢁶
E2076
󢁷
E2077
󢁸
E2078
󢁹
E2079
󢁺
E207A
󢁻
E207B
󢁼
E207C
󢁽
E207D
󢁾
E207E
󢁿
E207F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]