International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F29AA4

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
򚤀
9A900
򚤁
9A901
򚤂
9A902
򚤃
9A903
򚤄
9A904
򚤅
9A905
򚤆
9A906
򚤇
9A907
򚤈
9A908
򚤉
9A909
򚤊
9A90A
򚤋
9A90B
򚤌
9A90C
򚤍
9A90D
򚤎
9A90E
򚤏
9A90F
80
90
򚤐
9A910
򚤑
9A911
򚤒
9A912
򚤓
9A913
򚤔
9A914
򚤕
9A915
򚤖
9A916
򚤗
9A917
򚤘
9A918
򚤙
9A919
򚤚
9A91A
򚤛
9A91B
򚤜
9A91C
򚤝
9A91D
򚤞
9A91E
򚤟
9A91F
90
A0
򚤠
9A920
򚤡
9A921
򚤢
9A922
򚤣
9A923
򚤤
9A924
򚤥
9A925
򚤦
9A926
򚤧
9A927
򚤨
9A928
򚤩
9A929
򚤪
9A92A
򚤫
9A92B
򚤬
9A92C
򚤭
9A92D
򚤮
9A92E
򚤯
9A92F
A0
B0
򚤰
9A930
򚤱
9A931
򚤲
9A932
򚤳
9A933
򚤴
9A934
򚤵
9A935
򚤶
9A936
򚤷
9A937
򚤸
9A938
򚤹
9A939
򚤺
9A93A
򚤻
9A93B
򚤼
9A93C
򚤽
9A93D
򚤾
9A93E
򚤿
9A93F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]