International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F391B2

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󑲀
D1C80
󑲁
D1C81
󑲂
D1C82
󑲃
D1C83
󑲄
D1C84
󑲅
D1C85
󑲆
D1C86
󑲇
D1C87
󑲈
D1C88
󑲉
D1C89
󑲊
D1C8A
󑲋
D1C8B
󑲌
D1C8C
󑲍
D1C8D
󑲎
D1C8E
󑲏
D1C8F
80
90
󑲐
D1C90
󑲑
D1C91
󑲒
D1C92
󑲓
D1C93
󑲔
D1C94
󑲕
D1C95
󑲖
D1C96
󑲗
D1C97
󑲘
D1C98
󑲙
D1C99
󑲚
D1C9A
󑲛
D1C9B
󑲜
D1C9C
󑲝
D1C9D
󑲞
D1C9E
󑲟
D1C9F
90
A0
󑲠
D1CA0
󑲡
D1CA1
󑲢
D1CA2
󑲣
D1CA3
󑲤
D1CA4
󑲥
D1CA5
󑲦
D1CA6
󑲧
D1CA7
󑲨
D1CA8
󑲩
D1CA9
󑲪
D1CAA
󑲫
D1CAB
󑲬
D1CAC
󑲭
D1CAD
󑲮
D1CAE
󑲯
D1CAF
A0
B0
󑲰
D1CB0
󑲱
D1CB1
󑲲
D1CB2
󑲳
D1CB3
󑲴
D1CB4
󑲵
D1CB5
󑲶
D1CB6
󑲷
D1CB7
󑲸
D1CB8
󑲹
D1CB9
󑲺
D1CBA
󑲻
D1CBB
󑲼
D1CBC
󑲽
D1CBD
󑲾
D1CBE
󑲿
D1CBF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]