International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F18C9D

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
񌝀
4C740
񌝁
4C741
񌝂
4C742
񌝃
4C743
񌝄
4C744
񌝅
4C745
񌝆
4C746
񌝇
4C747
񌝈
4C748
񌝉
4C749
񌝊
4C74A
񌝋
4C74B
񌝌
4C74C
񌝍
4C74D
񌝎
4C74E
񌝏
4C74F
80
90
񌝐
4C750
񌝑
4C751
񌝒
4C752
񌝓
4C753
񌝔
4C754
񌝕
4C755
񌝖
4C756
񌝗
4C757
񌝘
4C758
񌝙
4C759
񌝚
4C75A
񌝛
4C75B
񌝜
4C75C
񌝝
4C75D
񌝞
4C75E
񌝟
4C75F
90
A0
񌝠
4C760
񌝡
4C761
񌝢
4C762
񌝣
4C763
񌝤
4C764
񌝥
4C765
񌝦
4C766
񌝧
4C767
񌝨
4C768
񌝩
4C769
񌝪
4C76A
񌝫
4C76B
񌝬
4C76C
񌝭
4C76D
񌝮
4C76E
񌝯
4C76F
A0
B0
񌝰
4C770
񌝱
4C771
񌝲
4C772
񌝳
4C773
񌝴
4C774
񌝵
4C775
񌝶
4C776
񌝷
4C777
񌝸
4C778
񌝹
4C779
񌝺
4C77A
񌝻
4C77B
񌝼
4C77C
񌝽
4C77D
񌝾
4C77E
񌝿
4C77F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]