International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F29EA6

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
򞦀
9E980
򞦁
9E981
򞦂
9E982
򞦃
9E983
򞦄
9E984
򞦅
9E985
򞦆
9E986
򞦇
9E987
򞦈
9E988
򞦉
9E989
򞦊
9E98A
򞦋
9E98B
򞦌
9E98C
򞦍
9E98D
򞦎
9E98E
򞦏
9E98F
80
90
򞦐
9E990
򞦑
9E991
򞦒
9E992
򞦓
9E993
򞦔
9E994
򞦕
9E995
򞦖
9E996
򞦗
9E997
򞦘
9E998
򞦙
9E999
򞦚
9E99A
򞦛
9E99B
򞦜
9E99C
򞦝
9E99D
򞦞
9E99E
򞦟
9E99F
90
A0
򞦠
9E9A0
򞦡
9E9A1
򞦢
9E9A2
򞦣
9E9A3
򞦤
9E9A4
򞦥
9E9A5
򞦦
9E9A6
򞦧
9E9A7
򞦨
9E9A8
򞦩
9E9A9
򞦪
9E9AA
򞦫
9E9AB
򞦬
9E9AC
򞦭
9E9AD
򞦮
9E9AE
򞦯
9E9AF
A0
B0
򞦰
9E9B0
򞦱
9E9B1
򞦲
9E9B2
򞦳
9E9B3
򞦴
9E9B4
򞦵
9E9B5
򞦶
9E9B6
򞦷
9E9B7
򞦸
9E9B8
򞦹
9E9B9
򞦺
9E9BA
򞦻
9E9BB
򞦼
9E9BC
򞦽
9E9BD
򞦾
9E9BE
򞦿
9E9BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]