International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
All Aliases
UTF-8 UTF-8
ibm-1208
ibm-1209
ibm-5304
ibm-5305
ibm-13496
ibm-13497
ibm-17592
ibm-17593
windows-65001
cp1208
x-UTF_8J
unicode-1-1-utf-8
unicode-2-0-utf-8


Codepage Layout

Currently showing the codepage starting with the bytes F48EA6

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
􎦀
10E980
􎦁
10E981
􎦂
10E982
􎦃
10E983
􎦄
10E984
􎦅
10E985
􎦆
10E986
􎦇
10E987
􎦈
10E988
􎦉
10E989
􎦊
10E98A
􎦋
10E98B
􎦌
10E98C
􎦍
10E98D
􎦎
10E98E
􎦏
10E98F
80
90
􎦐
10E990
􎦑
10E991
􎦒
10E992
􎦓
10E993
􎦔
10E994
􎦕
10E995
􎦖
10E996
􎦗
10E997
􎦘
10E998
􎦙
10E999
􎦚
10E99A
􎦛
10E99B
􎦜
10E99C
􎦝
10E99D
􎦞
10E99E
􎦟
10E99F
90
A0
􎦠
10E9A0
􎦡
10E9A1
􎦢
10E9A2
􎦣
10E9A3
􎦤
10E9A4
􎦥
10E9A5
􎦦
10E9A6
􎦧
10E9A7
􎦨
10E9A8
􎦩
10E9A9
􎦪
10E9AA
􎦫
10E9AB
􎦬
10E9AC
􎦭
10E9AD
􎦮
10E9AE
􎦯
10E9AF
A0
B0
􎦰
10E9B0
􎦱
10E9B1
􎦲
10E9B2
􎦳
10E9B3
􎦴
10E9B4
􎦵
10E9B5
􎦶
10E9B6
􎦷
10E9B7
􎦸
10E9B8
􎦹
10E9B9
􎦺
10E9BA
􎦻
10E9BB
􎦼
10E9BC
􎦽
10E9BD
􎦾
10E9BE
􎦿
10E9BF
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]