Compteur d’Octets — Calculateur d’octets UTF-8, UTF-16 et UTF-32

Besoin de la taille exacte en octets d’une chaîne ? Collez n’importe quel texte ci-dessous pour voir sa longueur en octets UTF-8, UTF-16 et UTF-32 ainsi que les caractères et points de code.

Compteur d’octets

Calculateur d’octets UTF-8

Saisir du texte
0
Octets UTF-8
0
Octets UTF-16
0
Octets UTF-32
0
Caractères
0
Points de code

UTF-8 utilise de 1 à 4 octets par caractère : ASCII 1 octet, latin accentué 2, la plupart des CJK 3 et les emojis 4.

Combien d’octets fait votre texte ?

Les caractères et les octets ne sont pas la même chose. La taille en octets d’une chaîne dépend de l’encodage : UTF-8 utilise un octet pour l’ASCII et jusqu’à quatre pour les emojis, UTF-16 deux ou quatre, et UTF-32 toujours quatre par point de code. Collez votre texte ci-dessus et cet outil affiche les trois à la fois, pour savoir exactement l’espace qu’occupe une chaîne.

Pourquoi la taille en octets compte

Les limites d’octets sont partout : tailles de colonnes de base de données (VARCHAR se mesure souvent en octets), en-têtes HTTP et cookies, budgets JSON, segments SMS, codes QR et limites de champs d’API. Une chaîne de 20 caractères peut faire 20 ou 80 octets selon l’écriture ; compter seulement les caractères peut donc dépasser une limite sans prévenir. UTF-8 est la valeur par défaut du web, de JSON et de la plupart des bases de données.

Caractères, points de code et octets

Cet outil distingue trois comptes différents. Les caractères sont des grappes de graphèmes — ce que le lecteur perçoit comme un symbole, y compris les emojis composés de plusieurs points de code. Les points de code sont des valeurs scalaires Unicode individuelles. Les octets sont la taille de stockage encodée. Un emoji comme 👍 est un caractère, un point de code et quatre octets UTF-8 ; un emoji de drapeau est un caractère mais deux points de code et huit octets UTF-8.

Privé et instantané

Tout est calculé dans votre navigateur avec le TextEncoder standard, donc les comptes correspondent exactement à ce que votre serveur ou base de données stockera. Rien de ce que vous collez n’est envoyé, ce qui le rend sûr pour les jetons, les clés et autres chaînes sensibles. Modifiez le texte et chaque chiffre se met à jour en direct.

Foire aux questions

Combien d’octets fait un caractère en UTF-8 ?

Entre 1 et 4. Les lettres et chiffres ASCII font 1 octet, le latin accentué et le grec/cyrillique 2, la plupart des caractères chinois/japonais/coréens 3, et les emojis et symboles rares 4.

Quelle est la différence entre caractères, points de code et octets ?

Un caractère (graphème) est ce que vous voyez comme un symbole ; un point de code est une valeur scalaire Unicode ; les octets sont la taille encodée. Un seul emoji peut être 1 caractère, 1 point de code et 4 octets UTF-8 — et les emojis composés de plusieurs points de code en utilisent davantage.

Quel encodage compter pour une base de données ?

Généralement UTF-8, la valeur par défaut du web, de JSON et de la plupart des bases de données modernes. Vérifiez si la longueur de votre colonne est définie en octets ou en caractères : les caractères multioctets UTF-8 peuvent dépasser une limite en octets.

Mon texte est-il envoyé à un serveur ?

Non. Le comptage d’octets s’effectue entièrement dans votre navigateur avec le TextEncoder standard, ce qui le rend sûr pour les clés d’API, les jetons et autres chaînes sensibles.

Dernière mise à jour : 14 juin 2026

Prêt à voir à quoi ressemble vraiment votre publication ?

Collez votre brouillon dans l'éditeur PostTruncate et visualisez instantanément des aperçus en direct pour LinkedIn, X, Instagram, Facebook, Threads et TikTok — avec les lignes de pli, les découpages de fil et les avertissements de limite mis à jour au fil de la frappe. Gratuit, instantané et rien ne quitte votre navigateur.

Commencer à écrire — c'est gratuit