Byte-teller — UTF-8-, UTF-16- en UTF-32-byte-calculator

Heb je de exacte byte-grootte van een string nodig? Plak hieronder een tekst om de lengte in UTF-8-, UTF-16- en UTF-32-bytes te zien, samen met tekens en codepunten.

Byte-teller

UTF-8-byte-calculator

Tekst invoeren
0
UTF-8-bytes
0
UTF-16-bytes
0
UTF-32-bytes
0
Tekens
0
Codepunten

UTF-8 gebruikt 1–4 bytes per teken: ASCII 1 byte, Latijn met accenten 2, de meeste CJK 3 en emoji 4.

Hoeveel bytes is je tekst?

Tekens en bytes zijn niet hetzelfde. De byte-grootte van een string hangt af van de codering: UTF-8 gebruikt één byte voor ASCII en tot vier voor emoji, UTF-16 twee of vier, en UTF-32 altijd vier per codepunt. Plak je tekst hierboven en deze tool toont alle drie tegelijk, zodat je precies weet hoeveel ruimte een string inneemt.

Waarom byte-grootte uitmaakt

Byte-limieten kom je overal tegen: databasekolommen (VARCHAR wordt vaak in bytes gemeten), HTTP-headers en cookies, JSON-budgetten, sms-segmenten, QR-codes en API-veldlimieten. Een string van 20 tekens kan 20 of 80 bytes zijn afhankelijk van het schrift, dus alleen tekens tellen kan ongemerkt een limiet overschrijden. UTF-8 is de standaard voor het web, JSON en de meeste databases.

Tekens, codepunten en bytes

Deze tool onderscheidt drie verschillende tellingen. Tekens zijn grafeemclusters — wat een lezer als één symbool ziet, inclusief emoji die uit meerdere codepunten bestaan. Codepunten zijn losse Unicode-scalairwaarden. Bytes zijn de gecodeerde opslaggrootte. Een emoji als 👍 is één teken, één codepunt en vier UTF-8-bytes; een vlagemoji is één teken maar twee codepunten en acht UTF-8-bytes.

Privé en direct

Alles wordt in je browser berekend met de standaard TextEncoder, dus de tellingen komen exact overeen met wat je server of database opslaat. Niets van wat je plakt wordt geüpload, wat het veilig maakt voor tokens, sleutels en andere gevoelige strings. Bewerk de tekst en elk getal werkt live bij.

Veelgestelde vragen

Hoeveel bytes is één teken in UTF-8?

Tussen 1 en 4. ASCII-letters en -cijfers zijn 1 byte, Latijn met accenten en Grieks/Cyrillisch 2, de meeste Chinese/Japanse/Koreaanse tekens 3, en emoji en zeldzamere symbolen 4.

Wat is het verschil tussen tekens, codepunten en bytes?

Een teken (grafeem) is wat je als één symbool ziet; een codepunt is één Unicode-scalairwaarde; bytes zijn de gecodeerde grootte. Eén emoji kan 1 teken, 1 codepunt en 4 UTF-8-bytes zijn — en emoji uit meerdere codepunten gebruiken er nog meer.

Welke codering moet ik tellen voor een database?

Meestal UTF-8, de standaard voor het web, JSON en de meeste moderne databases. Controleer of je kolomlengte in bytes of tekens is gedefinieerd — UTF-8-multibyte-tekens kunnen een byte-gebaseerde limiet overschrijden.

Wordt mijn tekst naar een server gestuurd?

Nee. Het tellen van bytes gebeurt volledig in je browser met de standaard TextEncoder, dus het is veilig voor API-sleutels, tokens en andere gevoelige strings.

Laatst bijgewerkt: 14 juni 2026

Klaar om te zien hoe je bericht er écht uitziet?

Plak je concept in de PostTruncate-editor en bekijk direct live-previews voor LinkedIn, X, Instagram, Facebook, Threads en TikTok — met vouwlijnen, thread-splits en limietwaarschuwingen die bijwerken terwijl je typt. Gratis, direct en niets verlaat je browser.

Begin met schrijven — het is gratis