あなたのテキストは何バイト?
文字とバイトは同じではありません。文字列のバイトサイズはエンコーディングで変わります。UTF-8 は ASCII に1バイト、絵文字には最大4バイト、UTF-16 は2または4バイト、UTF-32 はコードポイントごとに常に4バイトです。上にテキストを貼り付けると、本ツールが3つすべてを同時に表示し、文字列が占める容量が正確にわかります。
バイトサイズが重要な理由
バイト制限は開発のあらゆる場面に現れます。データベースの列サイズ(VARCHAR はしばしばバイト単位)、HTTP ヘッダーや Cookie、JSON のサイズ、SMS セグメント、QR コード、API のフィールド上限などです。20文字の文字列でも文字種によって20バイトにも80バイトにもなり、文字だけ数えると気づかぬうちに上限を超えることがあります。UTF-8 は Web・JSON・多くのデータベースの既定です。
文字・コードポイント・バイト
本ツールは3つの異なるカウントを区別します。文字は書記素クラスター、つまり読者が1つの記号として認識するもので、複数のコードポイントから成る絵文字も含みます。コードポイントは個々の Unicode スカラー値です。バイトは符号化された保存サイズです。👍 のような絵文字は1文字・1コードポイント・4 UTF-8 バイト、旗の絵文字は1文字でも2コードポイント・8 UTF-8 バイトです。
プライベートで即時
すべて標準の TextEncoder を使ってブラウザー内で計算するため、カウントはサーバーやデータベースが保存する内容と完全に一致します。貼り付けた内容はアップロードされないので、トークンやキーなどの機密文字列にも安全です。テキストを編集すると、すべての数値がリアルタイムで更新されます。
よくある質問
UTF-8 で1文字は何バイト?
1〜4バイトです。ASCII の英数字は1、アクセント付きラテンやギリシャ/キリルは2、多くの中国語・日本語・韓国語の文字は3、絵文字や珍しい記号は4バイトです。
文字・コードポイント・バイトの違いは?
文字(書記素)は1つの記号として見えるもの、コードポイントは1つの Unicode スカラー値、バイトは符号化サイズです。1つの絵文字が1文字・1コードポイント・4 UTF-8 バイトになることもあり、複数コードポイントの絵文字はさらに多くなります。
データベースにはどのエンコーディングを数えるべき?
通常は UTF-8 で、Web・JSON・多くの最新データベースの既定です。列の長さがバイト単位か文字単位かを確認してください。UTF-8 のマルチバイト文字はバイト基準の上限を超えることがあります。
テキストはサーバーに送信されますか?
いいえ。バイト数の計算は標準の TextEncoder でブラウザー内のみで行われるため、API キーやトークンなどの機密文字列にも安全です。
最終更新:2026年6月14日
あなたの投稿が実際にどう見えるか確認する準備はできましたか?
下書きをPostTruncateエディターに貼り付けると、LinkedIn、X、Instagram、Facebook、Threads、TikTokのライブプレビューを即座に確認できます。フォールドライン、スレッド分割、文字数制限の警告がリアルタイムで更新されます。無料・即時・データはブラウザの外に出ません。
書き始める — 無料です