Что такое конвертер текста в двоичный код?
Этот инструмент переводит обычный текст в двоичный код по стандарту ASCII (American Standard Code for Information Interchange — Американский стандартный код для обмена информацией). Каждому символу на клавиатуре в базовой таблице ASCII соответствует число от 0 до 127. Конвертер берёт символ, находит его ASCII-код, переводит этот код в двоичную систему счисления и дополняет нулями ровно до 8 бит (одного байта). На выходе получается тот самый двоичный код, в котором компьютер хранит и передаёт данные «под капотом».
Как пользоваться
Введите или вставьте любой текст в поле ввода и нажмите кнопку. В результате вы увидите три варианта: двоичный код, разбитый на 8-битные байты (так читать удобнее всего), сплошной двоичный поток без пробелов и исходные десятичные ASCII-коды. Инструмент универсален и не привязан к какой-либо стране или языку — ASCII является международным стандартом в вычислительной технике.
Как работает формула
$$\text{Binary} = \bigl\Vert_{i=1}^{n}\ \operatorname{pad}_{8}\!\left(\operatorname{bin}\!\left(\operatorname{ASCII}\!\left(\text{Text}_{i}\right)\right)\right)$$
Для каждого символа \(c\) мы вычисляем \(\operatorname{ASCII}(c)\), затем переводим это число в двоичную систему и слева дополняем нулями, пока не получится 8 разрядов. Например, буква «A» имеет ASCII-код 65. В двоичном виде 65 — это \(1000001\), то есть 7 разрядов, поэтому мы дополняем его до \(01000001\). Если соединить байты всех символов подряд, получится полная двоичная строка.
Разбор примера
Возьмём слово «Hi». «H» = ASCII 72 = \(1001000\). «i» = ASCII 105 = \(1101001\). Дополняем каждый код до 8 бит: \(01001000\) и \(01101001\). Результат с пробелами — 01001000 01101001, а сплошной вариант — 0100100001101001.
Частые вопросы
Почему на символ приходится 8 бит? Байт состоит из 8 бит, а стандартный ASCII укладывается в 7 бит, поэтому дополнение до 8 делает все символы одинаковой ширины и совпадает с тем, как данные хранятся в памяти.
Работает ли он с пробелами и знаками препинания? Да — пробел имеет код ASCII 32 (\(00100000\)), и у всех печатных символов тоже есть свои коды.
А что с эмодзи и буквами с акцентами? Символы с кодом выше 127 выходят за рамки базовой таблицы ASCII; инструмент использует числовое значение кода каждого символа, и лучше всего это работает со стандартным английским текстом. Учтите, что русские буквы кириллицы тоже находятся за пределами базового ASCII.
Таблица Справочника ASCII Символ в Двоичный
Каждый символ на стандартной клавиатуре соответствует коду ASCII в десятичном виде от 0 до 127, и этот код хранится в виде 8-битного байта в двоичном формате. Таблица ниже содержит распространённые печатаемые символы с их десятичным кодом и дополненным 8-битным двоичным значением. Например, буква A имеет десятичный код 65, который в двоичном виде — это 01000001.
| Символ | Десятичный (ASCII) | 8-битный двоичный код |
|---|---|---|
| (пробел) | 32 | 00100000 |
| ! | 33 | 00100001 |
| " | 34 | 00100010 |
| # | 35 | 00100011 |
| $ | 36 | 00100100 |
| % | 37 | 00100101 |
| & | 38 | 00100110 |
| ' | 39 | 00100111 |
| ( | 40 | 00101000 |
| ) | 41 | 00101001 |
| * | 42 | 00101010 |
| + | 43 | 00101011 |
| , | 44 | 00101100 |
| - | 45 | 00101101 |
| . | 46 | 00101110 |
| / | 47 | 00101111 |
| 0 | 48 | 00110000 |
| 1 | 49 | 00110001 |
| 2 | 50 | 00110010 |
| 3 | 51 | 00110011 |
| 4 | 52 | 00110100 |
| 5 | 53 | 00110101 |
| 6 | 54 | 00110110 |
| 7 | 55 | 00110111 |
| 8 | 56 | 00111000 |
| 9 | 57 | 00111001 |
| : | 58 | 00111010 |
| ; | 59 | 00111011 |
| ? | 63 | 00111111 |
| @ | 64 | 01000000 |
| A | 65 | 01000001 |
| B | 66 | 01000010 |
| C | 67 | 01000011 |
| M | 77 | 01001101 |
| Z | 90 | 01011010 |
| a | 97 | 01100001 |
| b | 98 | 01100010 |
| c | 99 | 01100011 |
| m | 109 | 01101101 |
| z | 122 | 01111010 |
Чтобы проверить целое слово, текст Hi преобразуется в 01001000 01101001.
Как преобразовать текст в двоичный код вручную
Преобразование текста в двоичный код означает преобразование каждого символа в его 8-битное ASCII представление. Следуйте этим шагам для каждого символа в строке, обрабатывая их слева направо.
- Берите по одному символу за раз. Обрабатывайте текст слева направо; каждый символ преобразуется независимо, затем результаты объединяются.
- Найдите десятичный код ASCII. Найдите символ в таблице ASCII. Например, прописная буква K имеет десятичный код 75.
- Преобразуйте десятичное число в двоичную систему (основание 2) путём повторного деления на 2. Разделите число на 2 и запишите остаток, затем повторяйте с частным, пока оно не станет равно 0. Читайте остатки снизу вверх.
Для 75: 75 ÷ 2 = 37 остаток 1; 37 ÷ 2 = 18 остаток 1; 18 ÷ 2 = 9 остаток 0; 9 ÷ 2 = 4 остаток 1; 4 ÷ 2 = 2 остаток 0; 2 ÷ 2 = 1 остаток 0; 1 ÷ 2 = 0 остаток 1. Чтение остатков снизу вверх даёт 1001011. - Дополните нулями слева до 8 битов. Байт всегда состоит из 8 битов, поэтому добавьте ведущие нули: 1001011 становится 01001011.
- Объедините байты по порядку. Объедините все 8-битные группы вместе. Для непрерывного вывода запишите их без промежутков; для удобочитаемого вывода разделите каждый байт одним пробелом.
Практический пример — слово "Hey":
- H = 72 = 01001000
- e = 101 = 01100101
- y = 121 = 01111001
Результат с пробелами: 01001000 01100101 01111001. Чтобы проверить один байт в обратном направлении, двоичный код 01001000 преобразуется в десятичный 72, код ASCII для буквы H.
Ключевые термины объяснены
- ASCII
- Американский стандартный код обмена информацией — стандарт кодирования символов, который присваивает числовой код от 0 до 127 буквам, цифрам, пунктуации и управляющим символам.
- Бит
- Наименьшая единица цифровых данных, хранящая одно двоичное значение — либо 0, либо 1.
- Байт
- Группа из 8 битов. Один байт может представлять 256 различных значений (от 0 до 255), что достаточно для хранения любого стандартного или расширенного символа ASCII.
- Двоичная система (основание 2)
- Система счисления, использующая только цифры 0 и 1. Каждая позиция представляет степень числа два (1, 2, 4, 8, 16, …), поэтому байт 01000001 равен 64 + 1 = 65.
- 7-битный и 8-битный форматы
- Исходный ASCII требует только 7 бит для кодов 0–127. В современных системах каждый символ хранится в полном 8-битном байте, с дополнительным ведущим битом, установленным на 0 для стандартных символов ASCII.
- Дополнение нулями / ведущие нули
- Нули, добавленные в начало двоичного числа, чтобы каждый байт был ровно 8 битов. Например, код 5 становится 00000101 вместо просто 101, сохраняя выравнивание всех байтов.
- Непрерывный и разделённый пробелами вывод
- Непрерывный вывод объединяет все байты без разделителей (например, 0100100001101001), а разделённый пробелами вывод вставляет пробел между каждым байтом (например, 01001000 01101001) для удобства чтения и декодирования.
- Десятичный код
- Число в основании 10, присваиваемое символу стандартом ASCII, например 65 для буквы A. Это промежуточное значение между символом и его двоичной формой.
- Расширенный ASCII (коды 128–255)
- Расширение, использующее восьмой бит для добавления ещё 128 символов, таких как буквы с диакритическими знаками и символы рисования блоков. Эти кодировки различаются в зависимости от кодовой страницы, поэтому один и тот же код может отображаться по-разному в разных системах.