The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"Выпуск языка программирования Rust 1.76"
Отправлено morphe, 09-Фев-24 04:32 
> В таком случае, 4 байт действительно хватает для utf-8, остаётся вопрос с переменностью.

4 байт не хватит для представления любого символа в utf-8.
utf-8 это способ кодирования unicode символов, где 1 символ минимум 1 байт, а максимум 6 байт
В utf-16 - минимум 2, максимум 4
utf-32 - всегда 4 байта, потому что unicode символ по стандарту не может иметь codepoint больше по размеру чем 4 байта.

Строки в Rust utf-8, и там один символ может быть закодирован как 6 байт, что логично, ведь латиница в utf-32 занимала бы в 4 раза больше места чем нужно, а худший случай в 6 байт на codepoint пока не осуществим (Нет таких пока, китайский и прочие языки - максимум 5 байт)

Однако строки в Rust напрямую не индексируются посимвольно, а потому char сделали статичные 4 байта, поэтому char вмещает в себя любой unicode codepoint.

 

Ваше сообщение
Имя*:
EMail:
Для отправки ответов на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру