Экспертная система Delphi.int.ru

Сообщество программистов
Общение, помощь, обмен опытом

Регистрация на сайте занимает 40 секунд, а пользу приносит годами.

Дополнительные функции

Delphi.int.ru Expert

Другие разделы портала

Переход к вопросу:

Статистика за сегодня:

Вопросы: 0
Ответы: 0
Мини-форумы: 0

Онлайн на сайте: 9 (3404)
Онлайн в IRC: 2 (17)
Последние новости:
8 июля 2023
Последний вопрос:
30 августа 2025, 19:29
Последний ответ:
29 марта 2018, 23:32

Лучшие эксперты

Подробнее »

Вопрос # 3 074

Раздел: Delphi » Алгоритмы, преобразования

/ вопрос открыт /

Приветствую, уважаемые эксперты!
Появилась срочная необходимость перевести большое количество файлов из одной кодировки в другую (а именно ANSI TO UTF8). С преобразованием проблем нет, а вот как определить кодировку у текста, чтобы не перекодировать в его в Unicode 2 раза (чушь получается)? Можно урезать вопрос до того, что как различить ANSI и UTF8 программно?

Вопрос ожидает решения (принимаются ответы, доступен мини-форум)

Вопрос задал: Виталий (статус: 2-ой класс)
Вопрос отправлен: 7 августа 2009, 21:32
Состояние вопроса: открыт, ответов: 1.

Ответ #1. Отвечает эксперт: Вадим К

Здравствуйте, Виталий!
Если файлы были перекодированы в UTF-8 корректно, то распознать можно. Это делается по так называемой BOM сигнатуре. Это три байта в начале - EF BB BF. Если в тексте есть только символы с кодами до 127 включительно и сигнатуры нет, то UTF8 от ANSI (cp1251) отличить нельзя - они идентичны...
Если же есть кирилические символы, то тут лучше пойти на хитрость - проанализировать входной поток и посмотреть, что там. Если это кирилический текст, то там будет много символов с кодами 0xD0, 0xD1 в диапазоне от 128 до 255. Если это это анси, то там будет много кодов 0xE0 и 0xEE (это буквы а и о, которые наиболее распростанненные в русской языке)

Ответ отправил: Вадим К (статус: Академик)
Время отправки: 8 августа 2009, 00:40
Оценка за ответ: 5

Комментарий к оценке: Спасибо! Я нашёл функцию на этом алгоритме.

Мини-форум вопроса

Мини-форум пуст.

Чтобы оставлять сообщения в мини-форумах, Вы должны авторизироваться на сайте.

Версия движка: 2.6+ (26.01.2011)

Текущее время: 5 апреля 2026, 07:32

Главная страница | Обратная связь

Выполнено за 0.03 сек.