Как проверить кодировку файла в блокноте
Перейти к содержимому

Как проверить кодировку файла в блокноте

  • автор:

У вас большие запросы!

Точнее, от вашего браузера их поступает слишком много, и сервер VK забил тревогу.

Эта страница была загружена по HTTP, вместо безопасного HTTPS, а значит телепортации обратно не будет.
Обратитесь в поддержку сервиса.

Вы отключили сохранение Cookies, а они нужны, чтобы решить проблему.

Почему-то страница не получила всех данных, а без них она не работает.
Обратитесь в поддержку сервиса.

Вы вернётесь на предыдущую страницу через 5 секунд.
Вернуться назад

У вас большие запросы!

Точнее, от вашего браузера их поступает слишком много, и сервер VK забил тревогу.

Эта страница была загружена по HTTP, вместо безопасного HTTPS, а значит телепортации обратно не будет.
Обратитесь в поддержку сервиса.

Вы отключили сохранение Cookies, а они нужны, чтобы решить проблему.

Почему-то страница не получила всех данных, а без них она не работает.
Обратитесь в поддержку сервиса.

Вы вернётесь на предыдущую страницу через 5 секунд.
Вернуться назад

У вас большие запросы!

Точнее, от вашего браузера их поступает слишком много, и сервер VK забил тревогу.

Эта страница была загружена по HTTP, вместо безопасного HTTPS, а значит телепортации обратно не будет.
Обратитесь в поддержку сервиса.

Вы отключили сохранение Cookies, а они нужны, чтобы решить проблему.

Почему-то страница не получила всех данных, а без них она не работает.
Обратитесь в поддержку сервиса.

Вы вернётесь на предыдущую страницу через 5 секунд.
Вернуться назад

Как программа «Блокнот» определяет кодировку файла?

Создаю в far пустой файл без расширения с кодировкой ansi 1251 или utf8.
Открываю блокнотом, нажимаю «сохранить как» и вижу, что блокнот уже предлагает ansi или utf соответственно.
Как это происходит?

  • Вопрос задан более трёх лет назад
  • 1907 просмотров

Комментировать
Решения вопроса 1
VoidVolker @VoidVolker
Dark side eye. А у нас печеньки! А у вас?

Far при сохранении файла в UTF-8 пишет в начале файла BOM маркер (EF BB BF), указывающий что весь текст далее закодирован с помощью UTF-8 кодировки. А при сохранении в ANSI — ничего не пишет. UTF8 может не содержать BOM — и тогда, определение кодировки лежит на плечах редактора и/или пользователя. Некоторые редакторы анализируя строку умеют определять верную кодировку с ощутимой долей вероятности.

Ответ написан более трёх лет назад
Нравится 2 2 комментария
UndefinedBehaivor @UndefinedBehaivor
UTF-16LE и UTF-16BE тоже содержат такие маркеры, кстати.

tsklab

5a42a4d19ba79944183427.png

Нет никакого маркера:

Ответы на вопрос 1

Может файл не совсем пустой?

Пустой файл это совсем 0 байт, без потоков и совершенно без какой-либо информации, даже о кодировке. Т.е., он не содержит совершенно никакой информации, совсем, вообще.

только что проверил — создал пустой, «поменял» кодировку на UTF-8+BOM (потому что блокнот с BOM только умеет), сохранил — вуаля, файл стал 3 байта — подсказать, что там, в этих 3 байтах?

Ответ написан более трёх лет назад
Нравится 2 6 комментариев

Qubc

Qubc @Qubc Автор вопроса

Окей, я понял, «типа пустой» файл с кодировкой utf8 имеет размер в 3 байта, в hex редакторе видно EF BB BF. Дальше пойдут байты символов.
Но пустой файл в ANSI имеет размер 0 байт и там действительно ничего нет.
То есть, вывод такой:
Блокнот определяет кодировку по первым байтам или их отсутствию, верно?

Qubc, сохрани в блокноте 4 «пустых» файла (там же всего 4 кодировки), да посмотри в двоичном виде, что получается: анси — пусто, юникод — 2 байта, юникод бе — те же байты в обратном порядке, ютф с бом — 3 байта

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *