Здравствуйте, гость ( Вход | Регистрация )

> utf-8 cp1251 сортировка файлов(фильтр)
FREEON
сообщение 5.1.2020, 14:44
Сообщение #1


*****

Journeyman
Сообщений: 365
Регистрация: 14.2.2017
Группа: Пользователи
Наличность: 0
Пользователь №: 18.346
Возраст: 25



Кто знает программу, плагин, фильтр или способ сортировки текстовых файлов(массовый) по кодировке. Что бы например выбрал папку и там показывалось какой файл находится кодировке utf-8 или cp1251 или еще какой.
Массовая перекодировка различными программами не дает желаемого результата т.к. из перекодировки допустим из cp1251 в utf-8 будет норм вариант если этот файл в этой кодировке но если он был в ютф то при кодировке выдаст крокозябры. Поэтому и нужно точный фильтр который показал какой файл в какой кодировке изначально. Знаю к пилоту мало относится но есть ли разумное решения вопроса
Пользователь в офлайнеDelete PostОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
 
Ответить в эту темуОткрыть новую тему
Ответов
Cockney
сообщение 5.1.2020, 17:01
Сообщение #2


********

Master
Сообщений: 1.404
Регистрация: 22.6.2013
Группа: Пользователи
Наличность: 22597
Пользователь №: 16.156



Цитата
Поэтому и нужно точный фильтр который показал какой файл в какой кодировке изначально. Знаю к пилоту мало относится но есть ли разумное решения вопроса


Нет. Более-менее можно получить файлы которые находятся в utf кодировках. Все остальные кодировки можно определить лишь с какой-то долей вероятности, но точного метода нет.

Цитата(Fors1k @ 5.1.2020, 15:56) *

[code
if copy($arr 1 3) = "п»ї"
[/code]


bom может отсутствовать.
Пользователь в офлайнеDelete PostОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
FREEON
сообщение 5.1.2020, 17:28
Сообщение #3


*****

Journeyman
Сообщений: 365
Регистрация: 14.2.2017
Группа: Пользователи
Наличность: 0
Пользователь №: 18.346
Возраст: 25



Цитата(Cockney @ 5.1.2020, 17:01) *

bom может отсутствовать.

Ну да для теста создал 3 файла:
1-й ansi
2-й utf c BOM
3-й utf без заголовка

и результат из теста
Код

ANSI_file 1 = D:\5\new\1.html
UTF8_file 1 = D:\5\new\2.html
ANSI_file 2 = D:\5\new\3.html

То есть не совсем точно определяет.
Пользователь в офлайнеDelete PostОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения



Ответить в эту темуОткрыть новую тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 

- Текстовая версия | Версия для КПК Сейчас: 18.9.2025, 19:54
Designed by Nickostyle