Декодировщики - начинающим криптографам - Криптография - Безопасность - Статьи

Регистрация | Вход

Меню сайта

Форма входа

Последние новости

[06.08.2013] CreepyDOL, или Как собрать конфиденциальную информ...

[02.03.2013] Новый шпионский вирус угрожает госучреждениям

[02.03.2013] Apple одержала победу над Samsung в Японии

[12.12.2012] Quest Software для Active Directory – ключ к безоп...

[01.10.2012] УЗИнфо - программа врача УЗИ

[23.08.2012] Gartner признает Quest Software одним из лидеров в...

[21.08.2012] Barracuda Web Filter 6.0. Социальные сети: казнить...

[21.08.2012] Quest Software выпускает Foglight для приложений W...

[14.08.2012] Банк «Софийский» выбрал решения Kerio Technologies...

[12.06.2012] Решения Firemon для управления гетерогенными систе...

Наши друзья

Наш опрос

Наши друзья

Главная » Статьи » Безопасность » Криптография |

IT безопасность	IT безопасность	Windows 9x/NT	Защищаем
Unix/Linux	Безопасность в Internet	Криптография	Другое

Декодировщики - начинающим криптографам

В предельно четком и стандартизованном мире компьютеров и всего, что с ними связано, если вдуматься, сложилась немного парадоксальная ситуация. Да, стандартизовано практически все, что только возможно, но самих этих стандартов на каждую мелочь так много, что нетрудно попасть впросак даже с самыми главными компонентами ПК, пытаясь, например, "воткнуть" свежераспакованный третий "пень" в Socket370 вместо устаревшего "Селерона", или память SDRAM в разъемы SIMM. Производителям железа все сложнее договориться о единых спецификациях на новое оборудование - достаточно вспомнить, на сколько оказалось из-за этого задержанным повсеместное внедрение DVD - в результате даже сегодня такой привод не так часто встретишь. Не наблюдается просвета и в программном обеспечении. Запустил новую игру, а оказалось, что она способна продемонстрировать все свои трехмерные достоинства только на видеокартах от 3DFX, и надо "качать" из Интернета патч, чтобы поиграть в нее на TNT. Новая программа не может интегрироваться с Internet Explorer 5, надо с ней работать - попробуй вернуться к четвертому "Эксплореру", если готов ради этого "снести" целиком Windows'98SE.

В идеале, хотелось бы, чтобы таких проблем было как можно меньше, и простой "чайник" не морщил лоб в попытках понять, почему что-то не работает или не запускается, а программы и "железо" были полностью совместимы не только друг с другом, но и разными операционными системами. И, несмотря на то, что богатством выбора операционнок похвастаться абсолютно нельзя, и нам хотелось бы иметь гораздо больше альтернатив "форточкам", немногочисленные создатели ОС не сделали (да и не смогли бы сделать) так, чтобы, например программы для Windows работли хотя бы под набирающим популярность Linux в чем-то типа виртуальной машины (что-то похожее, кстати, уже есть, но на неофициальном уровне ). Помечтать не вредно, скажете вы, с монополией на перспективную технологию никто по доброй воле не расстанется и с конкурентом своей документацией и исходными кодами не поделится. Безусловно, все объясняется не только тем, что мы находимся только на заре развития информационных технологий, и стандарты, не успев родиться, тут же устаревают, оставляя, тем не менее, нам в наследство в качестве своего праха необходимость их поддержки в будущих продуктах. Во многом виноваты и разработчики, желающие сегодня же урвать кусок пожирнее от большого пирога научно-технической революции и не думающие об исторической целесообразности своих разработок. Кто-то не хочет открыть код своей операционной системы, даже если б это ничего кроме пользы для компьютерного сообщества не принесло, кто-то изобретает велосипед, продвигая свой собственный стандарт, лишь бы не использовать спецификации конкурента, кто-то патентует кучу разных слотов под почти одинаковые процессоры только для того, чтобы пользователи тратили больше денег на апгрейд компьютеров, меняя материнскую плату вместе с новым процессором. Возможно, все это было бы не так и важно: рынок - закон джунглей, ничего не поделаешь, но сталкиваться с совершенно излишним многообразием стандартов приходится почти каждый день в самых разных мелочах. Очень неудобно постоянно преодолевать какие-то неудобства, нами же и порожденные.

Купили вы, например, новый компакт-диск с очень нужной программой и, засунув его с чувством глубокого удовлетворения в привод CD-ROM, первым же делом находите файл READ.ME, давите левую кнопку мыши и читаете… Нет, ничего не читаете, потому что в "Блокноте" вместо русских букв сплошные крякозябры. Текст оказался в DOS-кодировке… Можно, конечно его и не читать, но вдруг там написано, что программу надо устанавливать только в корень диска С:\, а при инсталляции в другое место она ни за что не заработает? Приходится, забыв про все продвинутые технологии Windows, запускать старый добрый "Нортон", жать заветную "F3" и ломать глаза от шестидесяти герц полноэкранной DOS-сессии. Хорошо, если надо прочесть 10 строк READ.ME, а если вы закачали из Интернета полмегабайта "Нейромантика" Уильяма Гибсона? К концу книги придется очки заказывать. А все из-за того, что компания Microsoft пошла своим путем при создании Windows и придумала собственную кодировку, называемую в просторечии Win-1251, не позаботившись, как обычно, о конечном пользователе, которому, понимаешь, нужна поддержка Блокнотом еще и "ДОСовской" кодовой страницы 866, созданной, кстати, самим же Microsoft. В результате "на ровном месте" возникла еще одна проблема для неискушенного пользователя.

Но это еще не самый худший случай! Из-за доставшихся нам от разных UNIX'ов, DOS'ов, Макинтошей, кодировок, русскоязычные завсегдатаи Интернета постоянно сталкиваются при серфинге по Сети с непонятными иероглифами вместо русских букв на многих страницах Рунета. И если в последних версиях наиболее популярных броузеров достаточно легко переключить кодовую страницу с помощью меню "Вид" - "Кодировка", расшифровав, таким образом, весь текст на сайте, то письма, прошедшие через несколько почтовых серверов, созданных на разных операционных системах, и похожие больше на пляшущих человечков Конан-Дойля, прочитать порой могут только в ФСБ. Чтобы из-за непонятных манипуляций с почтовыми сообщениями по пути их следования до адресата не изучать криптографию, приходится опять "навешивать" на систему дополнительные утилиты - перекодировщики, способные восстанавливать исходный текст даже после многократных его искажений почтовыми серверами, которые, видимо, все-таки запрограммированы делать как лучше, а получается...

Программ, предназначенных для перекодировки текстов на рынке достаточно много, найти их легко среди коллекций софта на сайтах типа http://www.download.ru/, практически все они отечественного происхождения, и почти полностью удовлетворяют любые потребности пользователей, но различия в функциональности и специализации, все-таки имеются. Чтобы каждый смог выбрать среди всего многообразия этих хороших программ то, что нужно именно ему, я попытался потестировать несколько самых популярных программ-перекодировщиков. Некоторые из них являются полноценными текстовыми редакторами, другие разработаны исключительно для быстрого перекодирования целых пакетов файлов, но всех их объединяет одно: они дают нам то, что разработчики самой популярной операционной системы, забыв о конечном пользователе, не пожелали учесть при ее разработке - совместимость со всеми текстовыми стандартами.

TPZ Recoder
http://www.geocities.com/baja/3519/sof

Recoder очень пригодится веб-дизайнерам, которые иногда вынуждены создавать несколько вариантов одних и тех же HTML-документов в разных кодировках. Он служит только для изменения кодировки исходных файлов и теоретически не предназначен для расшифровки вашей почты. Эта небольшая узкоспециализированная программа выполнит одновременное перекодирование группы файлов в любую из кодировок WIN, DOS, KOI, ISO, MAC, LAT, или даже во все сразу, создав для каждого варианта свою папку с соответствующим названием. В работе предельно проста и удобна. Единственный ее недостаток заключается в необходимости знать исходную кодировку файла, но если его создали вы же сами, то это, разумеется, не составит никаких проблем. В качестве конкурента можно посмотреть, например, программу "Перекодировка Кириллицы" (http://reality.sgi.com/victors/), которая чуть менее удобна в работе из-за того, что перекодирует за раз только в один вариант текстового стандарта и вместо помещения полученного файла в новую папку, просто заменяет старый, сохраняя, правда, его резервную копию. Поэтому, хотя она и "понимает" еще и формат "Unicode", для разработчиков сайтов подходит все-таки меньше, она скорее ориентирована на единичное, неожиданно потребовавшееся перекодирование, чем на постоянную работу с кодировками.

Tcode
http://alexboiko.chat.ru/

Эта утилита предназначена уже для автоматического или ручного декодирования "убитых" почтовых сообщений и новостей из UseNet. При восстановлении поддерживаются кодировки Dos, Windows, KOI-8, ISO 8859-5 и их комбинации, а также преобразования текста из форматов Base64, Quoted-Printable, HTML и UTF-8. По утверждениям автора, отличительная особенность программы - использование быстрого эвристического алгоритма распознавания русских слов, в результате чего TCODE должен превосходить по скорости и точности другие подобные программы. С программой максимально удобно работать, используя буфер обмена при чтении электронных писем и новостных телеконференций, достаточно кликнуть мышкой на значок TCODE в системной области панели задач. С простыми случаями порчи текстов программа вполне справляется, однако с текстом вида ï&icirc, полученном при сохранениии HTML-странички с ошибочным параметром CHARSET, и с очень сложным вариантом специально неверно перекодированного раза три файла она не разобралась. Не работает она и с транслитерацией - русскими словами, написанными латиницей. Возможно, в будущих версиях ее функции будут расширены, пока же она подойдет, скорее, для неискушенного пользователя благодаря своей простоте и скорости работы.

SHTIRLITZ
http://www.download.ru/

"Штирлиц" вполне оправдывает свое название благодаря очень мощному механизму расшифровки испорченных текстов. Количество поддерживаемых кодировок (вам встречалась кодовая страница 855?) и схем транслитерации просто огромно, причем, легко добавить еще и свою собственную схему кодирования. Можно сделать читаемыми даже тексты, в которых встречаются несколько кодировок в одном файле, HTML-файлы, при создании которых был неправильно указан charset (ï&icirc), тексты, написанные нестандартной транслитерацией или набранные в неверной раскладке клавиатуры. "Штирлиц", в отличие от большинства аналогов, восстанавливает русский текст, состоящий из выдуманных слов, что говорит об оригинальности механизма распознавания кодировки. Тексты почтовых сообщений, закодированные с помощью uuencoding, xxencoding, base64 и binhex принимают свой нормальный вид автоматически и за доли секунды. Режим пакетного декодирования, правда, не настолько удобен, как в программе TPZ Recoder, так как единовременно возможно перекодирование только в один стандарт, но зато блестяще реализована настраиваемость программы - не каждый пользователь сразу разберется во всех режимах и функциях. К счастью, установки, принятые в программе по умолчанию, вполне достаточны для подавляющего большинства случаев, поэтому трудностей в работе с ней ни у кого не возникнет - автоматическая работа "Штирлица" и активное использование буфера обмена предельно облегчают восстановление текстов и электронных писем. А когда пользователь немного поближе ознакомится с инструкцией и многочисленными примерами, то подстроит программу уже именно под свои, чаще всего встречающиеся схемы распознавания.

При инсталляции "Штирлица" в контекстное меню текстовых файлов добавится очень удобная команда "Открыть Штирлицем", жаль только что нельзя выбирать в опциях другие типы файлов, к которым надо добавить эту команду. Есть полезная функция преобразования HTML-документа в текстовый файл. Иногда, правда встречаются досадные упущения, например, пакетное перекодирование не работает с транслитом, сами файлы с текстом, записанным латиницей не всегда переводятся в нормальный вид, да и дизайн интерфейса программы несколько устарел, особенно удивляет огромная кнопка на одном из самых видных мест Панели Инструментов, случайное нажатие которой приводит к деинсталляции "Штирлица". Но в целом, это одна из самых мощных программ, справившаяся почти со всеми самыми сложными тестовыми файлами.

Hieroglif
http://www.adelaida.net/hieroglyph/

"Иероглиф" - самая большая программа обзора, она является абсолютно полноценным текстовым редактором, поддерживающим даже проверку орфографии. Если вы будете набирать в нем тексты, то отучитесь выбирать раскладку клавиатуры при переходе от русских слов к английским - Иероглиф сделает это за вас автоматически. При настройке этой программы уже можно самому задать, к каким типам файлов добавится в контекстное меню команда "Открыть Иероглифом", что избавляет рядовых пользователей от возможных ошибок использования стандартного "виндового" средства настройки файловых ассоциаций - меню "Свойства Папок".

Поддерживаются все стандартные схемы кодировки, транслитерация возможна в обе стороны, что у конкурентов встречается довольно редко, причем при восстановлении русского текста из латиницы, имеется интерактивный режим, при котором практически исключены ошибки восстановления из нестандартных схем транслита. Очень много и других, очень нужных функций, делающих эту программу самой мощной среди протестированных: преобразование HTML-документа в текст, очистка текста после OCR-распознавания, сортировка строк списков по алфавиту, автоопределитель языка, переформатирование текстов и абзацев - все это позволяет максимально удобно работать с текстами, исправляя в них самые разные ошибки.

Панель инструментов "Иероглифа" предоставляет и практически все стандартные средства для полноценной работы с текстами - от выбора шрифта, до его цвета и поиска текста, ни в чем не уступая "виндовому" WordPad (еще чуть-чуть и получился бы Word J). Почти любую функцию можно вызвать прямо с Панели Инструментов, нажав только одну кнопку. К сожалению, на тестовом, сверх меры "запоротом" файле, "Иероглиф" себя никак не проявил, и ни одного слова из него не воспринял, выдав сплошные квадратики вместо букв. Не смог он прочитать и HTML-файл, сохраненный с неверным charset, который был легко до этого расшифрован "Штирлицем", да и многие файлы примеров, поставляемых со "Штирлицем", "Иероглиф" преобразовать в читаемый вид не смог. Раскодирование почтовых сообщений не автоматизировано, что явно вызовет затруднения у пользователя, даже если он не "чайник". В остальном же, это одна из лучших, если не лучшая, благодаря сумме всех своих возможностей и "продвинутому", современному интерфейсу, программа на рынке, причем бесплатная, что встречается уже все реже и реже. Иероглиф, пожалуй, скорее хороший текстовый редактор с функциями перекодировщика, чем специализированный декодер текстов.

Etype Mail Decoder
http://www.gorlach.etype.net/ecoder/

Специализация программы - расшифровка почтовых сообщений, сохраненных на диске с помощью Outlook Express, например, и с этим она справляется лучше "Иероглифа", но для декодирования приходится нажимать как минимум четыре кнопки, так как автоматического восстановления текста прямо при открытии файла, как в других программах, не предусмотрено. Интерфейс программы просто образец минимализма - операции с буфером, открытие и сохранение файла, выбор ручного или автоматического декодирования. Процесс самого декодирования, кажется, занимает несколько больше времени, чем у конкурентов. И хотя радует самый полный набор поддерживаемых форматов, но, тем не менее, несколько запутанных последовательностей "издевательств" над исходным файлом, ставит Etype Mail Decoder в тупик. В общем, простая программа, с достаточной мощностью для чтения вашей почты, которую могут установить себе те, кто хочет быть уверен, что в случае чего, сумеет быстро прочитать важное сообщение. Если же ваш почтовый ящик каждый день "пухнет" от писем, то подберите что-нибудь более автоматизированное.

Конкуренты

Что еще можно попробовать кроме рассмотренных программ? Достойных программ много, и хотя они практически аналогичны по своим возможностям и назначению, у каждой есть свои "изюминки", описать которые в небольшой и субъективной журнальной статье невозможно. Посмотрите сами, может быть, вам больше понравится SNK Decoder (http://www.snkey.net/) или Реаниматор (http://www.ars.ru/products), на сайте http://www.download.ru/ рубрика перекодировщиков содержит не один десяток утилит, среди которых каждый найдет именно то, что нужно для его работы. А что касается меня… Вот если бы объединить скорость "Блокнота", интерфейс и функциональность "Иероглифа", интеллект и мощь "Штирлица"…

Информация к размышлению…

ALT (Ms-Dos 866) - альтернативная кодировка DOS (кодовая страница 866), разработка Microsoft и IBM, применяется в операционных системах MS-DOS, PC-DOS, DR-DOS, OS/2 и в FidoNet.
Примерный вид в "Блокноте": вҐЄбв ў бҐи ®© Є®¤Ёа®ўЄҐ.

КОИ-8 - она же KOI8-R, код обмена информацией восьмибитный, разработан в советских НИИ, используется во многих клонах ОС UNIX, таких как Linux и FreeBSD; сообщения электронной почты, пересылаемые по Интернету также используют эту кодировку.
Примерный вид в "Блокноте": рЕТЕД ЪБЗТХЪЛПК ХВЕДЙФЕУШ

Macintosh 10007 - MAC - русская кодировка на компьютерах Macintosh с операционной системой MacOS.
Примерный вид в "Блокноте": "лЯ его прочтениЯ

ISO 8859-5 - русская кодировка в UNIX-системах, разработка International Standards Organization, используется в основном, операционной системой Sun Solaris, работающей на компьютерах SUN.
Примерный вид в "Блокноте": вХЪбв Т бЬХиРЭЭЮЩ ЪЮФШаЮТЪХ

Windows-1251 - Microsoft code page 1252 детище всемирно любимой фирмы, используется в Windows9x, WindowsNT, одна из самых распространенных в Интернете.

Latinica, Translit, TRANS - транслитерация, запись русских слов латинскими буквами: Vsem privet!. Используется в системах, не поддерживающих кириллицу в принципе.

Unicode - 16-битная кодировка, каждый символ представлен двумя байтами - возможно, самая перспективная и удачная кодировка сточки зрения совместимости, но используется редко. Включает в себя 65536 знаков, а не 256, как обычные.

Quoted printable - семибитная вида =C2=EE=F2 =EE=ED=E0 - используется при кодировании русских символов в почтовых сообщениях формата MIME.

Семибитная вида %C2%EE%F2 %EE%ED%E0 - также используется при кодировании русских символов в сообщениях электронной почты.

Семибитная вида \'c2\'ee\'f2 \'ee\'ed\'e0 - кодирование русских букв в файлах формата RTF.

Семибитная вида Уваж - фактически, это кодировка Unicode. Все "нелатинские" символы представлены в виде &#xxxx;, где xxxx - код символа в кодировке Unicode. Применяется некоторыми почтовыми программами.

UTF8 - кодировка применяемая для создания текста на нескольких языках. В почтовой программе Outlook Express она называется Unicode, что не совсем верно. Выглядит она приблизительно так: РЅРµРІРµСЂРЅРѕ.

UTF7 - также для создания текста на нескольких языках. Примерный вид: +BD8EQAQ+BDMEQAQwBD.

Base64 - популярная семибитная почтовая кодировка: ojZGVmaW5lIF9fQ09ORklHX0gN

BinHex 4.0 - кодировка для пересылки файлов через Сеть используемая в компьютерах Macintosh:
(This file must be converted with BinHex 4.0)
: #Nl$3S0#L0PEQ4TCJd+$3S[,b

Uuencode / Uudecode - кодировка для пересылки по почте двоичных файлов:
begin 644 config.h
1U](#0HC9&5F:6YE(%]?0T].1DE'7T

Категория: Криптография | Добавил: admin (03.10.2008)