Re: http://egrul.nalog.ru/ | |
---|---|
Евгений Банщиков Сообщений: 218 Откуда: Kurgan Дата регистрации: 09.04.2004 |
Надеюсь когда нибудь разработчики ПО для ФНС остановятся , а то их творческий энтузиазм начинает утомлять. Данные приходят в json формате. Кодировка - это utf-8 , но в специальном json представлении. Для декодирования можно воспользоваться такой функцией :
К сожалению , встроеного в win парсера для json нет , поэтому надо изворачиваться самим , например так :
и пример парсинга
|
Re: http://egrul.nalog.ru/ | |
---|---|
Igor Korolyov Сообщений: 34580 Дата регистрации: 28.05.2002 |
Через Strtran да GETWORDNUM очень уж неэффективно получается. Плюс к тому все символы вне описанного диапазона идут лесом - IMHO лучше "посимвольно" разбирать. Нечто типа
P.S. И это не UTF-8, это Си-подобно экранированный UTF-16. САМ json вроде как по стандарту должен передаваться в UTF8, но в данном случае имеет место банальный ANSI - все символы с кодами выше 128 заэкранированы в \u ------------------ WBR, Igor Исправлено 1 раз(а). Последнее : Igor Korolyov, 19.04.12 20:21 |
Re: http://egrul.nalog.ru/ | |
---|---|
of63 Сообщений: 25161 Откуда: Н.Новгород Дата регистрации: 13.02.2008 |
Тоже, приложу "для истории" (де)кодеры, почти все оказались нужны для получения инф. из интернет. Без претензии на эффективность. Основная идея STRINGencoder - возможность задавать последовательность нескольких преобразований, списком, когда новые преобразования придумаются, я туда просто еше один (два) CASE допишу...
...и подпрограмма извлечения числа из строки/памяти iSUBSTR (без нее можно было обойтись): |
Re: http://egrul.nalog.ru/ | |
---|---|
of63 Сообщений: 25161 Откуда: Н.Новгород Дата регистрации: 13.02.2008 |
Да, кстати, непонятно (праздные, наверное, вопросы):
- зачем на одной интернет-странице (на сабже) используются несколько разных кодировок? непроизвольно при разработке страницы, или это вообще неуправляемый разработчиком процесс в разных "пхп,жквери,аяксах"? - зачем разработчики на этой странице (на сабже) стали усложнять процесс получения рисунка капчи, применять какой-то хитрый механизм возврата данных на страницу - просто так, или для сокрытия от роботов? Разве просто наличие капчи не есть достаточная защита от роботов? - можно ли так закодировать возвращаемую информацию, например зашифровать по ключу, хоть по коду капчи, чтобы информация была вообще глазу "непонятна", а скрипты страницы ее расшифруют и правильно изобразят на экране? Тогда без запуска скриптов (или запуска IE) вообще нельзя будет разобрать ответ сервера... |
Re: http://egrul.nalog.ru/ | |
---|---|
Igor Korolyov Сообщений: 34580 Дата регистрации: 28.05.2002 |
Думаю что хотели сделать "по взрослому" - без дурацкого полного перезапроса всей страницы для обновления лишь небольшого её кусочка. Уж для капчи это практически везде делают - если предложенная капча не читается, то можно запросить другую - тянуть же при этом и всё прочее - нехорошо.
А уж что они положили с прибором на всяких "роботов" пользующих сайт внутри программ - так полное их право. Они, в конце концов, не АПИ предоставляют для поиска по базе Думаю что следующим логичным шагом было бы именно предоставление удобного программного интерфейса (веб сервис, например) - но за денежку ------------------ WBR, Igor |
Re: http://egrul.nalog.ru/ | |
---|---|
Alsim Автор Сообщений: 3636 Откуда: Екатеринбург Дата регистрации: 17.11.2004 |
|
© 2000-2024 Fox Club  |