Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
Михаил,
спасибо за такой файл. Никогда бы такого не встретил. Вот, что значит выходить на общий форум. Разобрался с проблемой. Все мои pdf и все примеры, которые я видел в разборках на разных форумах и ресурсах имеют уникальный объект Kids. Т.е. он один для всего файла. У вас же в файле AA.pdf их 3 шт. Не понятно почему.... страниц в файле у вас не так много.... зачем их помещать в разные объекты Kids? Видимо какое-то старое ПО используете для формирования pdf..... Ну раз мне такой файл попался, я предусмотрю такую ситуацию. Скорей всего сегодня обновлю prg. Prg обновил. Там же на github.com, версия от 03.05.2024 Исправлено 1 раз(а). Последнее : kornienko_ru, 03.05.24 08:54 ![]() |
Re: djvu в image | |
---|---|
lemenev Сообщений: 229 Дата регистрации: 23.06.2022 |
Почему ваша программа «раздувает» файл? Вот статистика:
Исходный файл Результирующий файл 18 стр. 282 977 B 2 стр. 286 124 B 435 стр. 7 583 983 B 435 стр. 7 774 641 B И вот ещё один файл, на котором программа совсем не работает: ![]() |
Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
Раздувание исправил. Дубликаты объектов записывались в случаях неотсортированных по порядку объектов. Но еще последний рывок надо сделать с раздвоением объекта Kids. Видимо в файле AA было когда-то такое своеобразное объединение двух pdf. Я напишу когда будет готово. Надо немного передохнуть, а то уже к старости мозги хуже работают.
![]() |
Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
Михаил,
а фал CC.pdf Edge открывает только одну страницу с бланком Aliyah Fragebogen /Bitte nur vom Familienmitglied, der die jüdischen Wurzeln hat, ausfüllen. Так и должно быть? Есть подозрение, что этот файл испорчен. ![]() |
Re: djvu в image | |
---|---|
lemenev Сообщений: 229 Дата регистрации: 23.06.2022 |
в этом файле одна страница.
![]() |
Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
|
Re: djvu в image | |
---|---|
lemenev Сообщений: 229 Дата регистрации: 23.06.2022 |
Файл не испорчен. Вместо ü идут буквы с умляутом (две точки над буквой). Возможно, у вас что-то с отображением европейских шрифтов. Исправлено 1 раз(а). Последнее : lemenev, 03.05.24 21:19 ![]() |
Re: djvu в image | |
---|---|
sphinx Сообщений: 31888 Откуда: Каменск-Уральски Дата регистрации: 22.11.2006 |
Вот с уважением к товарищу Леменеву. На форум пришол с вопросами, а ДУХ сайта понял. Понял верно. В какой-то теме мне интересно (или больше знаю) - код пишу. Не всегда идеально верный. Но спасибо коллеги мне говорили неоднократно (допилят идею, я даже не сомневаюсь).
Так и надо. Сделал/решил свою проблему - выложить не забудь. Коллегам порой тонны часов сэкономите. Тем, кто и ВАМ поможет, потратит свое время. Мы коллеги и уважаем друг друга. ![]() ------------------ "Veni, vidi, vici!"(с) ![]() |
Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
Я не про немецкие буквы. Это так отобразилось на форуме. Я про структуру pdf. В описательной части этого файла указано, что в нем 131 объект. А на самом деле я насчитал 8. Также замечу, что официальные просмоторщики при наличии ошибок в файле их восстанавливают и отображают корректно, хотя на самом деле они сбойные. Как выяснилось по вашему CC.dbf cуществует 2 типа pdf. В одном типе перекрестные ссылки, которые я анализирую записаны в текстовом виде в десятичных числах. Этот тип широко распространен. А есть еще такой тип, где эти ссылки в двоичном представлении, как раз это имеет место в файле CC.dbf. Моя программа пока с такими работать не может. Возможно я этим займусь когда-либо, раз уж влез в эту тему. На сегодняшний день возникла идея доработать prg, чтобы при обращении без указания номеров страниц или с нулем, функция возвращала число страниц в этом pdf. Сегодня от 04.05.2024 сделаю такую опцию, обновлю. ![]() |
Re: djvu в image | |
---|---|
lemenev Сообщений: 229 Дата регистрации: 23.06.2022 |
Для меня, как не специалиста по формату PDF, все PDF файлы «на одно лицо». И если никогда изначально не знаешь, будет ли программа обрабатывать очередной файл, то «так жить нельзя». Посылаю ещё один файл для тестирования.
Да, программа не выдаёт диагностику, если указанный файл не существует. ![]() |
Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
Хорошо. Файл DD.pdf необычный, но первого типа. Я разберусь. Обновлюсь.
![]() |
Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
А вы думаете я специалист по формату PDF? Я тоже просто пользователь. За pdf я взялся неделю назад из любопытства. В своем разработанном комплексе по ТСЖ я формирую разные отчеты и квитанции, с помощью своего разработанного генератора отчетов, который я тут когда-то публиковал и здешние его качали и использовали (в генераторе задействован LibreOffice через COM) ... я только рад, несмотря на злыдней и завистников, которые меня критикуют и минусуют. И эти отчеты я сохраняю в pdf. Квитанции у меня на 1 лист. И для доступа к своей квитанции пользователя личного кабинета я извлекаю его лист из общего pdf с квитанциями. Вот для этой манипуляции мне это нужно было. Какие у вас цели я не знаю. Но всё идет вперёд, возможно LibreOffice тоже перейдет на новый формат новой версии pdf. То что касается файла DD.pdf при более внимательном рассмотрении оказалось, что он 2-го типа. Возможно смешанного типа, как и AA.pdf — полученный из двух pdf. Этим я ввелся в заблуждение, что он 1-го типа. На следующей неделе я более пристально его изучу. Этот 2-ой тип появляется с версий pdf от 1.5 и выше. Исправлено 1 раз(а). Последнее : kornienko_ru, 05.05.24 02:45 ![]() |
Re: djvu в image | |
---|---|
sphinx Сообщений: 31888 Откуда: Каменск-Уральски Дата регистрации: 22.11.2006 |
Все придумано до нас:
www.foxypreviewer.com А тут обсуждения по теме: forum.foxclub.ru ------------------ "Veni, vidi, vici!"(с) Исправлено 1 раз(а). Последнее : sphinx, 05.05.24 12:45 ![]() |
Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
Это не то.
Для меня то вопрос уже решен. Всё работает с файлами pdf версий до 1.4. То, что хотелось бы Михаилу с 1.5 версии..... я сделаю. Спецификация есть, формат понятен. В этом файле DD.pdf уже новый формат. Можно программу на нём откатать. ![]() |
Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
Возникло небольшое осложнение с файлами CC.pdf и DD.pdf. Дело даже не столько в версии PDF выше 1.5, сколько в отсутствии в этих двух файлах доступа к таблице перекрестных ссылок в связи с их шифрованием. Честно говоря я не вижу смысла, чтобы зачем-то надо было шифровать эту таблицу, все равно эту таблицу можно построить полностью просмотрев весь файл... просто это будет работать дольше, особенно это станет заметно на очень больших по размеру файлах. Признак того, что таблицы зашифрованы, это наличие ключей "/Filter/FlateDecode" в словарях таблиц, которые указаны в обоих файлах и CC.pdf, и DD.pdf. Да и видно, внешне, что таблицы нечитаемы и плотно сжаты. В связи с этим вопрос — как вы считаете лучше заложить логику в программу pdfToStr(). Проанализировать весь файл, потратить время и выбрать нужные страницы или выдать результат в виде пустого файла? Как вариант можно снять шифровку с таблицы перекрестных ссылок перезаписав этот файл, а старый переименовать в BAK.
Вот что сказано в официальной спецификации: Beginning with PDF 1.5, embedded files may be encrypted in an otherwise unencrypted document (see Section 3.5.4, “Crypt Filters”). Исправлено 4 раз(а). Последнее : kornienko_ru, 06.05.24 07:05 ![]() |
Re: djvu в image | |
---|---|
lemenev Сообщений: 229 Дата регистрации: 23.06.2022 |
Выдать результат в виде пустого файла – это расписаться в собственной беспомощности.
Перезаписывать исходный файл нельзя. Он может понадобиться в исходном виде в будущем. Остаётся единственный предложенный вами вариант – создавайте временный файл, в котором снимайте шифровку с таблицы перекрестных ссылок, и выбирайте нужные страницы. Сколько при этом вы потратите времени – не существенно. Потом можно оптимизировать процесс. ![]() |
Re: djvu в image | |
---|---|
kornienko_ru Сообщений: 415 Откуда: Владивосток Дата регистрации: 06.09.2015 |
Хорошо. Красиво было бы в памяти создать xref без создания временного файла. Но подумал, что каждый раз при обращении к этому файлу, особенно, если он очень большой, будет тратиться каждый раз лишнее время. Поэтому думаю записать рядом с исходным файл с похожим именем с незашифрованной таблицей xref. Процедура построения xref получилась на 50 строк. Завтра её прикручу, отлажу, обновлюсь. Будет больше, чем 50. На ваших тестовых файлах всё работает быстро, замедления особо не заметно.
![]() |
Re: djvu в image | |
---|---|
akvvohinc Сообщений: 4551 Откуда: Москва Дата регистрации: 11.11.2008 |
Сомневаюсь, что кому-то понравится такой вариант, который оставляет "следы" на диске и даже не в temp-папке. ![]() |
Re: djvu в image | |
---|---|
sphinx Сообщений: 31888 Откуда: Каменск-Уральски Дата регистрации: 22.11.2006 |
Сергей, я тоже против. Но порой это проще в реализации, чем за "чистоту-всего-и-вся". Использование темповых каталогов не гнушаются даже монстры забугорного софта. Фоксисты, все же более ответственно относятся к ресурсам, месту, правам и пр. Сам такой. ![]() ------------------ "Veni, vidi, vici!"(с) ![]() |
Re: djvu в image | |
---|---|
of63 Сообщений: 25982 Откуда: Н.Новгород Дата регистрации: 13.02.2008 |
Рядом с открываемым файлом оставлять свои следы - это не оч.хор. (как Эксели и Верд это делают - держат скрытые файлы открывающего, задолбали эти "скрытые" файлы с тильдами)
Можно в ТМП папке родного компа оставлять все что хочешь... (или в каком другом ТМП-месте) например, при первом открытии желаемого PDF оставлять файл его структуры (как вы его обозначили? "xref"?, хорошо), который имеет условленое имя (пусть сигнатура от имени целевого файла, типа SYS(2007, имя_файла_PDF)) Получится, что работая с этими сетевыми файлами на вашем компе, у вас будет в наличии готовый "xref". Недостаток этого метода - у соседа не будет... но можно скопировать. () Всё устроено на файлах и памяти Доб. Родного компа, и в моей родной учетной записи Доб2. Хотя есть место и для общего для всех юзеров "мусора", типа, в винде, "C:\Program Data" Исправлено 2 раз(а). Последнее : of63, 07.05.24 22:09 ![]() |
© 2000-2025 Fox Club  |