:: Архив конференции по VFP до 2005 года
Re: Поиск словосочетаний в офисных документах
Hel!Riser

Сообщений: 10452
Откуда: Нижний Новгород
Дата регистрации: 11.03.2001




Отредактировано (11.03.05 11:27)


------------------
Осторожно - глисты!
Ratings: 0 negative/0 positive
Re: Поиск словосочетаний в офисных документах
piva

Сообщений: 18655
Откуда: Курган
Дата регистрации: 24.03.2004
Help Filer
tools\filer\ там лежит собственно filer.dll и форма для примера как с ним работать - тока он unocode не понимает




------------------
Часто бывает так, что есть над чем задуматься, а нечем.
Ratings: 0 negative/0 positive
Re: Поиск словосочетаний в офисных документах
Igor Korolyov

Сообщений: 34580
Дата регистрации: 28.05.2002
Hi, Каратаев!

Посмотри в MSDN про Indexing Service. У меня это следующая ветка:

ms-help://MS.MSDNQTR.2004JUL.1033/dnanchor/html/indexserv.htm

В частности там написано про Ole DB Provider к базам этого поискового
механизма.

P.S. Только мысли - сам не решал таких задач.




------------------
WBR, Igor
Ratings: 0 negative/0 positive
Re: Поиск словосочетаний в офисных документах
Каратаев
Автор

Сообщений: 3977
Откуда: Алматы
Дата регистрации: 04.12.2001
Цитата:
Посмотри в MSDN про Indexing Service
MSDN у меня не установлен... Попробую у них на сайте пошарить
Цитата:
там лежит собственно filer.dll
Не... Filer не катит. Он в Excel вообще ничего не находит. Мой код находит все, но чувствителен к регистру, причем именно в Excel.




------------------
Никогда не бывает настолько плохо, чтобы не могло быть еще хуже.
Ratings: 0 negative/0 positive
Re: Поиск словосочетаний в офисных документах
Igor Korolyov

Сообщений: 34580
Дата регистрации: 28.05.2002
Hi, Каратаев!

Он не может находить всё - это исключено - структура Excel/Word документов достаточно сложная, в частности они "блочные", а значит одно слово может физически быть разрезано на части, хранящиеся НЕ рядом друг с другом (пуская и не большая вероятность, но она есть). Кроме того есть ещё pdf, chm, простые тексты, HTML (который может быть например закодирован в Base64 или QuotedPrintable формат)... В общем универсальность такого решения стремительно падает с ростом числа ТИПОВ разных документов. Хотя для КОНКРЕТНО DOC или КОНКРЕТНО XLS наверняка можно сделать что-то достаточно простое...




------------------
WBR, Igor
Ratings: 0 negative/0 positive
Re: Поиск словосочетаний в офисных документах
Guest_Petrov
ИМХО

DO CASE
CASE m.ext='DOC'
m.oword.find('Что ищем')
CASE m.ext='XLS'
m.oexcel.find('Что ищем')
CASE INLIST(m.ext,'TXT','HTM')
m.str=filetostr('Название файла')
AT('Что ищем',m.str)
...
ENDCASE

Те лучше искать средствами самого редактора. Скорочть небольшая но вроде бы гарантии есть...
Ratings: 0 negative/0 positive
Re: Поиск словосочетаний в офисных документах
Каратаев
Автор

Сообщений: 3977
Откуда: Алматы
Дата регистрации: 04.12.2001
Guest_Petrov
Цитата:
лучше искать средствами самого редактора
Да, это вышло надежней. Правда с макросами пришлось повозиться, выискивая правильные параметры команд find для word и excel... И еще если заранее перед поиском открыть по экземпляру word и excel, а в поиске только открывать в них
доки, то выходит несколько быстрее. Так, по сети 21 файл различных типов - 10 сек. А в локалке - 3 сек. Но пока другого удобоваримого варианта не нашел.
Igor Korolyov
Цитата:
Он не может находить всё - это исключено - структура Excel/Word документов достаточно сложная
Да, к сожалению... в частности не смог решить проблему поиска фразы целиком, зато слова ищет вмиг.
Цитата:
В общем универсальность такого решения стремительно падает с ростом числа ТИПОВ разных документов.
Этот код оставил только для TXT и HTML, для DOC, XLS - средствами самого редактора. Пока так... там видно будет.
Спасибо всем за советы.




------------------
Никогда не бывает настолько плохо, чтобы не могло быть еще хуже.
Ratings: 0 negative/0 positive
Re: Поиск словосочетаний в офисных документах
piva

Сообщений: 18655
Откуда: Курган
Дата регистрации: 24.03.2004
Саня смотри какую штуку нашел - может тебе подойдет

Цитата:
Google Desktop Search 1.0 Final
Компания Google выпустила окончательную версию программы для поиска информации на жёстком диске компьютера. Google Desktop Search поддерживает поиск по документам Microsoft Office, текстовым и HTML-файлам. После первого своего запуска поисковик в фоновом режиме начинает индексировать информацию, находящуюся на жёстком диске. В этой версии добавлена поддержка поиска по почтовым базам программ Netscape Mail и Thunderbird, кэшу браузеров Mozilla и Thunderbird, добавлен поиск картинок, музыкальных и видеофайлов, а также файлов формата PDF.

ОС: Windows 2000/XP
Англ. интерфейс | Бесплатно.
Google Desktop Search 1.0 Final
www.izcity.com




------------------
Часто бывает так, что есть над чем задуматься, а нечем.
Ratings: 0 negative/0 positive
Re: Поиск словосочетаний в офисных документах
Каратаев
Автор

Сообщений: 3977
Откуда: Алматы
Дата регистрации: 04.12.2001
Вадим
Цитата:
Саня смотри какую штуку нашел - может тебе подойдет
Спасибо. Я ее закачал и установил себе. Попырхался и ... снес
Google Desktop Search 1.0 Final почему-то при каждом обращении пытается вырваться в тырнет. Может ищет она и круто, но я не могу ее пользователям установить. Во первых у многих нет интернета, во вторых интерфейс англ. - это не для них. К сожалению... Вот если бы какая нибудь библиотека, которую я мог бы в свою оболочку обернуть...
Но в принципе я проблему поиска решил. Причем практически средствами фокса. Ищет надежно и быстро (относительно, конечно). До лучших времен такой метод устраивает. Да и поиск надо делать не в каких-то абстрактных документах, а в
определенной папке программы в определенных форматах (doc, rtf, xls, html, txt). Пока рулит, но по ходу будет видно, что да как.




------------------
Никогда не бывает настолько плохо, чтобы не могло быть еще хуже.
Ratings: 0 negative/0 positive
Re: Поиск словосочетаний в офисных документах
piva

Сообщений: 18655
Откуда: Курган
Дата регистрации: 24.03.2004
Я не проверял, просто подумал, может под эту штуку подлезть можно, но раз не помогло - жаль, я просто хотел помочь




------------------
Часто бывает так, что есть над чем задуматься, а нечем.
Ratings: 0 negative/0 positive


Извините, но у вас нет прав для того, чтобы оставлять сообщения в этом форуме.

On-line: 7 (Гостей: 7)

© 2000-2024 Fox Club 
Яндекс.Метрика