Как искать похожие карты пациентов? | |
---|---|
seg856 Автор Сообщений: 272 Дата регистрации: 23.09.2010 |
Как искать похожие карты пациентов, если в фамилии отличие на 1-2 буквы, в дате рождения отличие в цифре, чтобы найти дубли?
|
Re: Как искать похожие карты пациентов? | |
---|---|
PaulWist Сообщений: 14618 Дата регистрации: 01.04.2004 |
------------------ Есть многое на свете, друг Горацио... Что и не снилось нашим мудрецам. (В.Шекспир Гамлет) |
Re: Как искать похожие карты пациентов? | |
---|---|
pasha_usue Сообщений: 3649 Откуда: Е-бург Дата регистрации: 06.10.2006 |
Расстояние левенштейна.
|
Re: Как искать похожие карты пациентов? | |
---|---|
of63 Сообщений: 25254 Откуда: Н.Новгород Дата регистрации: 13.02.2008 |
Задача крайне непростая (сравнение фамилий) и человеческая. Например алг. Левенштейна (количество перестановок и замен для превращения одного слова в другое) даст:
Ачев - Ащев, Блум - Блюм - 1 символ, хотя Фамилии однозначно разные, и в тоже время Петров - Петроф, Петров - Летров - тоже 1 символ, но явно ошибка ввода или сканирования Далее можно попробовать измерять отношение разницы к длине фамилии, дальше еще что-то... Но 100 отличить ошибку от разной фамилии будет невозможно. Но вот наличие д/р позволит это сделать. Т.е если отличаются на 1-2-3 символа, и Д/Р СОВПАДАЕТ, то точно один и тот же человек. Также можно допустить и 1 цифру разницы в д/р... Вобщем только путь самостоятельного подбора алгоритма, на ошибки укажут заказчики задачи, они и подтолкнут в правильном направлении |
Re: Как искать похожие карты пациентов? | |
---|---|
AndyNigmatec Сообщений: 1573 Откуда: Волгоград Дата регистрации: 28.06.2015 |
За наводку на расстояния Дамерау-Левенштейна спасибо! ковырялся с иной нежели у ТС задачей - а тут така мысль))) |
© 2000-2024 Fox Club  |