PDA

Просмотр полной версии : Кластеризация карточек ресторанов.



pigman
20.04.2011, 13:19
Всем доброго времени суток.

Есть задача, которая ввела меня в ступор: никак не могу применить теорию к практике.

Есть база данных из двух табличек, в которых содержится информация о ресторанах, поля табличек наполовину одинаковые, наполовину - какие-то особенные характеристики ресторанов для каждой таблицы. В одной таблице могут быть дубликаты ресторанов из другой (если имена совпадают, проверяем, совпадают ли адреса - если да, то, значит, дубликат).

Конечная задача: выполнить кластеризацию карточек ресторанов, удалив дубликаты.

Я не знаю, в какую сторону двигаться и что делать, прошу помощи и совета.