Доброго времени суток, уважаемые форумчане!
Делаю интеграцию одного сайта с 1С. Хочу всех пользователей из 1С создать на сайте. Но есть проблема, что в 1С ФИО хранились как попало, иногда не полностью, в одной строке со всяким мусором, а в БД сайта должно быть в разных полях и с минимумом ошибок. Пример строк:
1. a@a.com Гадя Петрович (мед.сестра)
2. b@b.com Иванов должен 1000р Иван Иванович
3. Лена Головач c@c.com
Емайл можно выделить регулярным выражением, отчества по окончанию с 99% точностью, но фамилия и имя - это геморрой.
Есть ли в природе публичный веб-сервис, которые может распознавать имена? Или справочники всех возможных русских фамилий, имен и отчеств. Понятно что будет много мусорных слов и придется загрузку делать интерактивной, но хотелось бы сократить участие пользователя до минимума.
(0) обычная задача. дается команда ответственному менеджеру на стороне заказчика, и он за вечер приводит всех контрагентов к нужному шаблону. заодно и практическое занятие на тему "Как правильно заводить контрагентов в базу"
Требовать и эффективности, и гибкости от одной и той же программы — все равно, что искать очаровательную и скромную жену... по-видимому, нам следует остановиться на чем-то одном из двух. Фредерик Брукс-младший