Идея родилась несколько лет назад и была до банальности проста: kad.arbitr.ru - сайт, где "живут" гражданские и иные дела - просто бездонный кладезь ценной информации для юридической фирмы. В материалах дел должны быть компании, которым предъявили иск и которые еще не знают об этом, не готовы, не могут или не хотят сами ходить в суды. Осталось только найти эти фирмы и достучаться до них.
Сказано - сделано. Вооружившись python и базовыми знаниями его синтаксиса, пара юристов решили выяснить, что из этого получится.
В начале.
Все шло хорошо. Зайдя на сайт kad.arbit.ru с помощью selenium, перейдя в календарь судебных заседаний, указав суд и выбрав месяц на календаре - сайт отдавал назначенные заседания:
И вот тут начались первые проблемы. Если заседаний было слишком много. А по мнению, kad.arbitr - это больше 1000, то сайт выплевывал:
Хм. Зачем тогда вообще нужна эта информация, если ее нельзя посмотреть ?
Но, да ладно, юристы были не жадные и пропускали данные дни, переходя в доступные. Открывалась примерно следующая картина:
Оставалось все это собрать в какой-нибудь пакетик csv, например. При этом сохранив дело, компанию-ответчика и ссылку на дело.Получалось примерно следующее - посмотреть.
При сборе по спискам дел за месяц, урожай получался бохатым.
Что было далее.
А далее предстояло повыкидывать из списка неформат, а именно:
ФГУПЫ, МУПы и прочие - у них, как правило есть штатные юристы либо они вообще не ходят на заседания;
банки, склянки, страховые, ПАО - там точно помощь не нужна, если это только не мелкий процесс, на который им лень идти;
физ. лиц, как ни странно. У них просто нет адресов, куда направлять письма (не у всех, но как правило). ИП тоже под вопросом.
ТСЖ, ТСН - по желанию, так как они, как правило, судятся сами либо с ними все сложно в плане взаимодействия.
В сухом остатке - ООО и АО, но и их, все равно, остается достаточно. На выходе получалось примерно так - посмотреть.
*Несмотря на то, что в делах бывает несколько ответчиков и не бывает вовсе оО (например, в делах по установлению юр. фактов) python затолкал в csv и их.
По сути это и есть клиенты - можно смело открывать ссылки на дела, искать адрес и писать свои коммерческие предложения, которые потом смело пойдут в корзину.
Искать адрес потенциального клиента.
Тоже оказалось не просто. От Pyhton требовалось ходить по сохраненным ссылкам дел, сохранять адреса. Но адреса были либо неполные, либо кривые, либо скрыты (оО), либо их не было вовсе(хотя должны были быть).
Но Python хорош своей гибкостью и, применив немного упорства, на выходе получалось - так.
Что дальше ? Писать письма ! Но вручную клепать почтовые конверты, даже если есть комбинации CTRL+C, CTRL+V и сайт по заполнению конвертов...
Сайт по заполнению конвертов.
Пришелся как нельзя кстати. Не для рекламы ради, но этот сайт действительно сильно помог в тиражировании конвертов. Заполнял их конечно python, прямо на сайте konvert-online.ru
Готовый конверт для примера - посмотреть.
Чем все закончилось.
К сожалению, хорошие истории не всегда хорошо заканчиваются.
В этот раз все завершилось профессиональным выгоранием человека, относящего пачки конвертов с коммерческими предложениями на почту. В глазах этого человека также отражалась боль сотрудников почтового отделения, недоумение продавца конвертов и негативные мысли получателей писем от неизвестной юридической фирмы как назойливое напоминание о предстоящем суде.
Недавно выяснилось, что kad.arbitr.ru окончательно уничтожил возможность по сбору данных c помощью selenium или, вполне может быть, в этом пункте два юриста ошибаются.
Код и инструкция для ознакомления - скачать.