За время существования компании мы накопили много данных и разных инструментов аналитики. На этих данных мы строим предложения для новых клиентов и продлеваем старых, проводим переговоры с клиниками и непосредственно помогаем нашим пациентам. Главная задача — весь этот информационный поток перенести в чётко организованную систему сбора, обработки и анализа данных любого объёма.
Сейчас мы планируем вести сборку data lake house на базе GreenPlum, куда будут сливаться данные всех источников, таких как, PostgreSQL, Yandex, сторонние API и др.). Также у нас будет большой проект с фичастором и MLFLOW. В твоих задачах будет много архитектуры и хорошего продакшн кода, перенос, рефакторинг старого и написание очень динамического и автоматизированого нового, а также опыт с очень крутым датасайнсом, аналитикой и продуктом