ML researcher with NLP/CV
Опыт от 1 до 3 лет
от 200.000 ₽ до 300.000 ₽
Описание вакансии
ML researcher with NLP/CV Dbrain.io
Кто мы такие?
В Dbrain мы решаем задачу извлечения данных из документов. Раньше нам казалось, что этот домен давно решен, но все еще даже просто распознавание А4 листа с высокой точностью не решается ни одной из компаний, а если вы еще хотите найти всю структуру, то шансов совсем мало. Наш продукт — это комбинация огромного числа алгоритмов в CV + NLP, сфокусированных вокруг распознавания и поиска структуры в документах.
Как мы устроены?
Внутри Dbrain мы стремимся создать среду в которой людям кайфово работать. Раз в 3 месяца мы проводим буткэмпы, вы можете учиться любым скиллам, в том числе не связанным напрямую с вашей ролью (например, как вообще создаются и работают стартапы, сейлз, маркетинг и другие направления).
Что предстоит делать?
– Ускорять и улучшать существующие решения, разрабатывать и внедрять новые. В основном занимаемо задачами: Text Detection, Text Recognition(OCR), NER, Table Parsing. – В работе все виды ускорения моделей: дистилляция и квантизация, а также перенос решений на мобильные устройства.
Вилка net RUB:
middle: 220k - 280k
senior: 280k - 400k
Исследуем:
– E2E подходы распознавания
– confidence estimation
– fraud detection
– fusion подходы
– Table Recognition
– Document structure recognition
Что мы ждём:
— Опыт работы от 2 лет
— Отличное знание PyTorch и numpy, opencv и/или huggingface
— Опыт вывода моделей в прод
—Экспертиза в CV/NLP
— Навыки быстрого чтения и суммаризации статей и успешная имплементация статейных решений/подходов
— Умение писать чистый код, быстро прототипировать эксперименты в Jupyter среде
— Умение аргументировать выбор метрик, методов и архитектур, системный подход к экспериментам
— Умение пользоваться git, Docker, ClearML
NLP:
— Text classification
— NER
— Unsupervised learning (MaskedLM, TSDAE etc.)
— Saiga, LLaMA, Mistral, LoRA, MoE,BERT, GPT
CV:
— Опыт в решении задач классификации, сегментации, детекции
— Навыки работы с Pillow / NumPy / SciPy/ Sklearn / OpenCV
Если обладаете опытом только в одной из областей, то не переживайте - пишите.
Будет плюсом:
— Опыт с оптимизацией моделей (TorchScript, onnx, openvino, torch Mobile, coreml);
— Понимание фреймворков HuggingFace, Deepspeed;
— OCR и связанные с ним задачи;
— Fraud detection/Confidence estimation/Entity linking;
— Опыт экспресс реализации MVP;
— Глубокий опыт в любой из задач, понимание механики актуальных методов;
— Технические статьи или хорошие результаты на Kaggle, исследовательский опыт;
— Публичные выступления;
— Опыт использования сервисов AWS и их возможностей;
— Опыт работы Scrum, Agile;
— Желание (или опыт) проведения активностей внутри компании по обмену знаниями, плюсом будут навыки промпт инжиниринга для любой LLM(ChatGPT тот же, Grok)
Что мы дадим:
— Возможность влиять на результаты бизнеса
— Быстро видеть результаты своей работы и пользу от внедрений
— Возможность понять, как реально работает стартап
— Инструменты для развития за пределами разработки
— Удаленную работу, при желании можно ходить работать в коворкинг в Москве
— Свободно заниматься техно-пиаром — статьи, конференции
— Крутой ДМС в клинике с доказательной медициной
— Спорт, ARG, английский
— Буткэмпы. Мы работаем на удалёнке, поэтому раз в 3-4 месяца выезжаем всей компанией на 7-10 дней в какое-то приятное место вместе: работаем, отдыхаем, общаемся. Уже были в Армении, Геленджике, Казани, Красной поляне