Описание вакансии
Контур — экосистема для бизнеса. Наши сервисы помогают каждой третьей компании России делать рабочие процессы проще и эффективнее: вести бухгалтерию, сдавать отчетность в госорганы, обмениваться документами без бумаги, общаться друг с другом на удаленке и многое другое. С нами жизнь 2,5 млн предпринимателей и их сотрудников становится легче.
Центр искусственного интеллекта в Контуре помогает зарабатывать деньги за счет технологий машинного обучения и Big Data. Например, чат-бот Сирена экономит около 25% времени консультантов техподдержки в чатах, а технология распознавания речи обрабатывает тысячи лет записей каждый год.
В команде центра ИИ работает более 70 человек: специалисты по Data Science, разработчики и аналитики данных, DevOps-инженеры, QA, системные аналитики, product- и project-менеджеры.
Для поддержки и развития инструментов и научной базы в центре ИИ есть лаборатории, каждая из которых специализируется в своей области машинного обучения: CV, Speech/NLP, ML4SE.
Мы ищем опытного коллегу в Speech-лабораторию. Работа будет разнообразной — от проведения исследований до передачи знаний в прикладные команды и публикации статей.
Задачи:
-
Разработка алгоритмов и моделей распознавания речи (обучение акустических моделей), в том числе для потокового распознавания.
-
Работа с языковыми моделями.
-
Cоздание и модификация алгоритмов декодирования, рескоринга.
-
Создание и сопровождение программных компонентов.
-
Проведение экспериментальных исследований, написание научных статей.
-
Создание датасетов для обучения и валидации (для разметки есть своя асессорская служба).
Наши ожидания:
-
Широкая насмотренность и опыт работы в области обработки речи (ASR/TTS) или обработки естественного языка (NLP).
-
Знание алгоритмов: динамическое программирование, алгоритмы на графах.
-
Хорошая базовая математическая подготовка: знание методов статистического анализа данных, построения математических моделей.
-
Опыт реализации моделей, описанных в научных статьях.
Будет плюсом:
-
Опыт работы с Triton Inference Server.
-
Наличие научных публикаций или проектов на GitHub.
-
Кандидатская диссертация в рассматриваемой или смежных областях.