Стажер по обработке данных

О командах

Функция инжиниринга данных (Data Engineering) является фундаментальной для успеха Netflix. Команды Data Science and Engineering (DSE) по всей компании работают над улучшением различных аспектов бизнеса. Они создают программные и data-решения, разрабатывают фундаментальные data-продукты, которые позволяют проводить сквозной анализ, запускать сложные эксперименты и получать ключевые инсайты. Это отличная возможность получить практический опыт работы с новыми технологиями и уникальной культурой компании.

Кого мы ищем

Мы ищем любознательного, инициативного, мотивированного студента, который умеет работать в команде и хочет учиться у опытных инженеров. Вы увлекаетесь решением задач и уверенно чувствуете себя при работе со сложными, открытыми проблемами, используя data-подходы.

Обязательные требования

Образование: действующее обучение по очной аккредитованной программе магистратуры (M.S.) или аспирантуры (Ph.D.) в области компьютерных наук, инженерии, Data Science или смежной технической специальности. Окончание программы — декабрь 2026 года, лето 2027 или позже.
Возврат в учебное заведение: после летней стажировки вы должны возвращаться на учёбу минимум на один семестр или четверть.
Языки программирования: уверенное владение хотя бы одним основным языком, таким как Python, Java или Scala.
SQL: хорошие базовые знания SQL (любой диалект).
Структуры данных и алгоритмы: уверенное владение основами.
Инженерные практики: опыт применения best practices разработки ПО (система контроля версий, тестирование, код-ревью).
Коммуникация: отличные навыки общения и работы в команде.
Желательные навыки:

Опыт работы с большими объёмами данных в рамках предыдущих проектов или стажировок.
Знание распределённых фреймворков (например, Spark, Kafka) и архитектур распределённых систем.
Знание MPP/Cloud data warehouse решений (например, Snowflake, Redshift, BigQuery, Hive, Iceberg).
Опыт проектирования схем (schema design) или моделирования данных.
Опыт подготовки и обогащения данных для конвейеров машинного обучения.

Чем предстоит заниматься

Вы будете полностью интегрированы в команду инжиниринга данных и получите проект с высоким влиянием на бизнес. Ваши задачи:

Тесное сотрудничество с дата-сайентистами, аналитиками, продуктовыми менеджерами и старшими инженерами для понимания аналитических потребностей и их трансляции в масштабируемые data-решения.
Проектирование, создание, развёртывание и поддержка надёжных конвейеров данных (data pipelines).
Создание data-продуктов, которые отвечают на высокоприоритетные бизнес-вопросы.
Изучение и применение лучших практик моделирования данных.
Помощь в повышении автоматизации и масштабируемости сложных наборов данных.
Получение опыта применения принципов инжиниринга данных для решения задач интернет-масштаба.

Условия стажировки

Длительность: 12 недель (летом).
Локация: офис в Лос-Гатосе или Лос-Анджелесе, Калифорния (в зависимости от команды, при условии действующих ограничений).

Стажер по обработке данных

Описание

Похожие вакансии