Стажер по обработке данных
Netflix
Москва
Полная занятость
от 1 года
Описание
О командах
Функция инжиниринга данных (Data Engineering) является фундаментальной для успеха Netflix. Команды Data Science and Engineering (DSE) по всей компании работают над улучшением различных аспектов бизнеса. Они создают программные и data-решения, разрабатывают фундаментальные data-продукты, которые позволяют проводить сквозной анализ, запускать сложные эксперименты и получать ключевые инсайты. Это отличная возможность получить практический опыт работы с новыми технологиями и уникальной культурой компании.
Кого мы ищем
Мы ищем любознательного, инициативного, мотивированного студента, который умеет работать в команде и хочет учиться у опытных инженеров. Вы увлекаетесь решением задач и уверенно чувствуете себя при работе со сложными, открытыми проблемами, используя data-подходы.
Обязательные требования
Образование: действующее обучение по очной аккредитованной программе магистратуры (M.S.) или аспирантуры (Ph.D.) в области компьютерных наук, инженерии, Data Science или смежной технической специальности. Окончание программы — декабрь 2026 года, лето 2027 или позже.
Возврат в учебное заведение: после летней стажировки вы должны возвращаться на учёбу минимум на один семестр или четверть.
Языки программирования: уверенное владение хотя бы одним основным языком, таким как Python, Java или Scala.
SQL: хорошие базовые знания SQL (любой диалект).
Структуры данных и алгоритмы: уверенное владение основами.
Инженерные практики: опыт применения best practices разработки ПО (система контроля версий, тестирование, код-ревью).
Коммуникация: отличные навыки общения и работы в команде.
Желательные навыки:
Опыт работы с большими объёмами данных в рамках предыдущих проектов или стажировок.
Знание распределённых фреймворков (например, Spark, Kafka) и архитектур распределённых систем.
Знание MPP/Cloud data warehouse решений (например, Snowflake, Redshift, BigQuery, Hive, Iceberg).
Опыт проектирования схем (schema design) или моделирования данных.
Опыт подготовки и обогащения данных для конвейеров машинного обучения.
Чем предстоит заниматься
Вы будете полностью интегрированы в команду инжиниринга данных и получите проект с высоким влиянием на бизнес. Ваши задачи:
Тесное сотрудничество с дата-сайентистами, аналитиками, продуктовыми менеджерами и старшими инженерами для понимания аналитических потребностей и их трансляции в масштабируемые data-решения.
Проектирование, создание, развёртывание и поддержка надёжных конвейеров данных (data pipelines).
Создание data-продуктов, которые отвечают на высокоприоритетные бизнес-вопросы.
Изучение и применение лучших практик моделирования данных.
Помощь в повышении автоматизации и масштабируемости сложных наборов данных.
Получение опыта применения принципов инжиниринга данных для решения задач интернет-масштаба.
Условия стажировки
Длительность: 12 недель (летом).
Локация: офис в Лос-Гатосе или Лос-Анджелесе, Калифорния (в зависимости от команды, при условии действующих ограничений).
Функция инжиниринга данных (Data Engineering) является фундаментальной для успеха Netflix. Команды Data Science and Engineering (DSE) по всей компании работают над улучшением различных аспектов бизнеса. Они создают программные и data-решения, разрабатывают фундаментальные data-продукты, которые позволяют проводить сквозной анализ, запускать сложные эксперименты и получать ключевые инсайты. Это отличная возможность получить практический опыт работы с новыми технологиями и уникальной культурой компании.
Кого мы ищем
Мы ищем любознательного, инициативного, мотивированного студента, который умеет работать в команде и хочет учиться у опытных инженеров. Вы увлекаетесь решением задач и уверенно чувствуете себя при работе со сложными, открытыми проблемами, используя data-подходы.
Обязательные требования
Образование: действующее обучение по очной аккредитованной программе магистратуры (M.S.) или аспирантуры (Ph.D.) в области компьютерных наук, инженерии, Data Science или смежной технической специальности. Окончание программы — декабрь 2026 года, лето 2027 или позже.
Возврат в учебное заведение: после летней стажировки вы должны возвращаться на учёбу минимум на один семестр или четверть.
Языки программирования: уверенное владение хотя бы одним основным языком, таким как Python, Java или Scala.
SQL: хорошие базовые знания SQL (любой диалект).
Структуры данных и алгоритмы: уверенное владение основами.
Инженерные практики: опыт применения best practices разработки ПО (система контроля версий, тестирование, код-ревью).
Коммуникация: отличные навыки общения и работы в команде.
Желательные навыки:
Опыт работы с большими объёмами данных в рамках предыдущих проектов или стажировок.
Знание распределённых фреймворков (например, Spark, Kafka) и архитектур распределённых систем.
Знание MPP/Cloud data warehouse решений (например, Snowflake, Redshift, BigQuery, Hive, Iceberg).
Опыт проектирования схем (schema design) или моделирования данных.
Опыт подготовки и обогащения данных для конвейеров машинного обучения.
Чем предстоит заниматься
Вы будете полностью интегрированы в команду инжиниринга данных и получите проект с высоким влиянием на бизнес. Ваши задачи:
Тесное сотрудничество с дата-сайентистами, аналитиками, продуктовыми менеджерами и старшими инженерами для понимания аналитических потребностей и их трансляции в масштабируемые data-решения.
Проектирование, создание, развёртывание и поддержка надёжных конвейеров данных (data pipelines).
Создание data-продуктов, которые отвечают на высокоприоритетные бизнес-вопросы.
Изучение и применение лучших практик моделирования данных.
Помощь в повышении автоматизации и масштабируемости сложных наборов данных.
Получение опыта применения принципов инжиниринга данных для решения задач интернет-масштаба.
Условия стажировки
Длительность: 12 недель (летом).
Локация: офис в Лос-Гатосе или Лос-Анджелесе, Калифорния (в зависимости от команды, при условии действующих ограничений).