Вакансия — Site Reliability Engineer, R&D Infrastructure
- Зарплата:до 52
- Компания:Blockchair (ИП Курганбекова)
- Город:Москва
- Опубликовано:22 дня назад
Описание вакансии:
Компания разрабатывает ASIC чипы. Это тяжёлые EDA инструменты, длинные симуляции, лицензируемое ПО, чувствительные данные и дорогое железо.
Вакансия с релокацией в Алматы, Казахстан.
Ищем SRE, который будет отвечать за стабильность и предсказуемость всей R&D инфраструктуры. Это не поддержка офиса. Это инженерная роль на стыке системного администрирования, автоматизации и архитектуры.
Что предстоит делать:
Надёжность и отказоустойчивость
-
Поддержка bare metal Linux и Windows серверов
-
Обеспечение стабильной работы вычислительных узлов под длительные нагрузки
-
Планирование и реализация отказоустойчивости
-
Резервное копирование с регулярной проверкой восстановления
EDA среда
-
Поддержка и обновление EDA инструментов Synopsys, Cadence, Siemens Mentor или аналогов
-
Управление лицензиями, минимизация простоев
-
Интеграция инструментов в CI процессы
-
Снижение ручных операций в R&D
Сети и производительность
-
Настройка low latency сети для HPC нагрузок
-
Диагностика узких мест
-
Сегментация среды и защищённый доступ
Безопасность
-
Защита интеллектуальной собственности
-
Контроль доступов, аудит
-
Изоляция проектов
Мы ожидаем
-
Глубокий опыт Linux в продакшн среде
-
Понимание HPC нагрузок и их ограничений
-
Опыт работы с bare metal
-
Уверенные знания L2 L3 сетей
-
Bash или Python
-
Умение мыслить через риски и сценарии отказов
Будет плюсом опыт поддержки длинных вычислений и работы с чувствительными R&D данными.