Погрузитесь в пульс передовых решений вместе с Patrianna LTD! Готовы ли вы погрузиться в динамичный мир социальных игр и стать частью быстро растущей команды? Мы ищем талантливого специалиста по мониторингу (поддержка) , который присоединится к нашему Команда Patrianna LTD на постоянной основе. Что вы получите?Динамическая среда. Окунитесь в самое сердце быстрорастущей компании, занимающейся социальными играми, где процветают инновации и творчество.Глобальное влияние: будьте в авангарде создания
Погрузитесь в пульс передовых решений вместе с Patrianna LTD!
Готовы ли вы погрузиться в динамичный мир социальных игр и стать частью быстро растущей команды? Мы ищем талантливого специалиста по мониторингу (поддержка) , который присоединится к нашему Команда Patrianna LTD на постоянной основе.
Что вы получите?
Динамическая среда. Окунитесь в самое сердце быстрорастущей компании, занимающейся социальными играми, где процветают инновации и творчество.
Глобальное влияние: будьте в авангарде создания глобальной социальной развлекательной платформы, уделяя особое внимание захвату рынка Северной Америки.
Безграничный рост. Поднимите свою карьеру на новую высоту с возможностями карьерного роста и личного развития. Присоединяйтесь к нам в увлекательном путешествии непрерывного роста.
Массовый охват: вносите вклад в разработку клиентских веб-сайтов и мобильных приложений, которые взаимодействовать с до 150 миллионами клиентов по всему миру.
Стремление к совершенству: мы стремимся предоставлять высококачественный код, обеспечение предсказуемого поведения в рабочей среде, плавное масштабирование и автоматизация на каждом этапе.
Мы ищем опытного Специалист по мониторингу присоединится к нашей круглосуточной SRE-команде. Идеальный кандидат будет работать в нерабочие часы по европейскому времени, чтобы обеспечить бесперебойную работу и надежность системы. Эта роль сосредоточена на мониторинге и диагностике в производственной среде с несколькими площадками, в первую очередь для приложений на основе Java на Google Cloud Platform (GCP). Используя современные инструменты мониторинга, SRE будет активно выявлять, анализировать и решать проблемы, поддерживая высокую производительность и надежность обслуживания.
Ключевые обязанности:
- Мониторинг и оповещение о производстве
- Контролируйте многосайтовые производственные среды с помощью таких инструментов, как Prometheus, Grafana и Sentry, для мониторинга производительности приложений и состояния базы данных. и потоки событий.
- Постоянно отслеживайте показатели производительности, настраивая оповещения, чтобы выявлять потенциальные проблемы до того, как они повлияют на доступность системы.
- Анализ журналов и диагностика
- Анализ журналов приложений, баз данных и служб потоковой передачи событий (Kafka) для обнаружения нарушений и получения информации об основных причинах .
- Используйте такие инструменты, как ELK и собственные решения для мониторинга GCP, чтобы обеспечить видимость и оптимизировать поведение системы.
- Мониторинг баз данных и потоков событий
- Отслеживание и настройка производительности таких баз данных, как PostgreSQL/AlloyDB и Spanner, уделяя особое внимание оптимизации запросов и производительности. метрики и устранение неполадок.
- Управляйте кластерами Kafka и отслеживайте их, включая отслеживание задержек потребителей и состояние конвейера данных, чтобы обеспечить непрерывную обработку данных.
- Отслеживание ошибок и устранение неполадок
- Используйте Sentry и аналогичные инструменты для отслеживания, документирования и устранения ошибок, передавая проблемы команде разработчиков. при необходимости.
- Следуйте протоколам устранения неполадок и помогайте в анализе первопричин для разрешения инцидентов структурированным и эффективным способом.
- Аналитика сети и безопасности
- Сотрудничайте с инструментами Cloudflare для мониторинга производительности сети и обеспечения стандартов безопасности с упором на защиту от DDoS-атак и оптимизацию задержек.< /li>
- Тесно сотрудничать с командами разработки и DevOps для разработки стратегий упреждающего мониторинга и производительности.
Требуемые навыки и квалификация:
- Знание облачной платформы: Продвинутое знание Google Cloud Platform и связанных с ней сервисов.
- Инструменты мониторинга и APM : знание Prometheus, Grafana, Sentry и ELK, а также знание Kubernetes (K8s) и собственных решений для мониторинга GCP.
- Системы баз данных: Хорошее знание PostgreSQL/AlloyDB и Spanner, особенно для настройки производительности, оптимизации запросов и диагностики.
- Потоковая передача событий: практический опыт работы с Kafka, включая возможность мониторить кластеры Kafka, отслеживать задержку потребителей и управлять надежностью конвейера данных.
- Сеть и безопасность: знание Cloudflare, стратегий защиты от DDoS и мониторинга производительности сети.
- Навыки решения проблем: отличные аналитические навыки для устранения неполадок в сложных многоуровневых облачных системах, анализа первопричин и решения проблем в динамической среде.
Навыки, которые полезно иметь:
- Сценарии: опыт работы с Python или Bash для задач автоматизации и написания сценариев.
Требования к расписанию:
- Эта должность работает в нерабочие часы по европейскому времени, чтобы обеспечить постоянное освещение и поддержку.для нашей производственной среды.