Nächste Arbeit

Überwachungsmanager (Support) in Patrianna LTD

12 листопада

19 Ansichten

Patrianna LTD

Patrianna LTD

0
0 Bewertungen
keine Erfahrung
Kiew
Vollzeitarbeit

übersetzt von Google

Tauchen Sie ein in den Puls modernster Lösungen mit Patrianna LTD! Sind Sie bereit, in die dynamische Welt des Social Gaming einzutauchen und Teil eines schnell wachsenden Teams zu werden? Wir sind auf der Suche nach einem talentierten Monitoring-Spezialisten (Support)  zur Verstärkung unseres Patrianna LTD-Team auf Vollzeitbasis. Was Sie gewinnen?Dynamische Umgebung: Treten Sie ein in das Herz eines superschnell wachsenden Social-Gaming-Unternehmens, in dem Innovation und Kreativität gedeihen.G

Tauchen Sie ein in den Puls modernster Lösungen mit Patrianna LTD! 

Sind Sie bereit, in die dynamische Welt des Social Gaming einzutauchen und Teil eines schnell wachsenden Teams zu werden? Wir sind auf der Suche nach einem talentierten Monitoring-Spezialisten (Support)  zur Verstärkung unseres Patrianna LTD-Team auf Vollzeitbasis.

 Was Sie gewinnen?

Dynamische Umgebung: Treten Sie ein in das Herz eines superschnell wachsenden Social-Gaming-Unternehmens, in dem Innovation und Kreativität gedeihen.
Globale Auswirkungen: Seien Sie an der Spitze der Entwicklung einer globalen Social-Entertainment-Plattform mit einem vorrangigen Schwerpunkt über die Eroberung des nordamerikanischen Marktes.
Grenzenloses Wachstum: Bringen Sie Ihre Karriere auf ein neues Niveau mit Aufstiegs- und persönlichen Weiterentwicklungsmöglichkeiten. Begleiten Sie uns auf der aufregenden Reise des kontinuierlichen Wachstums.
Massive Reichweite: Tragen Sie zur Entwicklung von Web- und mobilen Apps für Kunden bei Interagieren Sie mit bis zu 150 Millionen Kunden weltweit.
Engagement to Excellence: Wir sind bestrebt, qualitativ hochwertigen Code zu liefern, vorhersehbares Verhalten in der Produktion, nahtlose Skalierung und Automatisierung bei jedem Schritt sicherzustellen.

Wir suchen einen qualifizierten Überwachungsspezialisten zur Verstärkung unseres Teams 24-Stunden-SRE-Team. Der ideale Kandidat wird außerhalb der Geschäftszeiten arbeiten, die an die europäische Zeit angepasst sind, um einen reibungslosen Betrieb und Systemzuverlässigkeit zu gewährleisten. Diese Rolle konzentriert sich auf die Überwachung und Diagnose in einer Produktionsumgebung mit mehreren Standorten, hauptsächlich für Java-basierte Anwendungen auf der Google Cloud Platform (GCP). Durch den Einsatz moderner Überwachungstools wird der SRE Probleme proaktiv identifizieren, analysieren und lösen und dabei eine hohe Serviceleistung und Zuverlässigkeit aufrechterhalten.

Hauptaufgaben:

  • Produktionsüberwachung und -warnung
    • Überwachen Sie Produktionsumgebungen mit mehreren Standorten mithilfe von Tools wie Prometheus, Grafana und Sentry, um die Anwendungsleistung, den Datenbankzustand und Ereignisströme zu überwachen.
    • Überwachen Sie kontinuierlich Leistungsmetriken und richten Sie Warnungen ein, um potenzielle Probleme zu erkennen, bevor sie sich auf die Systemverfügbarkeit auswirken.
  • Protokollanalyse und -diagnose
    • Analysieren Sie Protokolle über Anwendungen, Datenbanken und Ereignis-Streaming-Dienste (Kafka), um Unregelmäßigkeiten zu erkennen und Einblicke in die Grundursachen zu gewinnen.
    • Verwenden Sie Tools wie ELK und GCP-native Überwachungslösungen, um die Sichtbarkeit aufrechtzuerhalten und das Systemverhalten zu optimieren.
  • Datenbank- und Event-Stream-Überwachung
    • Überwachen und optimieren Sie die Leistung von Datenbanken wie PostgreSQL/AlloyDB und Spanner, wobei der Schwerpunkt auf Abfrageoptimierung und Leistung liegt Metriken und Fehlerbehebung.
    • Verwalten und überwachen Sie Kafka-Cluster, einschließlich Verbraucherverzögerungsverfolgung und Datenpipeline-Zustand, um eine kontinuierliche Datenverarbeitung sicherzustellen.
  • Fehlerverfolgung und Fehlerbehebung
    • Verwenden Sie Sentry und ähnliche Tools, um Fehler zu verfolgen, zu dokumentieren und zu beheben und Probleme an das Engineering-Team weiterzuleiten bei Bedarf.
    • Befolgen Sie Protokolle zur Fehlerbehebung und helfen Sie bei der Ursachenanalyse, um Vorfälle strukturiert und effizient zu lösen.
  • Netzwerk- und Sicherheitseinblicke
    • Arbeiten Sie mit Cloudflare-Tools zusammen, um die Netzwerkleistung zu überwachen und Sicherheitsstandards sicherzustellen, mit Schwerpunkt auf DDoS-Schutz und Latenzoptimierung.< /li>
    • Arbeiten Sie eng mit den Engineering- und DevOps-Teams zusammen, um proaktive Überwachungs- und Leistungsstrategien zu entwickeln.

Erforderliche Fähigkeiten und Qualifikationen:

  • Cloud-Plattform-Expertise: Fortgeschrittene Kenntnisse der Google Cloud-Plattform und der damit verbundenen Dienste.
  • Überwachungs- und APM-Tools: Beherrscht Prometheus, Grafana, Sentry und ELK sowie Vertrautheit mit Kubernetes (K8s) und GCP-nativen Überwachungslösungen.
  • Datenbanksysteme: Umfangreiche Kenntnisse von PostgreSQL/AlloyDB und Spanner, insbesondere für Leistungsoptimierung, Abfrageoptimierung und Diagnose.
  • Event-Streaming: Praktische Erfahrung mit Kafka, einschließlich der Möglichkeit, Kafka-Cluster zu überwachen, Verbraucherverzögerungen zu verfolgen und die Zuverlässigkeit der Datenpipeline zu verwalten.
  • Netzwerk & Sicherheit: Vertrautheit mit Cloudflare, DDoS-Schutzstrategien und Netzwerkleistungsüberwachung.
  • Fähigkeiten zur Problemlösung: Hervorragende analytische Fähigkeiten zur Fehlerbehebung bei komplexen, mehrschichtigen Cloud-Systemen, zur Durchführung von Ursachenanalysen und zur Behebung von Problemen in einer dynamischen Umgebung.

Nice-to-Have-Fähigkeiten:

  • Scripting: Erfahrung mit Python oder Bash für Automatisierungs- und Scripting-Aufgaben.

Zeitplananforderungen:

  • Diese Rolle ist außerhalb der Geschäftszeiten entsprechend der europäischen Zeit tätig, um kontinuierliche Abdeckung und Support zu gewährleistenfür unsere Produktionsumgebungen.

übersetzt von Google

keine Erfahrung
Kiew
Vollzeitarbeit
Wollen Sie den richtigen Job finden?
Neue Jobs in deinem Telegram
Abonnieren
wir verwenden cookies
Akzeptieren