Zanurz się w pulsie najnowocześniejszych rozwiązań z Patrianna LTD! Czy jesteś gotowy, aby zanurzyć się w dynamicznym świecie gier społecznościowych i zostać częścią szybko rozwijającego się zespołu? Poszukujemy utalentowanego Specjalisty ds. monitorowania (wsparcie) , który dołączy do naszego Patrianna LTD zespół na pełen etat. Co Ty Zysk?Dynamiczne środowisko: wejdź do serca super szybko rozwijającej się firmy zajmującej się grami społecznościowymi, gdzie innowacja i kreatywność kwitną.Globaln
Zanurz się w pulsie najnowocześniejszych rozwiązań z Patrianna LTD!
Czy jesteś gotowy, aby zanurzyć się w dynamicznym świecie gier społecznościowych i zostać częścią szybko rozwijającego się zespołu? Poszukujemy utalentowanego Specjalisty ds. monitorowania (wsparcie) , który dołączy do naszego Patrianna LTD zespół na pełen etat.
Co Ty Zysk?
Dynamiczne środowisko: wejdź do serca super szybko rozwijającej się firmy zajmującej się grami społecznościowymi, gdzie innowacja i kreatywność kwitną.
Globalny wpływ: Bądź na czele tworzenia globalnej rozrywki społecznościowej platformę, którą głównie skupiamy się na urzekaniu rynku północnoamerykańskiego.
Nieograniczony rozwój: Przenieś swoją karierę na nowy poziom dzięki możliwościom na rzecz awansu i rozwoju osobistego. Dołącz do nas w ekscytującej podróży ciągłego rozwoju.
Massive Reach: weź udział w rozwoju klienckich aplikacji internetowych i mobilnych, które nawiąż kontakt z nawet 150 milionami klientów na całym świecie.
Zaangażowanie do Doskonałości: naszym celem jest dostarczanie kodu wysokiej jakości, zapewnianie przewidywalnego zachowania w produkcji, płynnego skalowania i automatyzacji na każdym etapie.
Poszukujemy wykwalifikowanego Specjalisty ds. monitorowania, który dołączy do naszego zespołu Zespół 24?7 SRE. Idealny kandydat będzie pracował poza godzinami pracy zgodnymi z czasem europejskim, aby zapewnić płynne działanie i niezawodność systemu. Ta rola koncentruje się na monitorowaniu i diagnostyce w środowisku produkcyjnym obejmującym wiele lokalizacji, głównie w przypadku aplikacji opartych na Javie w Google Cloud Platform (GCP). Wykorzystując nowoczesne narzędzia monitorujące, SRE będzie aktywnie identyfikować, analizować i rozwiązywać problemy, utrzymując wysoką wydajność i niezawodność usług.
Kluczowe obowiązki:
- Monitorowanie produkcji i alarmowanie
- Nadzoruj środowiska produkcyjne w wielu lokalizacjach za pomocą narzędzi takich jak Prometheus, Grafana i Sentry w celu monitorowania wydajności aplikacji, stan bazy danych i strumienie zdarzeń.
- Stale monitoruj wskaźniki wydajności, konfigurując alerty w celu zidentyfikowania potencjalnych problemów, zanim wpłyną one na system dostępność.
- Analiza logów i diagnostyka
- Analiza dzienniki w aplikacjach, bazach danych i usługach przesyłania strumieniowego zdarzeń (Kafka), aby wykrywać nieprawidłowości i uzyskiwać wgląd w pierwotne przyczyny.
- Korzystaj z narzędzi takich jak ELK i rozwiązania do monitorowania natywne dla GCP, aby zachować widoczność i zoptymalizować system zachowanie.
- Monitorowanie baz danych i strumienia zdarzeń
- Monitoruj i dostosowuj wydajność baz danych takich jak PostgreSQL/AlloyDB i Spanner, koncentrując się na optymalizacji zapytań i wydajności wskaźniki i rozwiązywanie problemów.
- Zarządzaj klastrami Kafki i monitoruj je, w tym śledzenie opóźnień klientów i stan potoku danych, aby zapewnić ciągłość danych przetwarzanie.
- Śledzenie błędów i rozwiązywanie problemów
- Użycie Sentry i podobne narzędzia do śledzenia, dokumentowania i rozwiązywania błędów, a w razie potrzeby eskalacji problemów do zespołu inżynierów.
- Przestrzegaj protokołów rozwiązywania problemów i pomagaj w analizie przyczyn źródłowych w celu rozwiązywania incydentów w ustrukturyzowany sposób i wydajny sposób.
- Statystyki sieci i bezpieczeństwa
- Współpracuj z narzędziami Cloudflare, aby monitorować wydajność sieci i zapewniać standardy bezpieczeństwa, ze szczególnym naciskiem na ochronę DDoS i optymalizację opóźnień.
- Ściśle współpracuj z zespołami inżynieryjnymi i DevOps, aby opracować proaktywne monitorowanie i wydajność strategie.
Wymagane umiejętności i kwalifikacje:
- Doświadczenie w zakresie platformy Cloud: zaawansowana wiedza na temat Google Cloud Platform i powiązanych usług.
- Narzędzia do monitorowania i APM: biegła znajomość programów Prometheus, Grafana, Sentry i ELK oraz znajomość Kubernetes (K8s) i rozwiązań do monitorowania natywnych dla GCP.
- Systemy baz danych: Dobra znajomość PostgreSQL/AlloyDB i Spanner, szczególnie w zakresie dostrajania wydajności, optymalizacji zapytań i diagnostyki.
- Strumieniowanie zdarzeń: praktyczne doświadczenie z platformą Kafka, w tym możliwość monitorowania klastrów Kafki, śledzenia opóźnień klientów i zarządzania niezawodnością potoku danych.
- Sieć i bezpieczeństwo: Znajomość Cloudflare, strategii ochrony DDoS i monitorowania wydajności sieci.
- Umiejętności rozwiązywania problemów: doskonałe umiejętności analityczne umożliwiające rozwiązywanie problemów złożonych, wielowarstwowych systemów chmurowych, przeprowadzanie analizy przyczyn źródłowych i rozwiązywanie problemów w dynamicznym środowisku.
Przydatne umiejętności:
- Skrypty: doświadczenie z Pythonem lub Bashem do zadań automatyzacji i tworzenia skryptów.
Wymagania dotyczące harmonogramu:
- Ta rola działa poza godzinami pracy zgodnymi z czasem europejskim, aby zapewnić ciągłą obsługę i wsparciedla naszych środowisk produkcyjnych.