Наступна вакансія

Інженер даних (віддалений) в PulsePoint

Розміщено більше 30 днів тому

165 переглядів

PulsePoint

PulsePoint

0
0 відгуків
Без досвіду
Повний робочий день

Перекладено Google

Трохи про нас: PulsePoint є провідною технологічною компанією, яка використовує реальні дані в режимі реального часу для оптимізації ефективності кампанії та революції в прийнятті рішень щодо здоров’я. Використовуючи запатентовані набори даних і методологію, PulsePoint орієнтується на медичних працівників і пацієнтів із безпрецедентним рівнем точності, надаючи неперевершені результати клієнтам, яких ми обслуговуємо. Зараз компанія є частиною Internet Brands, портфельної компанії KKR і власника W
Трохи про нас: PulsePoint є провідною технологічною компанією, яка використовує реальні дані в режимі реального часу для оптимізації ефективності кампанії та революції в прийнятті рішень щодо здоров’я. Використовуючи запатентовані набори даних і методологію, PulsePoint орієнтується на медичних працівників і пацієнтів із безпрецедентним рівнем точності, надаючи неперевершені результати клієнтам, яких ми обслуговуємо. Зараз компанія є частиною Internet Brands, портфельної компанії KKR і власника WebMD Health Corp. Команда інженерів даних PulsePoint відіграє ключову роль у нашій технологічній компанії, яка переживає експоненційне зростання. Наш конвеєр даних обробляє понад 80 мільярдів показів на день (> 20 ТБ даних, 220 ТБ без стиснення). Ці дані використовуються для створення звітів, оновлення бюджетів і керування нашими механізмами оптимізації. Ми робимо все це, дотримуючись надзвичайно жорстких угод про рівень обслуговування, і надаємо статистику та звіти якомога ближче до реального часу. Найбільш захоплюючим у роботі в PulsePoint є величезний потенціал для особистого та професійного зростання. Ми завжди шукаємо нові та кращі інструменти, які допоможуть нам вирішувати такі виклики, як впровадження перевірених технологій з відкритим кодом, щоб зробити нашу інфраструктуру даних більш гнучкою, масштабованою та надійною. Деякі з передових технологій, які ми нещодавно впровадили, це Kafka, Spark Streaming, Presto, Airflow і Kubernetes. Що ви будете робити: проектувати, створювати та підтримувати надійні та масштабовані розподілені системи обробки даних корпоративного рівня для масштабування. існуючий бізнес і підтримка нових бізнес-ініціатив. Оптимізуйте робочі місця для найефективнішого використання ресурсів Kafka, Hadoop, Presto, Spark і Kubernetes. Відстежуйте та забезпечуйте прозорість якості даних у системах (точність, послідовність, повнота тощо) Підвищуйте доступність і ефективність даних. (робота з аналітиками, дослідниками даних і розробниками для створення/розгортання інструментів і наборів даних, які відповідають їхнім сценаріям використання) Співпраця в невеликій команді з різноманітним технологічним досвідом Забезпечення наставництва та керівництва для молодших членів команди Обов’язки команди: Введення, перевірка та обробка внутрішніх і сторонніх розробників даніСтворюйте, обслуговуйте та відстежуйте потоки даних у Spark, Hive, SQL і Presto для забезпечення узгодженості, точності та часу затримки. Підтримуйте та вдосконалюйте структуру для завдань (головним чином об’єднуйте завдання в Spark і Hive) Створюйте різних споживачів даних у Kafka за допомогою Spark Streaming для агрегації у найближчий час оцінка/вибір/впровадженняРезервне копіювання/Зберігання/Висока доступність/Планування потужностей Перевірка/Схвалення - DDL для бази даних, завдань Hive Framework і Spark Streaming, щоб переконатися, що вони відповідають нашим стандартам. Технології, які ми використовуємо: Airflow - для планування завдань Docker - Упаковане зображення контейнера з усіма залежностями Graphite/Beacon - для моніторингу потоків даних Hive - Рівень сховища даних SQL для даних у HDFSKafka - Розподілене зберігання журналу комітів Kubernetes - Менеджер ресурсів розподіленого кластера Presto - Швидке паралельне сховище даних і рівень об'єднання данихSpark Streaming - Агрегація найближчого часу SQL Server - Надійний OLTP RDBMSGCP Вимоги BQ: 5+ років даних інженерний досвід. Нещодавній сильний досвід Spark. Досвід роботи на преміум-класі Вільне володіння Python, досвід Scala/Java є величезнимплюс (Бажано програміст-поліглот!) Досконале розуміння Linux RDBMS, SQL; Пристрасть до інженерії та інформатики навколо даних Знання та знайомство з розподіленими виробничими системами, наприклад Hadoop, є величезним плюсом Знання та досвід міграції в хмару є плюсом Бажання та здатність працювати Східне узбережжя Години роботи в США (з 9:00 до 18:00 за східним стандартним часом), ви можете працювати віддалено. Бажання брати участь у чергуванні 24 години на добу, без вихідних. Процес відбору: 1) Початковий екран (30 хвилин) 2) Співбесіда з менеджером з найму (45 хвилин) 3) Технічне завдання 4) Співбесіда з командою (60 хвилин) + 3 x 45 хв.) + Старший віце-президент з інженерії (15 хв.)5) Старший директор WebMD, DBA (30 хв.) WebMD та його філії є роботодавцем із рівними можливостями/позитивними діями та не дискримінують на основі раси, походження, колір шкіри, релігія, стать, стать, вік, сімейний стан, сексуальна орієнтація, гендерна ідентичність, національне походження, стан здоров’я, інвалідність, статус ветеранів або будь-яка інша ознака, захищена законом. Показати більше Показувати менше Посадовий рівень Старший середній рівень Тип зайнятості Повний робочий день Посадові обов’язки Аналітика та Інженерія Галузі Маркетингові послуги

Перекладено Google

Без досвіду
Повний робочий день
Хочете знайти підходящу роботу?
Нові вакансії у вашому Telegram
Підписатись
Ми використовуємо cookies
Прийняти