Публікуйте вакансії
Наймайте без комісій
7 переглядів
UKEESS Software House
UKEESS Software House шукає Senior AI Data Scientist / Engineer на повний робочий день (або в офісі у Львові, або з можливістю віддаленої співпраці в Україні).
Про проект нашого клієнта:
Це один з найбільших у світі ресурсів по дослідженню сімейної історії та оцифровці ДНК (клієнт із США). За допомогою цього сервісу можна побудувати своє сімейне дерево, дослідити родовід, дізнатись цікаві факти про своїх предків і знайти родичів на базі у понад 60 млрд оцифрованих архівних записів (+ ця цифра постійно росте). Також за допомогою ДНК-аналізу, наприклад, можна знайти родичів, визначити етнічне походження, особливості тілобудови тощо (зараз - це майже 100 визначень по днк-аналізу). Загалом, наш замовник вважається найбільшим у своїй бізнес-ніші!
Про команду:
Ви приєднаєтеся до команди AI Content, динамічної групи, яка працює з Document Understanding. Ви відіграватимете важливу роль у розробці інноваційних АІ моделей, які витягують та впорядковують текстову та графічну інформацію з мільярдів історичних та генеалогічних записів, дозволяючи клієнтам знаходити, ділитися та зв'язуватися зі своєю сімейною історією.
Як учасник команди, ви працюватимете з реалізаціями KB (Бази знань) та RAG (Retrieval Augmented Generation), інтегруючи архітектури, що використовують структуровані SQL бази даних разом із векторними базами даних, що підтримують програми семантичного пошуку та вилучення. Ви працюватимете у команді з обробки даних, а також з інженерними командами, щоб навчати, оптимізувати та розгортати моделі, що сприяють розробці продуктів, успіху клієнтів та створенню контенту в рамках нашого проекту.
Обов'язки:
Налаштування структурованих та векторних баз даних: узгодження та синхронізація схем баз даних між структурованими та векторними базами даних.
Курування та впорядкування метаданих колекції контенту: підготовка та форматування наданих метаданих колекції контенту для сумісності з визначеними схемами баз даних.
Завантаження метаданих колекції контенту: завантаження метаданих колекції з наданих джерел у структуровану базу даних SQL.
Генерація вбудовувань: допомога у розробці інструменту/скрипта для генерації вбудовувань зі структурованих даних для заповнення векторної бази даних.
Ітеративне вдосконалення: повторення налаштування схеми бази даних, індексів, вбудовувань тощо для підтримки різних запитів і варіантів використання для аналізу завантажених метаданих колекції контенту.
Співпраця над розгортанням у хмарі: тісна співпраця з ML Ops та Data Science Engineers для безперешкодного розгортання наборів даних, truth sets, моделей та пайплайнів для навчання та висновків у хмарних середовищах.
Ефективна комунікація: чітка та впевнена презентація своїх висновків, результатів і рішень технічній та нетехнічній аудиторії, включаючи команди, стейкхолдерів і керівників.
Вимоги:
5+ років досвіду роботи в галузі Data Science
Комерційний досвід роботи з LLM у продакшені, RAG-архітектурою та агентними системами
Експертиза у зборі, організації, куруванні та форматуванні даних для заповнення баз даних SQL.
Досвід роботи з базами даних SQL, включаючи налаштування схем та індексів для оптимізації ефективних запитів.
Розуміння та досвід із генерацією вбудовування та використанням векторних баз даних для семантичного пошуку та отримання.
Поглиблені знання і досвід роботи з Python та відповідними інструментами та бібліотеками
Практичний досвід роботи з хмарними сервісами AWS (наприклад, Amazon SageMaker, EC2, S3, AWS Lambda).
Англійська - вище середнього рівня (розмовна і письмо).
Буде перевагою:
Знання і досвід хмарних платформ і пов'язаних АІ/ML-сервісів, таких як Google GCP Gemini API, Vertex AI, Azure тощо.
Комерційний досвід роботи з Terraform або CloudFormation
Досвід роботи з агентними інструментами веб-скрейпінгу
Що ви здобудете у цій ролі:
Менторство та професійний ріст: підтримка від досвідчених Data Scientist-ів і робота над реальними AI-проектами. Можливість розширити свої знання та професійну мережу в рамках культури співпраці.
Співпраця та вплив: можливість долучитися до команди топових фахівців, що формує інноваційні підходи у сфері Document Understanding.
Інновації та мета: ваш внесок допоможе мільйонам користувачів по всьому світу краще пізнати своє коріння.
Що ми пропонуємо новому колезі?
Конкурентоспроможна компенсація (на основі ринкових даних, але також залежить від технічного рівня кандидата)
Гнучкий графік роботи
Щорічна оплачувана відпустка
Безкоштовні уроки англійської (онлайн)
Медичне страхування або дві альтернативи на вибір
Індивідуальний плани для професійного та особистісного розвитку
Відсутність бюрократії та мікро менеджменту
Сучасні енергозабезпечені комфортні офіси у Львові (зона барбекю, кухні, кімнати відпочинку та ін.)
Парковка на території та зарядна станція для електромобілів
Закордонні відрядження (після війни)
Корпоративні подарунки, свята та розваги
Спортивні активності: настільний теніс, футбол, воркаут
Надішліть нам своє резюме і давайте познайомимося! ;)
-------------------------------------------------------------------------------------------------------------------
The UKEESS Software House team is currently looking for a Senior AI Data Scientist / Engineer to join our team for a full-time position (remotely in Ukraine or in Lviv's office).
About the Customer and the Project:
Our customer is the world's largest DNA network, based in the USA. This presents a unique opportunity to work with more than 60 billion digitized global historical records, 100 million family trees, and 18+ million people in their growing database. Our customers help people discover their family stories and gain actionable insights about their health and wellness.
About the team:
You will join the AI Content team, a dynamic group at the forefront of Document Understanding. You'll play a vital role in developing innovative AI models that extract and organize text and image information from billions of historical and genealogical records, enabling customers to discover, share, and connect with their family history.
As a member of the team, you will work with KB (Knowledge Base) and RAG (Retrieval Augmented Generation) implementations, integrating architectures leveraging SQL-structured databases along with vector databases supporting semantic search and retrieval applications. You will work with a dedicated mentor from the data science team, as well as engineering teams, to train, optimize, and deploy models that promote product development, customer success, and content creation across our project.
What you will do:
Configure structured and vector databases: Align and sync database schemas across structured and vector databases
Керуйте та впорядковуйте метадані колекції вмісту: Підготуйте та відформатуйте надані метадані для сумісності з визначеними схемами бази даних style="font-weight: 400; font-style: normal; text-decoration: none"> Перенести метадані колекції з наданих джерел у структуровану базу даних SQL.
Генерація вставок:Допоможіть розробити інструмент/скрипт для заповнення векторної бази даних.
Ітеративне вдосконалення: Ітерація щодо налаштування схеми бази даних, індексів, вбудовування тощо аналіз метаданих колекції отриманого вмісту
Співпраця над хмарним розгортанням: Тісно співпрацюйте з ML Ops і Data Science Engineers для безпроблемного розгортання наборів даних, наборів істинності, моделей і конвеєрів для навчання в хмарних середовищах.
Ефективно повідомляйте інформацію: Чітко та впевнено представляйте свої висновки, результати та запропоновані рішення технічній і нетехнічній аудиторії, зокрема командам, зацікавлені сторони та керівники.
Вимоги:
5+ років досвіду роботи з Data Science
Досвід збору даних, організації, курування та форматування для заповнення баз даних SQL.
Досвід роботи з базами даних SQL, включаючи налаштування схем та індексів для оптимізації для ефективних запитів.
Знайомі з генерацією вбудовування та використанням векторних баз даних для семантичного пошуку та отримання.
Стійке знання та досвід роботи з Python і відповідними інструментами та бібліотеками
Практичний досвід роботи з хмарною платформою AWS (наприклад, Amazon SageMaker, AWS Lambda).
Це буде плюсом:
Знання та досвід роботи з хмарними платформами та пов’язаними службами AI/ML, Vertex AI, Azure тощо
Глибокі знання та досвід роботи з LightLLM
Комерційний досвід із Terraform: 400; normal; text-decoration: none">Досвід роботи з агентськими інструментами копіювання даних
Наставництво та розвиток: навчайтеся у досвідчених спеціалістів із обробки даних, виконуючи значущі реальні проекти ШІ, розширюючи свої знання та професійну мережу в рамках культури співпраці.
Співпраця та вплив: працюйте разом із провідними професіоналами галузі та допоможіть створити інструменти, які оживляють сімейну історію для мільйонів користувачів.
Інновації та мета: приєднайтеся до команди, яка займає передові позиції у застосуванні ШІ до історичних даних, де кожна створена вами модель допомагає зберегти людські історії.
Що ми пропонуємо новому колезі?
Конкурентна винагорода (на основі ринкових даних, але також залежить від технічного рівня кандидата)
Гнучкий графік роботи
3 пакети здоров'я на вибір
Щорічна оплачувана відпустка та святкування державних свят
Безкоштовні заняття з англійської (онлайн)
Індивідуальний підхід до професійного зростання
Відсутність бюрократії та мікроменеджменту
Сучасні комфортні офісні приміщення (барбекю зона, кухні, кімнати відпочинку, кавомашини тощо)
Закордонні відрядження (після війни)
Власна автостоянка та зарядна станція для електромобілів
Корпоративні подарунки, святкування та розваги
Спортивні заходи: настільний теніс, футбол, тренування
Припустімо, що ви любите розв’язувати складні проблеми, створювати масштабовані, надійні системи, любите працювати з новітніми технологіями в гнучкому середовищі, що швидко розвивається, і ви в захваті від перспективи значного впливу на продукти з понад 3 мільйонами передплатників.
У такому разі ми хочемо з вами поговорити! ;-)