
Яндекс B2B Tech открывает доступ к платформе для хранения и обработки больших данных YTsaurus
Yandex B2B Tech объявила о запуске платформы собственной разработки для хранения и обработки больших данных YTsaurus. Об этом сообщает пресс-служба компании.
Как отмечается в сообщении, платформа позволяет анализировать эксабайты данных в компаниях и обучать сложные модели машинного обучения с миллиардами параметров. YTsaurus доступна в двух форматах: в облаке и в инфраструктуре заказчика. В облаке решение доступно как управляемый сервис, поддержка платформы будет полностью осуществляться специалистами Яндекса.
YTsaurus: от разработки до широкого доступа
Разработка платформы велась с 2010 года. Сейчас она используется для хранения данных большинства сервисов Яндекса, обучения YandexGPT и других нейросетей. Ранее платформа была доступна в открытом доступе (опенсорсе).
Возможности платформы
По словам представителей компании, платформа подходит для обработки как небольшого, так и очень большого объема данных, от миллиона CPU до десятков тысяч GPU. YTsaurus может использоваться как классическая MapReduce-система, а также в рамках платформы реализованы другие популярные решения для обработки данных.
Платформа позволяет строить корпоративные хранилища данных, ETL-системы, обрабатывать как структурированные, так и неструктурированные или полуструктурированные данные, в том числе логи или финансовые транзакции.
Фокус на гибкости и доступности
«Для нас важно, чтобы у компаний были сервисы и инструменты для работы с данными под любой сценарий. Для этого мы, с одной стороны, создаем и развиваем сервисы для облачной платформы на базе открытых решений. С другой — тестируем и адаптируем для бизнеса собственные наработки, которые успешно применяются во внутренней инфраструктуре компании», — подытожил CTO платформы Yandex Cloud Иван Пузыревский.