Meta представила ИИ-модель, способную распознавать объекты, которые она не видела ранее

Обычно ИИ необходимо обучать на существующих данных для распознавания объектов, но Meta* создала способ распознавания объектов без дополнительной помощи. Техногигант опубликовал ИИ-модель Segment Anything, которая способна обнаруживать объекты на изображениях и видео, даже если они не были частью обучающей выборки. Пользователи могут выбирать объекты, кликая на них или используя текстовые запросы. Как сообщилоа Reuters, модель позволяет ввести слово "кошка" и увидеть, как ИИ выделяет всех кошек на указанной фотографии.

Модель также может работать вместе с другими моделями. Она помогает воссоздавать объекты в 3D, используя одно изображение, или использовать данные из смешанной реальности. По сути, Segment Anything может сократить необходимость в дополнительном обучении ИИ.

ИИ-модель и набор данных будут доступны для скачивания с некоммерческой лицензией. То есть, разработчики не смогут использовать модель для своих продуктов. В основном она предназначена для исследований и расширения доступа к технологии. В настоящее время компания использует подобную технологию для модерации запрещенного контента, рекомендации постов и меток на фотографиях.

Разработчики признают, что существующая модель не идеальна. Она может пропустить мельчайшие детали и не так точно определяет границы объектов, как некоторые другие модели. И хотя Segment Anything может обрабатывать запросы в реальном времени, она замедляется при обработке сложных изображений. Кроме того, некоторые специализированные инструменты будут работать эффективнее в определенных областях.

Вряд ли вы увидите эту систему в роботах или других устройствах, где быстрое и точное распознавание объектов имеет большое значение. Однако модели, подобные этой, могут все же помочь в ситуациях, когда непрактично полагаться исключительно на обучающие данные. Социальные сети могут использовать технологию для работы с постоянно растущим объемом контента.

Meta уже имеет опыт в создании необычных моделей в ИИ-секторе, например, она разработала переводчик для неписьменных языков. В то же время на компанию давят, чтобы она продемонстрировала свою конкурентоспособность в этой сфере наравне с такими технологическими гигантами, как Google и Microsoft. Meta уже планирует создание генеративных ИИ-персонажей для своих социальных приложений, а такие изобретения, как "Segment Anything", показывают, что у компании есть свои преимущества.

Попробовать демо можно тут.


*21 марта 2022 года Тверской районный суд Москвы признал компанию Meta (владеет Facebook, Instagram и Whatsapp) экстремистской и запретил ее деятельность на территории России

Больше статей на Shazoo
Тэги: