Meta представила ИИ-модель, способную распознавать объекты, которые она не видела ранее
Обычно ИИ необходимо обучать на существующих данных для распознавания объектов, но Meta* создала способ распознавания объектов без дополнительной помощи. Техногигант опубликовал ИИ-модель Segment Anything, которая способна обнаруживать объекты на изображениях и видео, даже если они не были частью обучающей выборки. Пользователи могут выбирать объекты, кликая на них или используя текстовые запросы. Как сообщилоа Reuters, модель позволяет ввести слово "кошка" и увидеть, как ИИ выделяет всех кошек на указанной фотографии.
Модель также может работать вместе с другими моделями. Она помогает воссоздавать объекты в 3D, используя одно изображение, или использовать данные из смешанной реальности. По сути, Segment Anything может сократить необходимость в дополнительном обучении ИИ.
ИИ-модель и набор данных будут доступны для скачивания с некоммерческой лицензией. То есть, разработчики не смогут использовать модель для своих продуктов. В основном она предназначена для исследований и расширения доступа к технологии. В настоящее время компания использует подобную технологию для модерации запрещенного контента, рекомендации постов и меток на фотографиях.
Разработчики признают, что существующая модель не идеальна. Она может пропустить мельчайшие детали и не так точно определяет границы объектов, как некоторые другие модели. И хотя Segment Anything может обрабатывать запросы в реальном времени, она замедляется при обработке сложных изображений. Кроме того, некоторые специализированные инструменты будут работать эффективнее в определенных областях.
Вряд ли вы увидите эту систему в роботах или других устройствах, где быстрое и точное распознавание объектов имеет большое значение. Однако модели, подобные этой, могут все же помочь в ситуациях, когда непрактично полагаться исключительно на обучающие данные. Социальные сети могут использовать технологию для работы с постоянно растущим объемом контента.
Meta уже имеет опыт в создании необычных моделей в ИИ-секторе, например, она разработала переводчик для неписьменных языков. В то же время на компанию давят, чтобы она продемонстрировала свою конкурентоспособность в этой сфере наравне с такими технологическими гигантами, как Google и Microsoft. Meta уже планирует создание генеративных ИИ-персонажей для своих социальных приложений, а такие изобретения, как "Segment Anything", показывают, что у компании есть свои преимущества.
Попробовать демо можно тут.
*21 марта 2022 года Тверской районный суд Москвы признал компанию Meta (владеет Facebook, Instagram и Whatsapp) экстремистской и запретил ее деятельность на территории России
- Бывший глава GPU AMD обвинил Nvidia в создании "картеля" в ответ на сообщения о задержках поставок в качестве мести
- Tumblr и WordPress начнут продавать данные для обучения ИИ компаний OpenAI и Midjourney
- Слух: ИИ-апскейлинг PS5 Pro будет работать на GPU, так как в APU Viola нет нейроблоков