博海拾贝 文摘 万物皆可一键抠图,Meta新模型要掀起CV革命?

万物皆可一键抠图,Meta新模型要掀起CV革命?

详细介绍还请戳:CV不存在了?Meta发布“分割一切”AI 模型,CV或迎来GPT-3时刻

今日热点是脸书发布了开源AI模型SAM。

其实这个模型发布了已经好几天,但一开始市场没当回事,觉得就是小扎凑热闹而已。但用了几天以后才发现牛得一批…

这个模型借鉴了GPT的算法,最主要的能力是抠图。以上图为例,可以一键把图上的所有元素都提取出来,供单独处理。更牛逼的是,还可以用语言进行互动。比方说你输入“cat”这个单词,就能把图片上所有的猫找出来。还可以和人类的视觉互动,通过AR/VR头显来感知用户视觉焦点,选择相应物体。

遥想去年这时候,AI连屏幕上到底是一只猫还是一条狗都分不太清楚,恍如隔世啊。

提取(抠图)出来的物品还可以进行拼贴、编辑等。以我有限的想象力,以后可能没有经过训练的普通人都可以设计视频、游戏了。比方说你觉得一张图片或者视频中的东西碍眼,随便就可以删除或者搬个地方,或者把自己想要的东西放上去。

这他喵的可能就是元宇宙的雏形。

只要一个人戴上了头显,就可以随意实现和虚拟世界中所有物体的互动,甚至还可能把现实中的东西建模后搬进虚拟世界。举例来说,你有一只小狗叫旺财,咔咔咔给旺财拍几张照,然后用SAM模型一抠再一拉,旺财就直接进虚拟世界了。

来源:刘备教授 微信号:LiuBeiJiaoShou

本文来自网络,不代表博海拾贝立场,转载请注明出处:https://www.bohaishibei.com/post/81777/
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
Telegram
返回顶部