DeepSeek终于能看图了 我第一时间用它算命
2026年04月29日 18:53 次阅读 稿源:智东西 条评论
刚刚,DeepSeek的多模态能力已经开启灰度测试。现在,被选中的用户会发现,DeepSeek首页多了一个“识图模式”的入口。上传图片后,DeepSeek能像人一样理解画面,不管是物体还是场景,而不是像过去仅能识别文字。


多位DeepSeek研究员第一时间发文宣传了这一新功能。DeepSeek研究员陈德里称,这一功能来自DeepSeek的“天才多模态同事们”,小鲸鱼现在有了看见世界的能力。

▲DeepSeek多位研究员宣布识图模式的灰度上线(图源:X平台)
我们也有幸被灰度到了,并迅速进行了一波测试。
首先是基本的识物能力,我们上传了一张兔子的照片,识图模式下DeepSeek一眼就判断出兔子的品种,并且可以描述这只兔子的姿态。

我们给DeepSeek上了点难度,上传了一张来自它老家杭州知名景点灵隐寺的照片,图中仅有右下角的路灯上有草书写就的“灵隐寺”字样,不过对人类来说这些字样也有点难懂。我们要求DeepSeek判断这是哪里,并报出图城市的经纬度。

根据建筑风格和路灯上的字样,DeepSeek很快判断出这里是灵隐寺,给出的坐标准确无误。其生成速度也很快,未开启思考模式时,一眨眼的功夫就好了。

我们又上传了一张包含视觉陷阱的图片,这张图中几个物品的摆放很容易让人误以为图中有个人坐在椅子上。

这样的题目同样没能难倒DeepSeek,它判断图中有墙面修补痕迹、垃圾收集区、杂物等等,没有被视觉陷阱蒙骗。

DeepSeek的视觉模式支持深度思考,我们上传了一张随手拍的照片,图中没有任何文字参考,看看DeepSeek能否根据蛛丝马迹判断出位置。

开启推理后,DeepSeek的视觉能力明显增强了。它可以分步骤拆解画面信息,能看到前景、中景、背景的所有信息,然后将地标特征与地理区域匹配,直接判断出山脉是燕山山脉、建筑风格在北京昌平等郊区很常见。

最后它直接把范围收窄到北京昌平区或者海淀山后地区,其中某些猜测选项离我的实际距离已经不到10公里。未来如果接入联网搜索,DeepSeek很可能就顺着网线把我家地址给开盒了。

我们还尝试了热门的看手相玩法,上传后,DeepSeek第一眼先把左右手看错了,我们上传的图片是左手,它判断成了右手。

进入实际分析后,DeepSeek对手相形态的描述基本符合事实,分析得也是头头是道,不过具体该相信多少,这就见仁见智了。

结语:DeepSeek多模态拼图,终于补齐
在过去很长一段时间里,DeepSeek多模态能力的缺失一直是一个遗憾。DeepSeek一直维持着多模态的相关研究,并曾在早期发布开源多模态模型Janus等成果。不过,DeepSeek一直未在其产品中向公众提供多模态能力。
AI走向多模态已经成为不可逆转的大趋势。多模态内容所蕴藏的丰富信息可以扩展AI认知这一世界的触角,也更贴近人类本身理解世界的方式。目前,DeepSeek的识图模式还只是一个测试功能,不过它已经让我们看到了其在视觉解析与跨模态推理上的潜力。
-对文章打分
DeepSeek终于能看图了 我第一时间用它算命
1 (50%) 1 (50%)- 登录
[退出]
最新资讯
加载中...编辑精选
加载中...热门评论
相关文章
-
DeepSeek V4发布引爆需求 中国科技巨头纷抢华为昇腾950芯片
- 21 分钟前
-
OpenAI推出8美元订阅版ChatGPT 今年消费者付费用户将增至1.22亿
- 28 分钟前
-
“人机大战”十年后 DeepMind联合创始人再会李世石
- 2 小时前
-
GPT Image 2文生图封神 超谷歌Nano Banana2成全球第一
- 3 小时前
-
Anthropic推出“Claude for Creative Work”将AI嵌入专业创意工具生态
- 6 小时前
Top 10
本周 本月-
1
507万人民币梭哈英特尔 曾被全网群嘲败家子 如今身家暴涨至1370万元
阅读 (1079) 评论 (0) -
2
乒乓球机器人Ace在东京击败顶级选手 创下体育机器人历史第一
阅读 (1056) 评论 (0) -
3
中国僧人玩CS2修行走红 电脑价值4万 用RTX4090
阅读 (985) 评论 (7) - 4乘客买到高铁08车01C座 上车却懵了
- 5DeepSeek-V4预览版正式上线 提供1M超长上下文记忆全新体验
- 6DeepSeek-V4报告亮了 V4发布延迟的秘密终于曝光
- 7女子照片美颜过度失踪4天才找到 寻人启事找不到人
- 8南方多省电价突然飙升 广东逼近1元/度
- 9IMDb的“逆天”发现:所有电影和电视剧都能免费看
- 10DeepSeek V4又在测试:被指接近Opus 4.5 但不会太便宜
-
1
《纽约时报》称已确认比特币发明者中本聪的真实身份
阅读 (5847) 评论 (0) -
2
苹果被曝下调 iPhone 18 规格以压缩成本
阅读 (2517) 评论 (0) -
3
苹果“Apple Intelligence”已在中国区域的用户设备中出现
阅读 (2373) 评论 (1) - 4《呼啸山庄》亲热戏片段 玛格特·罗比被指"尺度太大"
- 5苹果宣布CEO交接 蒂姆·库克发布致全球苹果用户公开信
- 6iPhone 18 Pro屏幕贴膜谍照曝光 灵动岛开孔明显收窄
- 7GPT-6预计将于4月14日发布 性能暴增40%
- 8第一批学AI的大学生,已经笑不出来了
- 9《永劫无间》女解说黑衣黑脸反讽舆论 日本网友狂赞
- 10微软无预警封停 WireGuard 与 VeraCrypt 开发者账号