DeepSeek终于能看图了 我第一时间用它算命

DeepSeek终于能看图了 我第一时间用它算命

2026年04月29日 18:53 次阅读 稿源:智东西 条评论 DeepSeek终于能看图了 我第一时间用它算命 DeepSeek终于能看图了 我第一时间用它算命

刚刚,DeepSeek的多模态能力已经开启灰度测试。现在,被选中的用户会发现,DeepSeek首页多了一个“识图模式”的入口。上传图片后,DeepSeek能像人一样理解画面,不管是物体还是场景,而不是像过去仅能识别文字。

DeepSeek终于能看图了 我第一时间用它算命

DeepSeek终于能看图了 我第一时间用它算命

多位DeepSeek研究员第一时间发文宣传了这一新功能。DeepSeek研究员陈德里称,这一功能来自DeepSeek的“天才多模态同事们”,小鲸鱼现在有了看见世界的能力。

DeepSeek终于能看图了 我第一时间用它算命

▲DeepSeek多位研究员宣布识图模式的灰度上线(图源:X平台)

我们也有幸被灰度到了,并迅速进行了一波测试。

首先是基本的识物能力,我们上传了一张兔子的照片,识图模式下DeepSeek一眼就判断出兔子的品种,并且可以描述这只兔子的姿态。

DeepSeek终于能看图了 我第一时间用它算命

我们给DeepSeek上了点难度,上传了一张来自它老家杭州知名景点灵隐寺的照片,图中仅有右下角的路灯上有草书写就的“灵隐寺”字样,不过对人类来说这些字样也有点难懂。我们要求DeepSeek判断这是哪里,并报出图城市的经纬度。

DeepSeek终于能看图了 我第一时间用它算命

根据建筑风格和路灯上的字样,DeepSeek很快判断出这里是灵隐寺,给出的坐标准确无误。其生成速度也很快,未开启思考模式时,一眨眼的功夫就好了。

DeepSeek终于能看图了 我第一时间用它算命

我们又上传了一张包含视觉陷阱的图片,这张图中几个物品的摆放很容易让人误以为图中有个人坐在椅子上。

DeepSeek终于能看图了 我第一时间用它算命

这样的题目同样没能难倒DeepSeek,它判断图中有墙面修补痕迹、垃圾收集区、杂物等等,没有被视觉陷阱蒙骗。

DeepSeek终于能看图了 我第一时间用它算命

DeepSeek的视觉模式支持深度思考,我们上传了一张随手拍的照片,图中没有任何文字参考,看看DeepSeek能否根据蛛丝马迹判断出位置。

DeepSeek终于能看图了 我第一时间用它算命

开启推理后,DeepSeek的视觉能力明显增强了。它可以分步骤拆解画面信息,能看到前景、中景、背景的所有信息,然后将地标特征与地理区域匹配,直接判断出山脉是燕山山脉、建筑风格在北京昌平等郊区很常见。

DeepSeek终于能看图了 我第一时间用它算命

最后它直接把范围收窄到北京昌平区或者海淀山后地区,其中某些猜测选项离我的实际距离已经不到10公里。未来如果接入联网搜索,DeepSeek很可能就顺着网线把我家地址给开盒了。

DeepSeek终于能看图了 我第一时间用它算命

我们还尝试了热门的看手相玩法,上传后,DeepSeek第一眼先把左右手看错了,我们上传的图片是左手,它判断成了右手。

DeepSeek终于能看图了 我第一时间用它算命

进入实际分析后,DeepSeek对手相形态的描述基本符合事实,分析得也是头头是道,不过具体该相信多少,这就见仁见智了。

DeepSeek终于能看图了 我第一时间用它算命

结语:DeepSeek多模态拼图,终于补齐

在过去很长一段时间里,DeepSeek多模态能力的缺失一直是一个遗憾。DeepSeek一直维持着多模态的相关研究,并曾在早期发布开源多模态模型Janus等成果。不过,DeepSeek一直未在其产品中向公众提供多模态能力。

AI走向多模态已经成为不可逆转的大趋势。多模态内容所蕴藏的丰富信息可以扩展AI认知这一世界的触角,也更贴近人类本身理解世界的方式。目前,DeepSeek的识图模式还只是一个测试功能,不过它已经让我们看到了其在视觉解析与跨模态推理上的潜力。

-

对文章打分

DeepSeek终于能看图了 我第一时间用它算命

1 (50%) 1 (50%)
  • 登录
DeepSeek终于能看图了 我第一时间用它算命 [退出]

DeepSeek终于能看图了 我第一时间用它算命 发布
    显示更多评论

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      相关文章

      • DeepSeek V4发布引爆需求 中国科技巨头纷抢华为昇腾950芯片

        • 21 分钟前
      • OpenAI推出8美元订阅版ChatGPT 今年消费者付费用户将增至1.22亿

        • 28 分钟前
      • “人机大战”十年后 DeepMind联合创始人再会李世石

        • 2 小时前
      • GPT Image 2文生图封神 超谷歌Nano Banana2成全球第一

        • 3 小时前
      • Anthropic推出“Claude for Creative Work”将AI嵌入专业创意工具生态

        • 6 小时前

      Top 10

      本周 本月
      • 1

        507万人民币梭哈英特尔 曾被全网群嘲败家子 如今身家暴涨至1370万元

        阅读 (1079) 评论 (0)
      • 2

        乒乓球机器人Ace在东京击败顶级选手 创下体育机器人历史第一

        阅读 (1056) 评论 (0)
      • 3

        中国僧人玩CS2修行走红 电脑价值4万 用RTX4090

        阅读 (985) 评论 (7)
      • 4乘客买到高铁08车01C座 上车却懵了
      • 5DeepSeek-V4预览版正式上线 提供1M超长上下文记忆全新体验
      • 6DeepSeek-V4报告亮了 V4发布延迟的秘密终于曝光
      • 7女子照片美颜过度失踪4天才找到 寻人启事找不到人
      • 8南方多省电价突然飙升 广东逼近1元/度
      • 9IMDb的“逆天”发现:所有电影和电视剧都能免费看
      • 10DeepSeek V4又在测试:被指接近Opus 4.5 但不会太便宜
      • 1

        《纽约时报》称已确认比特币发明者中本聪的真实身份

        阅读 (5847) 评论 (0)
      • 2

        苹果被曝下调 iPhone 18 规格以压缩成本

        阅读 (2517) 评论 (0)
      • 3

        苹果“Apple Intelligence”已在中国区域的用户设备中出现

        阅读 (2373) 评论 (1)
      • 4《呼啸山庄》亲热戏片段 玛格特·罗比被指"尺度太大"
      • 5苹果宣布CEO交接 蒂姆·库克发布致全球苹果用户公开信
      • 6iPhone 18 Pro屏幕贴膜谍照曝光 灵动岛开孔明显收窄
      • 7GPT-6预计将于4月14日发布 性能暴增40%
      • 8第一批学AI的大学生,已经笑不出来了
      • 9《永劫无间》女解说黑衣黑脸反讽舆论 日本网友狂赞
      • 10微软无预警封停 WireGuard 与 VeraCrypt 开发者账号
      招聘