阿里云宣布,通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解,,全面超越GPT-4o与Claude3.5。新的Qwen2.5-VL能够更准确地解析图像内容,突破性地支持超1小时的视频理解,无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。
阿里云通义开源视觉理解模型Qwen2.5-VL
免责声明:本网站所刊登、转载的各种稿件、图片均有可靠的来源,市场有风险,选择需谨慎!此文仅供参考,不作买卖依据,并不代表新讯网观点,由此产生的财务损失,本站不承担任何经济和法律责任,本站自动屏蔽违反《广告法》词语。
请选择您浏览此资讯时的心情
相关资讯
- 蝉妈妈引领内容创作风潮,多地举办内容爆量大会2025-02-01 12:27:08
- 爱玛会员短片《时光KPI》上线引发关注,放下手机回归本2025-01-23 15:35:33
- 感恩节!itc保伦股份致敬每一个特别的你2025-01-23 10:24:16
- 石破天惊!相机镜头竟然也能9.9元包邮!好一个大胆的“2025-01-20 15:08:06
- 深度数科详解票据“承兑”与“付款”:理解两者的本质2025-01-17 17:58:10
今日热点推荐2013.07.01