st
指数
快讯
分享

阿里巴巴发布新AI模型 可视觉解读人类情绪

- 文 +
阿里巴巴 彭博社
(彭博社)

(杭州13日讯)发布了一款据称可以解读人类情绪的模型,意在挑战的最新产品。

在两场演示中,通义实验室的研究人员展示了他们的新开源模型,这款工具可以推断视频中人物的情绪状态,并描述衣服和环境。它为所谓的计算机视觉增加了另一层理解,是另一开源模型HumanOmni的增强版。

1月份一鸣惊人的亮相加速了领域的步伐,这家电子商务巨头目前正在多个领域推出新的工具和应用程序。其对标的模型“通义千问”成为了苹果在中国大陆市场的AI合作伙伴,为中国iPhone用户提供相关服务,目前该公司还打算与一较高下。用户可以在Hugging Face上免费下载

今年早些时候,推出了GPT-4.5模型,该公司称这款模型能够更好地识别和响应用户书面提问中的微妙线索。但该模型价格不菲:最初仅向月费200美元的付费用户开放。而声称不收取任何费用,并允许所有人使用其新模型。

演示中仅展示了能够给出“快乐”或“愤怒”等一般情绪描述,但它从视觉线索中提取这些描述的能力非常重要。

相关新闻

阿里巴巴
人工智能
OpenAI
DeepSeek
R1-Omni