阿里妈妈字体

苹果低调发布开源多模态大语言模型 Ferret


苹果公司悄然发布开源多模态LLM模型Ferret,引起人工智能社区关注


2023年10月,苹果公司与哥伦比亚大学的研究人员合作,低调推出了名为Ferret(雪貂)的开源多模态LLM(大型语言模型)。尽管当时并未引起广泛关注,但近期,这一消息在人工智能社区掀起了热议。

Ferret以非商业许可证开源,目前版本不支持商业用途。然而,人们对其未来在苹果产品或服务中的应用寄予厚望。苹果AI/ML研究科学家Zhe Gan在去年10月的推文中详细解释了Ferret的应用领域,强调其能够在图像中引用和定位任何事物,并具备强大的多模态能力。

简而言之,Ferret能够检查图像中的区域,识别元素并对其进行框选。用户可通过强调图像中的某个元素提出问题,Ferret将对其进行识别并提供响应,同时充分利用上下文信息,提供更深层次的理解。这一功能为多模态人工智能研究带来新的探索可能性。

尽管发布低调,但Ferret的开源举措标志着苹果公司逐步向外界开放其先进的人工智能研究成果,与其一贯的封闭形象形成了明显对比。此次开源模型也表明,在面对基础设施挑战时,苹果正在积极寻求多元化解决方案。Ferret在人工智能社区引起关注,预示着苹果未来可能更积极参与开源和合作领域。


https://github.com/apple/ml-ferret/

来源:ithome,仅供学习参考,如有侵权请联系我们。
评论列表 (0)
发表第一个评论!
2 点赞 收藏 0 评论
分享
返回顶部