• 时讯中国网
  • 设为首页 设为首页 收藏 收藏本站
  • 1
  • 时讯中国网
    财经
    您现在的位置: 首页 > 财经 > 阿里云推出大规模视觉语言模型Qwen-VL已在ModeScope开源
  • 阿里云推出大规模视觉语言模型Qwen-VL已在ModeScope开源

  • 发布时间:2023-08-27 10:32:35  来源:TechWeb  阅读量:6221   
  • 阿里云今日推出了大规模视觉语言模型Qwen-VL,目前已经在ModeScope开源,IT之家早前曾报道,阿里云此前已经开源通义千问70 亿参数通用模型Qwen-7B和对话模型Qwen-7B-Chat。

    据悉,Qwen-VL是一款支持中英文等多种语言的视觉语言模型,相较于此前的VL模型,其除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。

    Qwen-VL以Qwen-7B为基座语言模型,在模型架构上引入视觉编码器,使得模型支持视觉信号输入,该模型支持的图像输入分辨率为 448,此前开源的LVLM模型通常仅支持224分辨率。

    官方表示,该模型可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景,在主流的多模态任务评测和多模态聊天能力评测中,取得了远超同等规模通用模型的表现。

    此外,在Qwen-VL的基础上,通义千问团队使用对齐机制,打造了基于LLM的视觉AI助手Qwen-VL-Chat,可让开发者快速搭建具备多模态能力的对话应用。

    通义千问团队同时表示,为了测试模型的多模态对话能力,他们构建了一套基于GPT-4打分机制的测试集 “试金石”,对Qwen-VL-Chat及其他模型进行对比测试,Qwen-VL-Chat在中英文的对齐评测中均取得了开源LVLM最好结果。

    声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

    上一篇:我国QDII净值规模首破4000亿元,纳指成增量资金“富集区”
    下一篇:返回列表
  • 网罗天下
  • 普惠金融进乡村!宁夏银行金融活水助力春耕备耕 普惠金融进乡村!宁夏银行
  • MacBookAir将被重命名为“MacBook” MacBookAir将被
  • 三文鱼当中富含了哪些人体需要的营养? 三文鱼当中富含了哪些人体
  • 华为鸿蒙加持,AITO能否让赛力斯高端起来 华为鸿蒙加持,AITO能
  • 2022款江铃皮卡域虎7售价10.48万元起 2022款江铃皮卡域虎7
  • 纪录电影《冰上时刻》即将上映 关注冰球少年家庭亲子成长历程 纪录电影《冰上时刻》即将
  • 新疆:冰雪旅游点燃寒冬热情 新疆:冰雪旅游点燃寒冬热
  • 运筹帷幄定基调,步调一致向前进——2021年中央经济工作会议侧记 运筹帷幄定基调,步调一致
  • 迪奥彩妆披上千鸟格外衣,废弃羽绒服做成椅子什么样? 迪奥彩妆披上千鸟格外衣,
  • 置业指南:盘点蔡家区域12月部分新开楼盘 置业指南:盘点蔡家区域1
  • 首页 | 新闻 |财经 |娱乐 |汽车 |时尚 |房产 |健康 |数码 |
  • Copyright @ 2012- All Rights Reserved 版权所有:时讯中国网  备案号:皖ICP备2022015281号  网站地图
    欢迎广大网友来本网站投稿,网站内容来自于互联网或网友提供  邮箱:bgm1231@sina.com