快讯网
首页 资讯 财经 娱乐 汽车 时尚 房产 健康 数码 科技 图库 滚动新闻
网站图库网站地图

登顶C-Eval和CMMLU两大榜单 夸克大模型打造下一代搜索技术新底座

互联网 ● Kxnews.Com.Cn ● 2023/11/17 08:11:25 ● 互联网 ● 访问:

近期, 互联网 公司及手机厂商接连发布自研大模型,权威榜单显示,国产大模型的各项性能再攀高峰。11月16日,记者在C-Eval和CMMLU两大权威评测榜单中发现,夸克大模型成为双榜第一,进一步展现国产大模型在数据精调及模型框架上的能力提升。

作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。CMMLU 是由MBZUAI、上海交通大学、微软亚洲研究院共同推出,包含67个主题,专门用于评估语言模型在中文语境下的知识和推理能力。

在CMMLU榜单评测中,夸克大模型以平均77.08分的成绩位列总成绩第一,并占据社会科学和其他两个类目的首位。在C-Eval榜单中,夸克大模型平均分达到89分,稳居行业第一,同时在社会科学、人文科学和其他三个类目中位列榜首。

11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型。据介绍,凭借数据、行业、知识正确性、平台等四大优势,夸克大模型应用会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。

据悉,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克App在产品体验创新和迈向新一代搜索的技术底座。夸克将借助自研大模型全面升级,为年轻人工作、学习、生活提供更全面的服务。

(声明:本文仅代表作者观点,不代表快讯网立场。)

手机扫码阅读一下
上一篇文章
京东云发布AIDC智算产品组合,构建大模型时代新型数字基础设施
下一篇文章
OceanBase杨冰:中国场景推动树立分布式数据库四项新标准
  • 你该读读这些:一周精选导览
  • 很多上市公司,是假上市公司
  • 余承东不再担任华为终端BG C
  • SpaceX发射推迟一天至周六 马
  • 阿里Q2财报:菜鸟单季营收同比
  • 付费短视频 抖音“步步为营”
  • 淘宝规模优势扩大,Q2用户数、
  • Copyright © 2012-2024 Kxnews.Com.Cn All Rights Reserved
    欢迎广大网友来本网站投稿,网站内容来自于互联网或网友提供 客服QQ:67650701