金投网

商汤商量:获SuperCLUE 9月评测中文大模型总榜第一排名

记者1月11日从商汤科技获悉,近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat3.0位列中文大模型总榜排名第一。

记者1月11日从商汤科技获悉,近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,SenseChat 3.0同样排名第一,领先所有国内中文大模型以及GPT-3.5和Claude 2,表现仅次于GPT-4,展示了商汤在大模型领域创新发展及释放生产力的优势,以及在探索AGI道路上的积累与潜力。

SuperCLUE是中文通用大模型的综合性评测基准,旨在对大模型在各个能力维度上的表现进行全方位的评估,是国内最具专业性和代表性的中文大模型评测基准之一。此次评测选取了目前国内外最具代表性的20个通用大语言模型。

商汤科技表示,目前全球领先的AI智能体,几乎都以领先大模型GPT-4为核心驱动,它们借助强大的工具使用能力等,可将复杂问题拆解成可实现的子任务、类人的自然语言交互等能力。商量SenseChat 3.0作为领先的中文大模型,通过使用代码解释器、API调用和搜索三类常用工具来解决复杂任务,灵活搭建AI智能体应用,支撑企业的生产力革新。

目前,商量SenseChat已经在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作。商汤科技认为,作为具备强大工具使用能力的大模型,商量SenseChat的持续快速提升,为商汤发展更强大的、能够像人类一样进行交互的AI智能体,以及面向AGI道路的探索,都将提供重要的基础和支撑。

来源:中国证券报·中证网 作者:

温馨提示:最新动态随时看,请关注金投网APP

相关推荐

财政部重磅发布!利好50万亿市场
财政部重磅发布!利好50万亿市场
《数字中国发展报告(2022)》显示,2022年我国数字经济规模已超过50万亿元,数字经济占GDP比重达到41.5%,位居世界第二位。数据已成为第五大生产要素。
手机巨头上新!
手机巨头上新!
机构分析称,华为、小米、OPPO、vivo等厂商均加入生成式AI端侧应用落地的研发中,以增强手机端AI助手体验。国内智能手机市场竞争加剧,促使厂商推出更有竞争力的产品来吸引消费者。预计2024年全球智能手机市场出货量恢复增长。
上交所召开支持中央企业发行科技创新及绿色债券高质量发展座谈会
上交所召开支持中央企业发行科技创新及绿色债券高质量发展座谈会
1月10日,上交所在北京举办支持中央企业发行科技创新及绿色债券座谈会。会议旨在深入贯彻中央金融工作会议精神,充分发挥中央企业在科技创新、绿色低碳领域的示范引领作用,做好科技金融、绿色金融等五篇大文章。
OPPO与支付宝成立联合创新实验室
1月11日,OPPO与支付宝成立联合创新实验室,双方将围绕泛在服务、安全能力、AIGC联合产品化和基础体验优化等四个模块展开合作,为用户打造安全可靠的产品和服务。
持续推进海外本土化战略 TCL携多款产品亮相CES 2024
当地时间1月9日,2024年国际消费类电子产品展览会(CES2024)在美国拉斯维加斯拉开帷幕,TCL两大主体TCL实业与TCL科技共同参展。
免责声明本文来自第三方投稿,投稿人在金投网发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,不保证该信息的准确性、真实性、完整性、有效性、及时性、原创性等,版权归属于原作者,如无意侵犯媒体或个人知识产权,请来电或致函告之,本站将在第一时间处理。金投网发布此文目的在于促进信息交流,不存在盈利性目的,此文观点与本站立场无关,不承担任何责任。未经证实的信息仅供参考,不做任何投资和交易根据,据此操作风险自担。侵权及不实信息举报邮箱至:tousu@cngold.org。

热点频道NEWS.CNGOLD.ORG