元象开源最强百亿参数多语言大模型超越Llama2和百川
8月7日,深圳 - 为推动国产大模型开源生态与产业应用的繁荣发展,元象 XVERSE 公司宣布开源其百亿参数的高性能通用大模型 XVERSE-13B,可免费商用。
XVERSE-13B是目前同尺寸中效果最好的多语言大模型,在多项权威的标准中文和英文测评中,性能超越了Llama-2-13B、Baichuan-13B 等国内外开源大模型代表(见图一)。它具备了高性能、全开源、可商用等诸多优势,能大大降低高校和企业部署使用大模型的成本,不仅实现了国产可替代,也是中文应用更好的选择。
XVERSE-13B 大模型基于标准 Transformer 结构,在1.4万亿高质量、多样化 tokens 的训练数据上,从零训练(train from scatch)了130亿参数大模型,支持40多种语言,上下文窗口大小为8192 。元象近期还将发布大模型 Chat 版,开箱即用,持续优化开发者体验。
图一:经过多项权威测评,XVERSE-13B 是目前同尺寸中效果最好的多语言大模型
XVERSE-13B 是一个通用大模型,基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答、多语言翻译、个性化交互、人物角色扮演、专业小助手等多方面,能为用户带来巨大价值。
XVERSE-13B 有望在医疗、教育、文旅、金融和娱乐等多个行业具有广阔应用前景,也将为元象自身的元宇宙应用提供强大技术支持。
元象 XVERSE 公司于2021年初在深圳成立,是国内领先的 AI 与元宇宙技术服务公司,2022年3月完成了 A 与 A+ 轮融资1.2亿美元。元象在3D 与 AI 技术领域已经自主自主研发出了行业领先的“端云协同” 3D 互动技术,服务与腾讯音乐、央视、澳门大三巴等行业龙头客户。
训练语料对大模型效果至关重要。XVERSE-13B 构建了一个高达1.4万亿高质量、多样化 tokens 的训练数据集,同时优化采样策略和数据组织方式,让模型支持中、英、俄、西等40多种语言,并且多语言任务处理的性能与效果俱佳。
XVERSE-13B支持8192的上下文窗口,是同尺寸模型中最长的,从而能出色应对复杂场景,比如更长的多轮对话、知识问答与摘要等,应用范围更广泛。
模型使用标准 Transformer 网络结构,从零开始训练,还自主研发多项关键技术,包括高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台和框架协同等,让训练效率更高,模型稳定性强,在千卡集群上的峰值算力利用率可达到58.5%,位居业界前列。
图二:在多个权威中文测评中,XVERSE-13B表现超越了同参数规模的主流模型
在中文 C-Eval的测评中(图三),XVERSE-13B 综合评分达到了54.7分,超越了同参数规模的主流模型。
C-EVAL测评基准由上海交通大学、清华大学以及爱丁堡大学联合创建,是面向中文语言模型的综合考试测试集,覆盖了52个来自不同行业领域的学科。
AGIEval 测评基准由微软研究院发起,旨在全面评估基础模型在人类认知和问题解决相关任务上的能力,包含了中国的高考、司法考试,以及美国的 SAT、LSAT、GRE 和 GMAT 等20个公开且严谨的官方入学和职业资格考试。
GAOKAO-Bench 测评基准是复旦大学研究团队创建的测评框架,以中国高考题目作为数据集,用于测评大模型在中文语言理解和逻辑推理能力方面的表现。
XVERSE-13B 英文表现同样出色,在英文最权威评测 MMLU 中,其综合评分高达55.1分,几乎在所有维度超越了同参数规模的主流模型(图四),包括Llama-2-13B、Baichuan-13B等。
MMLU 由加州大学伯克利分校等知名高校共同打造,集合了科学、工程、数学、人文、社会科学等领域的57个科目,主要目标是对模型的英文跨学科专业能力进行深入测评。其内容广泛,从初级水平一直涵盖到高级专业水平。
需要强调的是,测评只反映了大模型底座的核心能力,元象将持续迭代优化,全面提升模型能力。
秉持开源精神,XVERSE-13B 代码采用 Apache-2.0协议,向学术研究完全开源,企业只需简单登记,即可免费商用。
哈尔滨工业大学(下称“哈工大”)作为我国最早从事自然语言处理研究的顶级科研团队,已经率先使用 XVERSE-13B 大模型推进相关研究工作。哈工大计算机科学与技术学院张伟男教授表示,“开源是互联网时代主流模式,不仅能贡献社区,推动技术持续创新,还能利用协同解决算法透明性、稳定性、公众信任度等共性问题。”
元象XVERSE创始人姚星表示:“线D),与真实世界的认知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持续探索3D 与 AI 前沿技术的动力。XVERSE-13B 是我们在国产技术自立自强上迈出的一小步,而开源开放将激发大模型生态活力,让 AI 的未来发展迈出一大步,为实体经济、数字经济的发展注入强劲动力。我们期待与众多企业与开发者携手,开创大模型商用新纪元!”
上一篇:汝南县司法局开展《中华人民共和国人民陪审员法》暨2023年度陪审员选任法治宣传活动
栏 目:司法考试
本文标题:元象开源最强百亿参数多语言大模型超越Llama2和百川
本文地址:https://zsb010.com/sfks/155455.html
您可能感兴趣的文章
- 08-12国家公务员考试网_2023年国考招考公告考试大纲
- 08-122022年北京研究生考试报名考生须知
- 08-122021年法考考试时间-法考客观题考试
- 08-12在职硕士怎么考?看完以后你就明白了!
- 08-12国家公务员考试成绩查询入口官网_国家公务员考录专题网站
- 08-122022全国硕士研究生招生考试报名入口-中国研究生招生信息网
- 08-122021年国家统一法律职业资格考试时间正式通知
- 08-12国家公务员考试网官网-国家公务员官网
- 08-12研招网报名入口(中国教育考研官网入口)
- 08-12四川灾区司法考试现场报名考试延至11月举行
阅读排行
推荐教程
- 05-032023年法考主观真题答案解析已出法考生们快冲!
- 03-062007年国家司法考试(试卷一)
- 04-13司法考试和一级建造师哪个难考?
- 06-12最新!会计师事务所综合排名100强公布!前10排名变了!
- 03-06从“律考”“司考”到“法 通过率15%左右的”天下第一16日开考
- 06-232022年法考客观题真题(回忆版)已整理看看你做对了吗?明天考的同学也要看噢!
- 05-272023年司法考试报名及考试时间安排
- 03-06司考必背 民法必背考点(第三篇)
- 03-06国家司法考试模拟试题卷一及答案
- 03-06【最新】2021年国家法律资格考试大纲-司法考试大纲下载法律资格解读-国家网-{}_中大网