问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

马斯克xAI公布大模型详细进展,Grok只训练了2个月

发布网友 发布时间:2024-10-09 17:15

我来回答

1个回答

热心网友 时间:2024-10-09 17:59

近几日,马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok 。此产品不仅具备幽默和嘲讽技能,还以其独特的回答方式和实时了解世界的能力吸引了不少关注。在回答危险问题时,Grok 会给出玩笑似的答案,提醒用户这是违法的。而在检索特定信息时,它则以一种嘲讽的语气给出答案,展现出其独特的风格。

在博客中, xAI 介绍了他们打造 Grok 的愿景:希望创造一些 AI 工具,帮助人类寻求理解和知识。他们希望 AI 工具能够回答几乎任何问题,甚至可以建议用户提问。Grok 的对话能力当前是由一个名叫 Grok-1 的大模型来支撑的,这是他们在过去四个月的时间里开发出来的。Grok-1 经历了多次迭代,并在标准 LM 测试基准上接近 LLaMA 2 (70B) 的能力,只使用了一半的训练资源。

在公布了 xAI 创立的消息之后,他们训练了一个 330 亿参数的 LLM 原型 ——Grok-0。这个早期模型在标准 LM 测试基准上接近 LLaMA 2 (70B) 的能力,但只使用了一半的训练资源。在过去的两个月里,他们对模型的推理和编码能力进行了重大改进,最终开发出了 Grok-1,这是一款功能更为强大的 SOTA 语言模型。

Grok-1 在这些基准测试中显示出了强劲的性能,超过了其计算类中的所有其他模型,包括 ChatGPT-3.5 和 Inflection-1。只有像 GPT-4 这样使用大量训练数据和计算资源训练的模型才能超越它。xAI 表示,这展示了他们在高效训练 LLM 方面取得的快速进展。

xAI 也表示,由于这些基准可以在网上找到,他们不能排除模型无意中在这些数据上进行了训练。因此,他们在收集完数据集之后,根据五月底(数据截止日期之后)公布的 2023 年匈牙利全国高中数学期末考试题,对他们的模型(以及 Claude-2 和 GPT-4 模型)进行了人工评分。结果,Grok 以 C 级(59%)通过考试,Claude-2 也取得了类似的成绩(55%),而 GPT-4 则以 68% 的成绩获得了 B 级。

为了克服这些挑战,xAI 采用了一组自定义分布式系统,以确保系统在每次故障发生时能够立即识别并自动处理。xAI 将高效计算作为重点,在过去几个月里,其基础设施能够最大程度地减少停机时间并保持较高的 MFU(Model Flop Utilization),即使存在不可靠的硬件也是如此。

目前,xAI 正在为 Grok-1 模型功能的下一次飞跃做准备,而这需要协调数万个加速器运行,并在 Grok 中构建新的功能和工具。在深入推理能力、多模态能力、对抗稳健性等方面,xAI 也在不断研究和改进。

xAI 认为,实现可靠推理是解决当前系统局限性最重要的研究方向。通过借助一些工具进行可扩展监督、集成了安全、可靠、准确的验证方式、对长上下文的理解与检索、对抗稳健性等方面的研究,xAI 旨在让 AI 系统能够对现实世界进行深入推理。

xAI 为 Grok 配备了搜索工具和实时信息的访问权限,旨在帮助用户处理各种问题和任务。同时,他们也在关注 AI 的潜在风险,致力于开发可靠的保障措施,防止 AI 被恶意使用。xAI 相信 AI 能够为社会、经济和科学带来巨大的潜力,因此他们会坚定不移地开发可靠的保障措施,确保 AI 仍然是一股正义的力量。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
江苏海事职业技术学院提前招生专业有哪些? 江苏海事职业技术学院是985还是211 江苏海事职业技术学院是全日制吗? 江苏海事职业技术学院地址在哪里 江苏海事职业技术学院有哪些学院? 江苏海事职业技术学院在南京有几个校区,新生报道是到哪个校区 江苏海院是本科吗 江苏海事职业学院是几类大学? 江苏海事职业学院怎么样 正确使用mysqlupdate语句 爱你一生不后悔全集剧情/爱你一生不后悔下载/爱你一生不后悔大结局38... 表格字体很宽,怎么变窄? ...世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批... LLaMA 超详细解读(paper & code) ...最大的Qwen1.5-110B模型:MMLU评测接近Llama-3-70B,略超Mixtral-8×... 通义千问爆甩开源全家桶!最强720亿参数超车Llama 2,新上视觉模型看图直... 怎样快速有效识别苦丝瓜? llama370b硬件要求 如何判断苦丝瓜的新鲜度? Llama3 (8B/70B/400B) 技术细节 & 亮点分析 有哪些判断苦丝瓜品质的技巧分享? 很变态,但很强大:宇宙最强开源大模型Llama3 70B本地4GB显存随便跑!对比... 华为手机手写键盘颜色怎么改成白色? ...A.自然环境是由岩石圈、大气圈、水圈、生物圈四大圈层交叉而成的_百... ...水圈、生物圈等,这些圈层之间相互联系、相互制约,形成人类赖以生存和... ...圈和生物圈相互联系起来,并在它们之间进行能量交换的是( )A... ...大气圈、水圈和岩石圈,而且三部分是截然分开的.___.(判断对错_百度... ...岩石圈三者之间的关系是( ) A.相互交叉,无明显的分界 B.各自独立... 兑换美金需要什么手续费吗 家长对孩子使用手机的看法和态度 红魔8S Pro搭载骁龙8 Gen2+24GB内存,是否真正定义最强游戏手机?_百度... 第二套房子税费多少钱 德州设备基础灌浆料生产厂家 肋骨骨折固定带邦多紧 拼多多的百亿补贴可信吗?是谁出钱? 在那里可以有很好的,或是免费的空间和域名 光遇雨林老奶奶什么时候做饭-光遇雨林老奶奶做饭时间介绍 中国哲学史史料学任务与方法 光遇老奶奶吃饭时间最新一览-光遇老奶奶吃饭时间是什么时候 灌浆料如何拌 ...句好段、读后的心灵感悟和最喜欢的关于读书的名人名言! 寿险保费排名第一的是哪家? 求推荐一部,能打电话发短信,看电子书发微信,电量超持久的手机。就是... ...就是感觉全身的血液都往头上流。想骂人,但是说不出来话,想去打... 游戏人生有什么用处? 游戏人生是什么?干什么用的?怎样开通? QQ游戏人生有什么作用,怎么加成长值 开通游戏人生有什么用啊? ...想要一个好听的英文名,希望各位帮帮忙,,而且也简单一点 李商隐和张秀才落花有感原文及赏析