当前位置: 首页 >  行业资讯  >  正文

AI再突破:Google的新神经网络模型智能超越人类? 天天速看料
2023-06-06 14:11:56 来源:都话好话唔好听

#gpt#​ #ai#​#谷歌#


AI的进步在近年来持续引领技术前沿。Google最近推出的大型语言模型PaLM,以其强大的功能和显著的优势再次引发了行业的广泛关注。然而,与这种进步同时出现的是一些新的挑战和问题。接下来,我们将深入探讨PaLM以及其他热门AI模型,例如OpenAI的GPT-3,了解它们的优势、劣势和潜在影响。


(相关资料图)

AI的新里程碑:PaLM

PaLM是Google最近发布的一种大规模语言模型,拥有5400亿的参数。它使用Google的Pathways软件基础设施进行构建,并在多个TPU v4 Pods上进行训练。

尽管PaLM只是在预测下一个词标记的目标上进行训练,但通过使用大量的多语言数据和源代码,该模型已经证明了其在提升各种自然语言、翻译和编码任务的最新水平上的能力。

PaLM的优势

1. 业务效能提升:使用大型语言模型(LLMs)训练的源代码可以协助内部开发者,从而提高开发者的生产力。例如,在一项针对10000名Google软件开发者的研究中,他们发现2.6%的所有代码来自由模型生成的建议,这为这些开发者减少了6的代码迭代时间。

2. 多步骤推理:PaLM可以进行多步骤的推理,学习将复杂问题分解成更小的任务,并结合这些解决方案来解决更大的问题。这种方法使得语言模型能够遵循逻辑的思维链,并生成更有结构、有组织和准确的回应。

3. 领域特定微调:通过对PaLM语言模型进行微调,以及使用Chain of Thought提示和自我一致性解码,Minerva项目能够在广泛的科学和数学基准套件中,对数学推理和科学问题的解决方法做出重大改进。

4. 专业领域应用:在“Large Language Models Encode Clinical Knowledge”中,我们展示了学习提示调整可以用相对较少的例子将通用语言模型适应到医疗领域,而且这个模型可以在US Medical License Exam questions (MedQA)上达到67.6%的准确率。

我已经介绍了Google的PaLM模型的优势,包括它在多步推理、特定领域微调,以及业务效能提升上的显著表现。然而,我在寻找关于PaLM模型具体劣势的信息时,未能找到足够的公开信息。这可能是因为PaLM模型是相对较新的技术,目前关于其潜在问题或局限性的研究可能还不够充分。

另一方面,我们也关注了OpenAI的GPT-3模型。这是一个自回归语言模型,拥有1750亿个参数,是之前任何非稀疏语言模型的10倍。GPT-3在很多NLP任务上表现出色,包括翻译、问答、填空任务,以及一些需要即时推理或领域适应的任务,如单词解构、在句子中使用新词,或进行3位数的算术运算。

然而,GPT-3也存在一些局限性。首先,尽管GPT-3在许多任务中表现出色,但在某些数据集上,它的少样本学习仍然存在问题。其次,由于GPT-3在大型网络语料库上进行训练,它可能面临一些与训练相关的方法论问题。最后,GPT-3具有生成新闻样本的能力,人类评估者很难区分这些样本和人类撰写的文章之间的区别,这也引发了关于GPT-3可能对社会产生的广泛影响的讨论。大家有什么看法,请畅所欲言

相关新闻: