文心大模型4.0昨日在百度世界2023上正式发布,百度首席技术官王海峰对文心大模型4.0背后的关键技术和,进展进行了解读。他表示,文心大模型4.0的理解、生成、逻辑、记忆四大能力都有显著提升,9月已开始小流量上线,过去一个多月效果又提升了近30%。8月31日文心一言面向全社会开放至今,用户规模已经达到4500万,,5.4万,场景4300个,应用825个,插件超过500个。
今年3月16日,百度发布知识增强大语言模型文心一言。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。
王海峰表示,相比3.5版本,文心大模型4.0的理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。
此外,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,,把这些找到的知识组装进Prompt送入大模型,准确率好,效率也高;另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有差错的点进行修正。
王海峰表示,在强大的基础大模型的基础上,百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,自主完成复杂任务,在环境中持续学习实现自主进化。
目前,文心一言也已应用在了更实用的地方。中国国家图书馆拥有全球,的古代方志,百度与其展开战略合作,利用文心大模型学习古代方志与家谱数据,帮助全球华人获取更多寻根线索。此外,中国国家跳水队与百度从2019年就开展了深入的技术合作,基于文心一言等百度大模型技术,中国国家跳水队AI辅助训练系统全面升级,对动作实时打分、精准量化分析,提供最有价值的指导信息,助力中国国家跳水队高效训练。
在人工智能人才培养方面,王海峰公布,百度在2020年提出5年为全社会培养500万AI人才,截至目前,百度已经培养了420万AI人才。
17日,王海峰发布了百度人才培养星河计划,“我们将与产学研各界密切合作,深化产教融合,为社会再培养500万大模型人才,让人工智能科技的‘创新之花’,结出更多‘产业之果’,服务国家战略,服务社会发展,服务人民福祉。”