最近 AI 真是火得没边了。
OpenAI 靠着 ChatGPT 实力吸睛,Google 带着 Bard 紧随其后,就在昨天,GPT-4 模型又抢尽风头。你方唱罢我登场的 AI 领域,现在,轮到了百度了。
就在今天下午,备受期待的百度文心一言如期而至。不过在发布会一开场,百度 CEO 李彦宏先给大家打了一剂预防针:
从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入 AI 研究,2019 年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。
但也不能说我们完全 ready 了,文心一言要对标 ChatGPT、甚至是对标 GPT-4 的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。
姗姗来迟的文心一言表现如何?和 ChatGPT 的差距有多少?能满足市场对中文大语言模型的需求吗?我们对它做了一次全方位解析。
新一代大语言模型、生成式 AI 产品文心一言,能做什么?
一、多模态生成
如果说昨日 GPT-4 带着多模态出现,用一张草图生成一个网站,让众多程序员感到惊艳,那么今天的「文心一言」在覆盖多种模态方面做得更为全面,可用文字生成图片、音频(方言)、视频等多个维度。
不过目前,由于生成视频的成本比较高,百度尚未对所有用户开放,未来会逐步接入。
二、数理推算
「文心一言」还具备了一定的思维能力,能学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,「文心一言」能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
同样,现阶段「文心一言」在这方面准确率并不是 100%:“我们还需要给它更多的时间来学习和成长。”
三、文学创作
在回答事实性问题时,生成式 AI 产品时常会出错,而「文心一言」延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。不论是总结《三体》的核心内容还是续写《三体》,「文心一言」都展现了其优越的总结分析能力和内容创作生成能力。
四、中文理解
作为扎根于中国市场的大语言模型,「文心一言」具备中文领域最先进的自然语言处理能力,甚至可以理解“洛阳纸贵”并写出“藏头诗”。
「文心一言」能在中文领域领跑,相对应的,它对英文语种、代码场景的训练还不够多,这也是百度接下来加紧训练和完善的方向。
五、商业文案创作
在商业文案创作上,「文心一言」也可以帮企业起名字、写 Slogan、写新闻稿等。
AI要写好一篇稿子,除了要能准确理解用户意图,还要有清晰的表达能力——这背后有一个必要基础,那就是庞大的数据规模。「文心一言」的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,以及 5500 亿事实的知识图谱。基于此,李彦宏指出:“这让百度在中文语言的处理上,能够处于独一无二的位置。”
0条评论
点击登录参与评论