ChatGPT点燃了大语言模型,迅速燎原全世界。目前看来,ChatGPT的表现已表明AI逐渐替代基础型知识劳动者已经到来。那么,翻译这类以语言知识为核心的行业还会存在吗?
在4月15日举行的2023中国软件创新发展大会上,作为一名在语言科技领域深耕超过20年的老兵,传神语联创始人兼董事长何恩培受邀发表主题演讲,他表示: “ChatGPT对翻译行业确实有巨大的震撼,但不必恐惧,如果说语言是思想的边界,那么翻译还将是人类主导”。
何恩培指出:“语言服务产业可以划分为‘大语言服务产业’和‘小语言服务产业’,所谓的大语言服务产业就是基于NLP技术形成的人工智能新兴产业,小语言服务产业则是包括翻译在内的新兴跨语言服务产业,AI事实上打开了更大的跨语言服务市场”。
以前没有机器翻译,绝大部分人看母语以外的世界是“一片茫然”,有了机器翻译人们能够看到全部世界,虽然“模模糊糊”但已然能满足很多人的需求,并且催生了更多用户的“精准翻译”需求。无所不在的主动需求让机器翻译和精准翻译市场都在进一步扩大。
同时科技的进步,使得信息呈现方式从简单的文字变成声音、视频、游戏、动漫、元宇宙等更丰富多彩的形式,这些也必然要求翻译服务能够满足新的市场需求。
国内外这几年的数据已经证明这一点,中国翻译协会,发布的报告中显示:2022年全球语言服务产值,突破500亿美元,中国语言服务市场也闯过650亿人民币大关。
“之所以传统翻译公司感觉到冲击,是因为很多客户需求被新的方式或者渠道满足,整个行业进入了‘新翻译时代’”何恩培强调,“不能适应新翻译时代节奏的企业和个人,在新生态中将难以生存”。
深刻的产业之变早已开始,何恩培从传神语联的发展经验,总结出新翻译时代的两个变化、一个危机。
变化一:“译员”向“翻译工程师”进化
“这么简单的句子能不能机器帮我翻译?”
“我翻译过的句子,能不能不再重复翻译?”
“类似的句子,能不能让机器学会翻译?”
……
AI其实正是做到了这些译员期待的事情,那么为什么还要对AI担心和恐慌呢?
AI在通用智力上必将超越人脑,如果译员只把基础语言转化能力当作自己吃饭的本事,那么就是在跟机器抢活儿,自然只有恐慌。
另一方面我们应该看到,翻译本质上不仅是两种文化的跨越,也是语言和专业知识、专业场景的结合,这是人的优势。
译员需要换个角度看:既然AI在通用智能上已经超越自己,何不把AI变成自己的“Copilot”呢?把自己从一个码字的“译员”,变成“翻译工程师”不是很好嘛。
这需要传统的译员迅速转化自己的角色、提升自己的能力。作为一个“翻译工程师”,首先要利用各种工具学习和丰富自己的跨文化能力、专业场景的专业能力,还要迅速将自己的码字能力孪生成自己的“Copolit”——数字“孪生译员”,快速学会使用Prompt描述去驾驭智能化工具等。
这些综合能力就不是简单AI可以替代的了,而是让AI成为人类的工具,从日产几千字的传统译员模式里跳脱出来,成为“驾驭”日产几万乃至几十万字的“翻译工程师”。
变化二:翻译公司数字化的半程风景
即便到今天,科技如此发达,语言服务行业的数字化程度并不高,翻译的作业模式基本没有改变,依然是“专家看稿-拆稿-找译员-回稿-合稿-审校-质检”, 虽然一部分变成了“机器翻译-找译员PE-回稿-合稿-审校-质检”,但速度和成本改善的幅度有限,并不能改善语言服务行业规模不经济的窘境。
另一方面,整个行业长期处于信息孤岛状态,术语语料也缺乏统一的标准和复用机制,整个行业仍然处于低水平重复劳动,是很大的智力浪费。
数字时代,如何破局已经不再是某个公司所面临的问题,是每一家翻译公司都会面临的挑战。翻译公司内部作业流和信息流都需要数字化升级,将其公司特有的能力数字孪生化,重塑整个翻译流程,大规模提升精细化处理能力,才能接轨AI。
同时整个行业组织间的形态也将产生变化,构建起相互链接、相互协同的新生态,翻译公司脱离数据孤岛共享知识,避免低水平的重复建设。链接数据不但是翻译行业数字化的必然,同时也是新思维模式和价值模式的体现。“如果建立基于区块链的机制,把翻译行业孤岛上的数据资产确权、链接聚合,不但会得到更高质量的数据,提升行业效率,未来数据的贡献者还可以和AI分享收益”,何恩培认为GPT时代,垂直行业场景化的数据将是未来最宝贵的财富。
“传神语联研制的‘孪生译员’和基于区块链的语联网正在为新翻译时代的译员和翻译公司赋能”,何恩培说。
语言专家现危机
由于人工智能的迭代和社会舆论的暴力轰炸,导致学语言专业的人越来越少了,面对这种现象,何恩培曾多次在公众场合发出呼吁:“语言是民族的大脑操作系统,蕴含着这个民族的世界观、价值观,应避免唯技术论的偏激舆论影响语言人才培养,需将语言专家放到科学家高度予以重视”。
AI的“偏见”已是公认的共识,何恩培指出:“不是人工智能故意要‘偏见’,是训练它、养大它的那些数据带有区域和民族特色而导致的‘偏见’”。
这些“偏见”不仅跟训练数据的量有关,还和训练数据的质有关。用于训练的语言数据主要靠语言专家来把关,因此语言专家维护着整个民族语言的本真,确保一个民族的语言在合理范围内进化,而不是被肆意地稀释和污染。
守护民族语言,也是维护民族文化不被人工智能异化,否则我们就可能失去了文化的传承载体——语言。从这个角度来说,“语言专家”和“科学家”一样重要,他们是民族语言的灵魂,是正宗中华文化对外传播的根本保障。
面对ChatGPT热浪,跟紧机会毫无疑问是正确的,而协同发力,坚定完成语言科技向行业数字化的长跑,并助推中华文化国际传播力提升,更是中国语言服务的正道。
未来,我们也可以期待中国语言服务行业在AI技术之上,有更多面向整个行业生态的能力升级,积极去拥抱语言服务行业智能化的万物生长,去推动AI核心技术的创新落地,去更广阔的世界舞台讲好中国的故事。