科大讯飞多语种智能语音技术，让听障群体“看见”声音

时间：2024-05-10 09:18:46 来源：北京商报网浏览次数：我来说两句() 字号：TT

　　今年5月19日是第三十四次全国助残日，此次助残日活动主题为“科技助残，共享美好生活”。在日新月异的信息时代，如何让残疾人共享科技红利、平等地参与社会生活，成为当前人们关注的热点。

　　5月8日，今年也是“听见AI的声音”关爱听障人士公益行动的第五个年头。在承诺终身免费提供相关服务的基础上，“科技助残”也在持续升级，如讯飞听见App新增快捷卡片启动、听障模式文本对话等功能等，通过多语种智能语音技术，让更多听障人士“看见”声音，共享美好生活，实现自身价值。

　　“听见AI的声音”累计提供超1亿分钟免费服务

　　最近几年，律师谭婷一直走在为听障人士普法、为健听人科普听障世界的路上。

　　2020年，谭婷成为我国第一位通过法律职业资格考试的听障人士后，越来多听障人士来到律所找她咨询。而更多的法律咨询工作则发生在线上，最多时她，接了14位聋人的微信视频咨询。

　　“我想用一双会说话的手，把正义的声音带到每个无声的角落。”从以前准备法考到如今工作中各种线上线下交流，讯飞听见App成为谭婷的“助手”。

　　世界卫生组织（WHO）提出，全球听力残疾人在2018年已达4.66亿，预计2050年将达9亿，其中93%为成年人，7%为儿童。

　　这是一个庞大的“沉默”群体。

　　自2019年起，科大讯飞联合中国聋协、中国残疾人艺术团发起“听见AI的声音”关爱听障人士公益行动。以多语种智能语音技术为支撑，围绕讯飞听见系列、讯飞智能助听器等软硬件产品，为听力障碍人士提供免费的实时语音转文字服务、捐赠产品或者免费时长。产品形式多元化，覆盖听障群体的日常生活、工作、学习等场景，构建了完整的公益生态场景。

　　其中，讯飞听见App和智能助听器应用到听障和视障人士日常交流中，“让盲人听得见文字，让聋人看得见声音”；讯飞输入法无障碍模式为视障人群铺设了通向互联网世界的“盲道”等；讯飞开放平台也在创建无障碍环境，截至2023年年底，累计创建了近3万个无障碍应用，累计服务1269万视听障人群；“听见AI的声音”关爱行动累计为听障人士提供超1亿分钟的免费转写服务，并承诺终身免费提供相关服务。

　　多语种智能语音，助力视听障公益

　　近几年，科大讯飞在多语种智能语音语言技术系统性创新中不断取得突破，有力支撑了讯飞翻译机、讯飞智能录音笔、讯飞听见等智能软硬件产品不断创新。这些AI产品也一直在助力国际沟通和无障碍交流。

　　使用软硬件结合的多语种技术解决方案，科大讯飞先后服务2022北京，与冬残奥会、2022年成都世界乒乓球团体锦标赛、第31届世界大学生夏季运动会、2023年布达佩斯世界田径锦标赛等国际赛事，累计为超202个国家，近4万名参赛人员提供翻译服务。

　　特别值得一提的是，在2023布达佩斯世界田径锦标赛赛事期间，科大讯飞联合组委会响应可持续发展战略，与匈牙利聋哑协会Sinosz联合发起了“Smile for a Sustainable World”活动，用AI语音翻译技术为听障者和视障者提供无障碍沟通工具，让世界“听见AI的声音”。

　　科技助残背后，25年智能语音研发之路

　　科大讯飞1999年成立，立志要“将中文语音技术掌握在中国人自己手里，中文语音产业要由中国人做到，”，从2006年开始就屡次在世界大赛中夺冠，近五年就累计获得20余项世界，。深耕智能语音技术25年，科大讯飞不仅将中文语音技术做到了，，也将多语种语音技术做到了，。2020年，科大讯飞60个语种的语音识别、翻译和37个语种的语音合成超过谷歌、微软，达到国际领先水平；2021年，科大讯飞在美国国家标准与技术研究院NIST发起的国际低资源多语种语音识别竞赛OpenASR中，获得全部受限赛道的15个语种，及7个语种非受限赛道，；2024年，讯飞星火语音大模型的首批37个主流语种的语音识别效果超过OpenAI，语音大模型Whisper V3。

　　星火语音大模型首批覆盖语种中，24个主要语种识别率达到了90%（已超过实用门槛）；13个，语种识别率更是超过了94%。在多语种语音合成能力方面，27个主要语种MOS（Mean Opinion Score）评分达到了4.4（普通人口语水平为4），13个，语种MOS评分高达4.6（地方播音员水平）。

　　就在今年4月26日，讯飞星火大模型V3.5春季上新。面向用户高效准确知识获取的痛点，科大讯飞发布业界，长文本、长图文、长语音大模型，不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习，还能够在各种行业场景给出专业、准确回答。在AI语音交互方面，科大讯飞发布了多情感超拟人合成，进一步提升了情绪表达的可感知度，对高兴、抱歉、安慰、撒娇、困惑等情绪表达的可感知度达到85%以上，AI语音更加生动、真实。除了超拟人对话，科大讯飞还推出“一句话声音复刻”功能，一句话就可以定制你的AI助手声音。

　　随着技术的进步，人工智能在科技助残方面正在发挥越来越大的作用。大模型技术的语言理解能力、内容生成能力、对话等能力持续升级，在残障人士信息获取、陪伴、安全守护等方面有广阔的应用前景，未来以人形机器人为代表的智能硬件在赋能残疾人方面也将大有作为。

免责声明：本网站所刊登、转载的各种稿件、图片均有可靠的来源，市场有风险，选择需谨慎！此文仅供参考，不作买卖依据，并不代表新讯网观点，由此产生的财务损失，本站不承担任何经济和法律责任，本站自动屏蔽违反《广告法》词语。

科大讯飞多语种智能语音技术，让听障群体“看见”声音

请选择您浏览此资讯时的心情

更多图片请查阅高清图集图片推荐