海信视像申请远场语音数据扩充方法专利,可显著提升远场样本数据的扩充速度

金融界2024年4月2日消息,据国家知识产权局公告,海信视像科技股份有限公司申请一项名为“远场语音数据扩充方法、服务器和电子设备“,公开号CN117809628A,申请日期为2023年10月。

专利摘要显示,本申请实施例公开一种远场语音数据扩充方法、服务器和电子设备,该方法包括:接收电子设备上传的语音数据,判别语音数据的类别;如果语音数据为远场类别,将语音数据保存至第一数据库;如果语音数据为近场类别,将语音数据保存至第二数据库;根据第一数据库筛选远场样本数据,和/或,根据第二数据库或开源语音数据集中的近场语音数据模拟远场样本数据,远场样本数据用于训练远场语音处理模型;存储远场样本数据。本申请实施例可提升远场样本数据累积和扩充的速度,规避远场样本数据与设备信道不匹配等问题,通过线上扩充数据实现对不同场景和领域的覆盖,尤其第一数据库和第二数据库的两种扩充模式共同运行时,显著提升远场样本数据的扩充速度。

本文源自金融界

发布于 2025-02-12
149
目录

    推荐阅读