783 阅读 2020-09-08 11:06:02 上传
以下文章来源于 九州语言网
“九州音集”目前已具备语音数据的录制上传、在线播放、编辑整理、删除重录、记音备注、批量下载、地图展示、语图分析、发布分享、动态令牌等一系列功能,可支持安卓和苹果等操作系统,并优化适配手机、PAD 和 PC 端,以充分发挥不同终端设备的性能和操作优势,如可利用手机或 PAD 来完成语音数据采集,利用 PC 进行语音数据编辑、下载和分析等。该系统注重数据资源平台的通用性和可扩展性,支持字、词、句、篇章等不同类型材料的语音数据采集,还具有图片上传和短视频录制等功能。目前,该系统部署在新浪云服务器上,可满足大规模语音数据库建设的基本需求。
系统为不同用户分配不同权限:
游客:无须登记用户信息,可以查阅“公共目录”下的全部内容,也可以查阅其他用户分享的目录和条目内容,还可以查阅其他用户分享的条目录音内容。但游客不能录音上传,也不能编辑目录和条目等内容。
一级用户:即发音人,需登记用户的基础信息,如年龄、性别、教育程度、民族等,此外还需要登记用户的母语信息,如母语的经纬度和地理位置、母语类型、方言类型、母语使用情况、母语使用水平等。游客在登记用户信息之后即可自动获得一级用户权限,可以针对其他用户分发的录音任务,录制并上传自己的语音数据。发音人信息主要用于语音数据筛选和语音地图展示等功能。
二级及以上权限由系统管理员进行分配。二级用户可以建立和管理自己的目录和条目。三级用户可以将自己新建的目录条目分享给其他用户,并邀请其他用户提交相应的语音材料,还可以删除、编辑和标记其他用户提交的语音材料。四级用户可以收藏其他用户发布的语音数据资源库。五级用户可以发布自己的语音数据资源库。
二级及以上用户可以设置和修改自己的动态令牌,并将其分享给其他用户,其他拿到动态令牌后,可暂时获得前者的部分用户权限,如记音和备注权限、语音条目删除权限、语音条目编辑权限、语音条目下载权限等,以便于二级及以上用户临时招募一些参与者来帮助其完成语音库的建设和管理工作。
发音人可以在“我”页面登记用户信息,用户信息一旦提交后,就不可随意修改了,除非删除用户的全部数据(包含已经录制好的语音材料)之后再次重新注册登记。



二、目录和条目的新建、修改与删除
只有二级及以上用户才可以在“我的目录”下自由新建和管理自己的目录与条目,其功能类似于电脑端的文件资源管理器,用户可以新建、修改、删除和移动自己的目录和条目,可设置和修改“目录或条目”的标题及备注说明信息,标题内容通常为录音内容。系统支持五级子目录,每个目录下可包含100个具体条目或子目录。二级用户不仅可以给自己新建的条目进行录音,还可以给自己新建的条目上传图片和短视频(时长小于1分钟)。


图5:条目示例
三、录音任务分发(求录音)
二级用户建立好自己的目录和条目之后,可以用于采集自己的语音数据,也可以在申请三级权限后,长按某个目录,然后点击弹出的“求录音”按钮并选择发送给微信好友或者微信群,请其他用户帮忙录制语音数据,并可对其他用户提交的语音数据进行管理,如删除、编辑、添加记音和备注信息等。
在分发录音任务时,系统会将用户当前的录音控制参数同步发送出去,其他用户在接受到录音任务时会自动获取并配置相应的录音参数,具体包括 4 项参数:发音类型(朗读、配例、解说、话题),单条最大发音时长,采样率,是否自动跳转至下一条。而“语言属性或类型”、“发音水平”这 2 项参数还需要发音人根据实际情况在录音时自行配置。

四、语音条目的录制、播放、删除与重录
一级用户可基于微信程序接受录音任务,针对各个条目录制 MP3 格式的音频文件并自动上传至服务器中保存起来。在录音之前,录音人需确认录音参数,包括发音类型、录音采样率、语言类型或属性、发音水平、单个条目最大录音时长等,这些参数会跟各个条目的声音文件同步保存,可用于后期的语音条目筛选。另外,系统还可为录音人提供便捷高效的录音操作,如录音数据自动上传保存、录音完成后自动跳转至下一个条目,未录制的条目自动置顶显示等。
在开始录音之前,发音人应该细致了解录音任务的具体要求,并熟悉相关的录音操作。对于录制后的条目,发音人可以点击语音条目进行播放,如果发现录音效果不好(如发音不够准确、音量太小听不清楚、背景噪音太大、首尾空白段太长等),可以长按语音条目,然后点击弹出的“删除”按钮对其删除,也可以直接重新录制,覆盖掉原有的发音。

图7:录音页面

五、语音条目的记音和备注
录音人长按自己录制好的语音条目,然后点击弹出的“记音”或“备注”按钮,可以对该语音条目进行相应操作。其他用户可以看见语音条目的记音内容,但看不见语音条目的备注内容。除了录音人自己可以进行记音和备注操作之外,条目创建者也可以对该条目所关联的全部语音数据分别进行记音和备注操作。条目创建者的记音和备注内容对于该条目的发音人而言,都是可见的。利用备注内容,可以实现条目创建者和发音人之间的简单信息沟通。图9:长按录好的语音条目进行记音或备注
六、语音地图展示与条目筛选
用户可以在目录页面上选定一个发音条目,然后切换至地图页面查看该条目相关的语音内容,还可以根据需要设定一定的条件对语音条目进行筛选,如设定发音人姓名、发音人的地理位置、语言类型或属性关键字、发音水平等筛选条件。系统可根据发音人的地理位置信息在地图上对语音条目进行展示,点击相关条目可以播放语音。
在地图页面上长按某个语音条目,可以查看语图,具有一定权限的用户(通常为发音人或条目新建者,也可以是通过动态令牌获取到他们权限的其他用户)还可以对该语音条目进行删除、记音和备注等操作。


图11:语音数据筛选
七、语音数据的分享、发布和收藏
具有一定权限的用户可以分享和发布自己建立的目录,以便于其他用户访问该目录下的全部条目数据(包含语音)。发布出来的目录对于全部用户都是可见的,分享出来的目录仅针对特定对象有效。用户可以随时撤销自己发布的数据目录。
八、语音数据分析与图谱制作
在语图展示页面上,我们基于 WASP 代码在手机等移动设备上实现了语音声学参数的基本分析功能,可呈现波形图、宽带语图、窄带语图、音高图等语音图谱,帮助研究人员随时随地了解语音的声学特性。


九、语音数据编辑与覆盖保存
在语图展示页面上,我们基于 WASP 代码在手机等移动设备上实现了语音数据的截取保存功能。用户可通过双指缩放波形图,单指左右移动波形图,把无效的语音数据排除在手机屏幕的可见范围之外,然后点击“保存”按钮,即可截取屏幕中可见的语音片段,并将其保存至“九州音集”的数据服务器中,覆盖原有的声音文件。
这一操作,主要用于剔除声音数据中的首尾空白段,仅保留其有效的声音片段,一般建议保留300毫秒的首尾空白段。
十、语音与发音文本的批量下载
在语图展示页面上,条目创建者可以下载某个条目的所有发音人的录音,也可以下载某位发音人的全部条目的录音,还可以将自己设定的动态令牌分享给其他用户,使其他用户具有相应的下载权限。保存时可以选择 MP3 格式或者 WAV 格式,还会同步下载相应的发音文本文件。
结语:让语言调查和语料采集工作变得稍微简单一些,记录母语者的发音数据,在一定程度上促进语言数据资源的共建共享,这是笔者设计开发“九州音集”小程序的初衷。这 7 个月来,笔者从学习使用微信开发者工具开始起步,累计投入了将近 300 个小时,不断摸索,不断调整,不断完善,使得这个小程序终于基本成形。虽然还有部分功能不太如意,但笔者对于这项工作的全部设想基本上都通过代码给实现了出来,所以还是要非常高兴地给自己点个赞!









