当前位置: 首页 >> 典型案例 >> 正文

声像鉴定:声音去噪及强化处理还原遗产录音纠纷

发布者: [发表时间]:2019-05-29 [来源]: [浏览次数]:

声像资料鉴定,包括对录音带、录像带、磁盘、光盘、图片等载体上记录的声音、图像信息的真实性、完整性及其所反映的情况过程进行的鉴定和对记录的声音、图像中的语言、人体、物体作出种类或者同一认定。

“声像资料鉴定”,是指运用物理学和计算机学的原理和技术,对录音带、录像带、磁盘、光盘、图片等载体上记录的声音、图像信息的真实性、完整性及其所反映的情况过程进行鉴定;并对记录的声音、图像中的语言、人体、物体作出种类或同一认定。

案例:


一.基本情况

委托方:XXX

委托事项:

1. 对检材录音进行清晰化处理,并将对话内容整理为文字稿。

2.对检材录音00:00:26-00:00:27、00:00:46-00:00:47、00:01:24-00:01:25、00:01:53-00:01:54(均为2s)片段中男声的清晰化处理结果制作宽带语图。

受理日期:XXXX年XX月XX日

鉴定材料:

检材:送检光盘一张,包含文件名为“.WAV”的音频文件,

二. 基本案情

在一起遗产继承纠纷中,原告赵玉宝提交了一段与被告赵能嘉之间的电话对话录音,被告称录音内容无法听清,不予认可。现法院委托鉴定机构进行录音处理及分析。

三.资料摘要

送检光盘一张,包含文件名为“.WAV”的音频文件。

四.鉴定过程

鉴定日期: XXXX年XX月XX日-XXXX年07月05日初始鉴定,XXXX年XX月XX日-XXXX年XX月XX日分析评议与复核。

鉴定地点:XXXX司法鉴定中心声像鉴定室

鉴定人员:XXX、XXX

检验方法:采用听觉检验、相关的音频播放和格式转换软件、专业语音信号处理软件,分析比对等具体方法进行检验。

检验、比对与分析:

鉴定人员根据XXX《司法鉴定委托书》(XXXX年XX月XX日),依据司法部《声像资料鉴定通用规范》(SF/Z JD0300001-2010)、《录音资料处理技术规范》(SF/Z JD0301003-2015)对送检的检材进行检验。

(一)录音处理及分析的检验过程

1. 检材的处理

将检材拷贝到智能语音工作站。语音长度2分50秒,语音内容为一位男性语音和一位女性语音的对话。其中部分语音段落存在背景噪声较强,影响听辨的情况;部分语音段落中语音存在语音音强过小无法听辨清楚的情况。

针对存在噪音的情况,利用智能语音工作站进行了降噪处理;针对语音音强过小无法听辨清楚,利用智能语音工作站进行了语音增强处理。

将送检光盘(图1)通过只读接口读取光盘内容,音频文件(检材.WAV)一个,其中“检材.WAV”在光盘中的存储位置如图2所示,音频文件属性如图3所示。

将送检光盘进行物理复制,形成光盘副本,并将光盘内“检材.WAV”(以下简称检材)拷贝到智能语音工作站,并设为只读属性。送检光盘、光盘副本与工作站中相应音频文件的MD5相同,说明复制正确。除非特殊说明,

以下都是对取证机上的检材和样本进行检验。

检材时长为2分钟50秒,波形图、窄带图、宽带图如图4所示,为两位说话人的对话录音,检材音频文件格式:768 Kbps、48 KHz、单声道、WAV格式,文件大小为15.5 MB,MD5码为:3CC76C278EAE266F720680D9CBD18B1D。

通过听辨,其中部分语音段落存在背景噪声较强,影响听辨的情况;部分语音段落中语音存在语音音强过小无法听辨清楚的情况。

2.分析噪音分布情况

用智能语音工作站打开检材,通过辨听和谱图观察,噪音分布情况如下:

(1)检材在0至1分05秒的时间区间内,基本无背景噪声,仅有设备的本底噪音,噪音强度基本低于9db,如图5所示。

(2) 检材在1分05秒至1分23秒出现背景白噪声,噪声强度11db左右,如图6所示。

(3) 检材在1分23秒至1分25.5秒背景白噪声增强至20db左右,如图7所示。

(4)检材在1分35秒至1分38秒中出现数次突发噪声,频率集中在低于500HZ的低音区域,如图8所示。

(5)检材在1分40秒至2分20秒出现背景白噪声,噪声强度在27db左右,如图9所示。

(6) 检材在2分20秒至2分50秒的时间区间内,基本无背景噪声,仅有设备的本底噪音,噪音强度基本低于9db,如图10所示。

3.分析语音情况

(1)检材在0至30秒的时间区间内,男性语音和女性语音的音强基本位于20db至40db之间,听觉上语音内容清晰可辨认,如图11所示。

(2) 检材在30秒至1分52秒的时间区间内,女性语音的音强基本不变,男性语音的音强骤然降低至30db以下,听觉上男性语音的大部分内容已无法分辨,如图12所示。

(3) 检材在2分21秒至2分30秒的女性语音有轻微回声,但不影响听辨,如图13所示。

(4) 检材在1分52秒至2分50秒的时间区间内,男性语音和女性语音的音强基本位于30db至50db之间,听觉上语音内容基本清晰可辨认,如图14所示。

(二) 降噪处理及语言增强

1.降噪处理

(1) 检材在0至1分05秒和2分20秒至2分50秒的时间区间内仅有设备本底噪音。首先选择无语段对本底噪音进行估计,然后利用自适应降噪对该时间区间降除噪音。去噪后噪音强度基本为0,如图15所示。

(2) 检材在1分05秒至2分20秒的时间区间内出现强度不等的背景白噪声,根据各个阶段的白噪声强度,选择相应自适应降噪强度对该时间区间降除噪音。去噪后噪音强度接近0,如图16所示。

(3) 对于部分突发性噪音,利用频域编辑,手工选定需要降除的噪音,一次降低4dB,经多次降噪,直至听觉上噪音明显减弱,语图上噪音图谱明显变淡,谈话内容清晰,如图17所示。

2. 语音增强

(1)在检材的0至30秒的时间区间内,进行语音增强处理,参数设置为FFT点数1024,Hann窗,窗长1024点,帧移256点,增益强度12db,处理后语音的音强基本位于40db至60db之间,听觉上语音内容清晰可辨认,如图18所示。

(2)检材的30秒至1分52秒的时间区间内,由于男性语音的音强较低,进行语音增强处理,参数设置为FFT点数1024,Hann窗,窗长1024点,帧移256点,根据语音强度大小,调整增益强度在20-39db。处理后语音的音强基本位于40db

至70db之间,听觉上语音内容清晰可辨认,如图19所示。

(3)检材的1分52秒至2分50秒的时间区间内,进行语音增强处理,参数设置为FFT点数1024,Hann窗,窗长1024点,帧移256点,增益强度12db,处理后语音的音强基本位于40db至60db之间,听觉上语音内容清晰可辨认,如图20所示。

(4)对检材录音00:00:26-00:00:27、00:00:46-00:00:47、00:01:24-00:01:25、00:01:53-00:01:54片段中男声的清晰化处理结果制作宽带语图,其结果如图21-24所示。

经过智能语音工作站对录音进行处理,听辨效果得到明显改善,降噪处理后的录音文件另存为文件名为“检材-副本.wav”的音频文件,并整理成文字稿,如附件2所示。

五.鉴定意见

1. 经过智能语音工作站对录音进行降噪及语音增强处理后,听辨效果得到明显改善,语音基本清晰可听辨,对话内容整理的文字稿见《附件2对话内容整理稿》。

2.对检材录音00:00:26-00:00:27、00:00:46-00:00:47、00:01:24-00:01:25、00:01:53-00:01:54片段中男声声音进行清晰化处理,处理后宽带语图见《附件1检验图》中图21-24。

鉴定人:XXX

《司法鉴定人执业证》证号:XXX XXX

鉴定人:XXX

《司法鉴定人执业证》证号:XXX XXX

咨询电话: 0731-88822311/88821574